image-processing相关内容
我只是在 OpenCV 中做一个特征检测的例子.此示例如下所示.它给了我以下错误 模块'对象没有属性'drawMatches' 我检查了 OpenCV 文档,但不确定为什么会出现此错误.有谁知道为什么? 将 numpy 导入为 np导入简历2将 matplotlib.pyplot 导入为 pltimg1 = cv2.imread('box.png',0) # queryImageim
..
我正在使用大小为 3x3 的 sobel 滤波器来计算图像导数.看网上的一些文章,尺寸 5x5 和 7x7 的 sobel 过滤器的内核似乎也很常见,但我找不到它们的内核值. 有人可以告诉我尺寸为 5x5 和 7x7 的 sobel 滤波器的内核值吗?此外,如果有人可以分享一种生成内核值的方法,那将非常有用. 提前致谢. 解决方案 2018 年 4 月 23 日更新:似乎下面链
..
以下代码来自(被要求删除链接).但我想知道它究竟是如何工作的.如果这被认为是边缘检测或斑点检测,我感到很困惑,因为 维基百科将高斯拉普拉斯算子 (LoG) 列为斑点检测. 另外,有人可以解释为什么要计算绝对值以及 focus_stack() 函数中发生了什么,并提供更深入的解释吗? # 计算图像的梯度图def doLap(图像):# 你应该调整这些值以满足你的需要kernel_size =
..
语义分割只是一种 Pleonasm 还是“语义分割"和“分割"之间有区别?“场景标注"和“场景解析"有区别吗? 像素级分割和像素级分割有什么区别? (附带问题:当你有这种逐像素标注时,你是免费获得对象检测还是还有什么可做的?) 请提供您的定义的来源. 使用“语义分割"的来源 Jonathan Long、Evan Shelhamer、Trevor Darrell:用于语
..
导入torch将 torch.nn 导入为 nndevice = torch.device('cuda' if torch.cuda.is_available() else'中央处理器')类模型(nn.Module):def __init__(self):超级(模型,自我).__init__()self.layer = nn.Sequential(nn.Conv2d(1, 16, kernel_s
..
我正在尝试使用 OpenCV 2.1 将两个图像合二为一,两个图像彼此相邻放置.在 Python 中,我正在做: 将 numpy 导入为 np, cvimg1 = cv.LoadImage(fn1, 0)img2 = cv.LoadImage(fn2, 0)h1, w1 = img1.height,img1.widthh2, w2 = img2.height,img2.width# 创建一个足够
..
通过我的新任务,我正在寻找一种方法来检测图像上是否存在文本.图像是地图 - 例如可以是谷歌地图.任务是检测街道/城市标签的位置. 我知道 opencv 库有可以检测特征(例如人脸)的算法 - haar 分类器或 hog(定向梯度直方图),但我听说此类算法的学习过程相当困难. 您是否知道任何算法、方法或库可以做到这一点(检测图像上是否存在文本)? 谢谢,约翰 解决方案 视觉
..
我必须制作一个移动应用程序来计算图像中物体的真实尺寸. 我对此进行了一些研究,发现有帮助 [问题]:给定一张图片,你如何找到物体的高度? 相机的距离和现实生活中物体大小的关系其实并不复杂,传感器上物体的大小与现实生活中的物体大小的比例是一样的焦距与到物体的距离之比. 到物体的距离(mm)=焦距(mm)*物体的实际高度(mm)*图像高度(像素)---------------------
..
我正在尝试从轮廓中检测和精确定位图像中的某些对象.我得到的轮廓经常包含一些噪音(可能形成背景,我不知道).对象应类似于矩形或正方形,例如: 我通过形状匹配 (cv::matchShapes) 来检测带有这些对象的轮廓,无论有无噪声,我都得到了很好的结果,但是我在精细定位方面存在问题,以防万一噪音. 噪音看起来像: 或 例如. 我的想法是找到凸面缺陷,如果它们变得太强,则以某
..
我有数百张珠宝产品的图片.其中一些带有“畅销书"标签.标签的位置因图像而异.我想遍历所有图像,如果图像具有此标签,则将其删除.生成的图像将在移除对象的像素上渲染背景. 带有标签/贴纸/对象的图像示例: 要移除的标签/贴纸/对象: 将 numpy 导入为 np将 cv2 导入为 cvimg = plt.imread('./images/001.jpg')贴纸 = plt.imrea
..
目前,我正在做一个 OCR 项目,我需要从标签上读取文本(参见下面的示例图片).我遇到了图像倾斜问题,我需要帮助修复图像倾斜,以便文本是水平的而不是倾斜的.目前,我正在使用的过程尝试从给定范围(代码包含在下面)中对不同角度进行评分,但这种方法不一致,有时会过度校正图像歪斜或完全无法识别歪斜并纠正它.请注意,在进行歪斜校正之前,我将所有图像旋转 270 度以使文本直立,然后通过下面的代码传递图像.传
..
我的以下代码在 OpenCV 3.4.1 上运行良好,但现在不适用于 OpenCV 4.1.0 并出现错误.我不知道如何使代码适应较新的版本,你能帮我吗?非常感谢 def ImageProcessing(图像):图像 = cv2.absdiff(图像,背景)h, gray = cv2.threshold(image, 65, 255, cv2.THRESH_BINARY_INV);灰色 = cv
..
使用以下代码,我可以删除图像中的水平线.见下面的结果. 导入 cv2从 matplotlib 导入 pyplot 作为 pltimg = cv2.imread('image.png',0)拉普拉斯= cv2.拉普拉斯(img,cv2.CV_64F)sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=5)plt.subplot(2,2,1),plt.imshow
..
如果我希望最终图像更清晰,具有数字类型的外观,我应该放置什么样的滤镜序列.我的意思是只有两种不同的颜色,一种用于白板,一种用于粉笔书写. 解决方案 在识别图像中的文本时,您最好使用 笔画宽度变换. 这是我在您的图像上获得的一个小结果(基本变换 + 不带过滤的连接组件): 我的 mex 实现基于 here 中的代码 #include "mex.h"#include #
..
我需要使用 Pytesseract 从这张图片中提取文字: 和代码: from PIL import Image, ImageEnhance, ImageFilter导入 pytesseract路径 = 'pic.gif'img = Image.open(路径)img = img.convert('RGBA')pix = img.load()对于范围内的 y(img.size[1]):对于
..
我正在使用 OpenCV 为 Android 写作.我正在使用标记控制的分水岭分割类似于下面的图像,而无需用户手动标记图像.我打算使用区域最大值作为标记. minMaxLoc() 会给我这个值,但我怎样才能将它限制为我感兴趣的 blob?我可以利用 findContours() 或 cvBlob blobs 的结果来限制 ROI 并对每个 blob 应用最大值吗? 解决方案 首先:函
..
我需要一种简单快速的方法来比较两张图片的相似度.IE.如果它们包含完全相同的东西但可能有一些稍微不同的背景并且可能会移动/调整几个像素,我想获得一个高值. (更具体地说,如果重要的话:一张图片是图标,另一张图片是屏幕截图的子区域,我想知道该子区域是否正是图标.) 我手头有 OpenCV,但我还是不太习惯. 到目前为止,我想到了一种可能性:将两张图片分成 10x10 的单元格,并为
..
我正在开发 iOS 应用程序,用户可以在其中应用一组特定的照片过滤器.每个滤镜基本上都是一组带有特定参数的 Photoshop 动作.这些操作是: 级别调整 亮度/对比度 色相/饱和度 单层和多层叠加层 我在我的代码中重复了所有这些操作,使用算术表达式循环遍历图像中的所有像素.但是当我在 iPhone 4 上运行我的应用程序时,每个过滤器需要大约 3-4 秒才能应用,这对于用户来
..
我正在尝试在 GPU 上进行一些图像处理,例如中值、模糊、亮度等.一般的想法是做类似 这个框架 来自 GPU Gems 1. 我能够编写 GLSL 片段着色器来处理像素,因为我一直在效果设计器应用程序中尝试不同的东西. 但是我不确定我应该如何完成任务的另一部分.也就是说,我想以图像坐标处理图像,然后将结果输出到纹理.我知道 gl_FragCoords 变量. 据我了解,它是这样的
..
我想用其他用户选择的颜色替换图像的特定颜色.在替换图像颜色时,我想保持原始颜色的渐变效果.例如,请参阅所附图像. 我曾尝试使用 CoreGraphics &我成功更换了颜色.但是替换颜色并没有保持图像中原始颜色的渐变效果. 有人可以帮我解决这个问题吗?CoreGraphics 是正确的方法吗?提前致谢. 解决方案 在经历了几乎相同的问题(但使用 NSImage)后,在使用 Co
..