image-processing 第11页 - IT屋-程序员软件开发技术分享社区

RuntimeError: 尺寸不匹配 m1: [a x b], m2: [c x d]

任何人都可以帮助我吗?我得到以下错误.我使用谷歌 Colab.如何解决这个错误? 大小不匹配，m1:[64 x 100]，m2:[784 x 128] 在/pytorch/aten/src/TH/generic/THTensorMath.cpp:2070 下面的代码我正在尝试运行. 导入火炬从火炬进口nn导入 torch.nn.functional 作为 F从 torchvisio ..

发布时间：2022-01-09 18:11:57 python-3.x machine-learning image-processing computer-vision pytorch AI人工智能

从图像中删除边框，但将文本保留在边框上(OCR 之前的预处理)

拥有如上图所示的图像，我可以将其裁剪成四个方形框，使用 OpenCV 形态学操作(基本膨胀、腐蚀)去除边框并得到如下结果: 这在大多数情况下效果很好，但如果有人越界写，这可能会被预测为 7 而不是 2. 我无法找到一种解决方案，该解决方案可以在删除边框的同时恢复写在线条上的字符部分.我拥有的图像已经转换为灰度，因此我无法根据颜色区分书写数字.解决这个问题的最佳方法是什么? 解决方 ..

发布时间：2022-01-09 18:11:39 python opencv image-processing computer-vision ocr Python

使用opencv确定一个点是在形状内部还是外部

我有白色背景和简单形状的图像(每张图像都有一个形状).我想确定某个点 (x,y) 是否在形状内.如何使用 opencv 做到这一点? 解决方案使用 pointPolygonTest 函数.这里是教程. ..

发布时间：2022-01-09 18:11:16 image opencv image-processing computer-vision detection 其他开发

从表格图像中提取单个字段以使用 OCR 进行 Excel

我已经扫描了具有如下图所示表格的图像: 我正在尝试分别提取每个框并执行 OCR，但是当我尝试检测水平线和垂直线然后检测框时，它会返回以下图像: 当我尝试执行其他转换来检测文本(腐蚀和扩张)时，仍然会出现一些剩余的线条，如下所示: 我无法检测到仅用于执行 OCR 的文本，并且未生成正确的边界框，如下所示: 我无法使用实线得到清晰分隔的框，我已经在一个用paint(如下所示)编 ..

发布时间：2022-01-09 18:10:58 python opencv image-processing computer-vision ocr Python

如何从python中的3D图像中提取补丁?

我有一个尺寸为:Deep x Weight x Height 的 3D 图片(例如:10x20x30，表示 10 张图片，每张图片的尺寸为 20x30. 给定一个补丁大小为pd x pw x ph(如pd )，例如补丁大小:4x4x4.路径的中心点位置将是:pd/2 x pw/2 x ph/2.我们把时间t到中心点时间t+1的距离称为stride，例如stride=2. 我想将原始 3 ..

发布时间：2022-01-09 18:10:51 python numpy image-processing computer-vision Python

将侧面图像与其正面图像对齐

我有一张头像: 还有一张正面图像: 输出:将侧面与正面对齐. 想法:我只需要知道我可以采取哪些 3 个共同点，这将在两个面上都可见，然后使用 affineTransform 并显示对齐的轮廓面或任何其他**简单的方法** 开发环境.:c++和opencv 2.4.2 我尝试了什么: haarcascade 特征检测(两个图像中的共同检测点=眼睛)；它不会检测到 ..

发布时间：2022-01-09 18:10:44 c++ opencv image-processing computer-vision C/C++开发

向图像添加填充以使它们具有相同的形状

我有一组不同尺寸的图片(45,50,3), (69,34,3), (34,98,3).我想为这些图像添加填充，如下所示: 取整张图片的最大宽度和长度，然后把图片放在那个尺寸导入操作系统导入全局导入简历2input_path="/home/images"os.chdir(输入路径)图像=glob.glob("*.png")长度=[]宽度=[]对于图像中的 img:img=cv2.imrea ..

发布时间：2022-01-09 18:10:26 python image opencv image-processing computer-vision Python

我正在研究定向梯度直方图 (HOG) 特征，并且我正在尝试实现直方图箱的三线性插值，如 Dalal 博士论文中所述.他解释了如下引用的插值过程: 编辑:粗略地说，HOG 特征是从一个 64x128 像素的窗口中提取的，该窗口分为多个块.每个块由 2x2 个单元组成，一个单元是 8x8 像素区域.提取从计算图像的一阶导数开始，然后计算每个像素的方向和大小.计算每个 8x8 像素单元的块内的方向 ..

发布时间：2022-01-09 18:10:19 image-processing computer-vision 其他开发

计算图像中的彩色点

首先，对不起，如果这个话题已经存在(我认为这是一个常见的任务，但找不到任何东西). 关键是我有一张图像，它显示了不同颜色的不同点.我需要一个脚本来计算有多少个红点、绿点和黄点.颜色是纯红色(ff0000)、绿色(00ff00)和黄色(ffff00).这使得这更容易，并且形状定义明确. 我目前的方法是选择圆形(点)形状，选择它们，然后一旦我将所有点都远离背景图像，读取它的颜色来计算它们. ..

发布时间：2022-01-09 18:09:59 python opencv image-processing computer-vision Python

Python OpenCV:魔方解算器颜色提取

说明: 我正在使用 Python & 解决魔方问题.开放式简历.为此，我试图提取立方体的所有颜色(单个立方体块)，然后应用适当的算法(我设计的，没有问题). 问题: 假设如果我提取了立方体的所有颜色，我如何定位提取的立方体的位置?我怎么知道它是在上中下层还是角落中边缘? 我做了什么: 这里我刚刚提取了黄色. 颜色提取后: 原图守则将 numpy ..

发布时间：2022-01-09 18:09:41 python image opencv image-processing computer-vision Python

OpenCV点目标检测未找到所有目标，并且找到的圆圈偏移

我正在尝试检测黑/白点目标的中心，如图所示.我尝试使用 cv2.HoughCircles 方法，但 1，只能检测 2 到 3 个目标，2，当我将找到的圆圈重新绘制到图像上时，它们总是略微偏移. 我是否使用了错误的方法?我应该使用 findContours 还是完全不同的东西? 这是我的代码: 导入 cv2从 cv2 导入 cv导入操作系统将 numpy 导入为 npdef showm ..

发布时间：2022-01-09 18:09:20 python c opencv image-processing computer-vision Python

如何在 OpenCV(Python)中将灰度图像转换为 RGB?

我正在学习使用 OpenCV 进行实时应用程序的图像处理.我对图像进行了一些阈值处理，并希望将轮廓标记为绿色，但它们没有以绿色显示，因为我的图像是黑白的. 在程序的早期，我使用 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 将 RGB 转换为灰度，但返回时我很困惑，函数 backtorgb = cv2.cvtColor(gray,cv2.CV_ ..

发布时间：2022-01-09 18:08:07 python image opencv image-processing computer-vision Python

从图像中的统一背景中提取页面

如果我有一张图片，其中有一页文字是在统一的背景上拍摄的，我如何自动检测纸张和背景之间的边界? 我要检测的图像示例如下所示.我将要处理的图像由统一背景上的单个页面组成，它们可以任意角度旋转. 解决方案一旦将图像转换为灰度，一种简单的方法是通过某个已知值对图像进行阈值处理.这种方法的问题是我们正在应用一个全局阈值，因此如果阈值设置得太高，图像底部的一些纸张将会丢失.如果你把阈值设置得太 ..

发布时间：2022-01-09 18:06:28 image matlab image-processing computer-vision 其他开发

如何在图像的多个矩形边界框中应用阈值?

我的问题是:我有图像中对象周围的边界框的 ROI.ROI 由 Faster R-CNN 获得.现在我想要的是应用阈值来使对象准确地包含在边界框中.该图像的 ROI 由 Faster RCNN 获得. 所以，在获得 ROI 后，我只从图像中选择 ROI 并粘贴到相同大小和尺寸的黑色图像上，从而产生以下图像.让我们说正如您所见，盒子是矩形的，因此在某些地方它会覆盖一些背景区域以及尖刺.那 ..

发布时间：2022-01-09 18:06:07 python image opencv image-processing computer-vision Python

使用 OpenCV 进行椭圆检测

我想使用 OpenCV for Android 检测椭圆，使用 OpenCV 2.4.1 包中包含的 Tutorial 2-Basic 作为起点.请注意，我的椭圆将是一个完美的 Photoshop 椭圆. 据我了解，使用“HoughCircles"只会找到完美(或左右)的圆圈，因此会忽略椭圆. 任何帮助将不胜感激，因为我是 OpenCV 的初学者这是我迄今为止尝试过的 ca ..

发布时间：2022-01-09 18:05:19 java android opencv image-processing computer-vision Java开发

根据文本方向检测图像方向角度

我正在执行一项 OCR 任务，以从多个身份证明文件中提取信息.一个挑战是扫描图像的方向.需要固定 PAN、Aadhaar、驾驶执照或任何身份证明的扫描图像的方向. 已经在 Stackoverflow 和其他论坛上尝试过所有建议的方法，例如 OpenCV minAreaRect、霍夫线变换、FFT、单应性、具有 psm 0 的 tesseract osd.没有一个有效. 逻辑应返回文本方 ..

发布时间：2022-01-09 18:04:54 python image opencv image-processing computer-vision Python

使用 Opencv 检测图像中矩形的中心和角度

我有一张如下图: 我需要找出矩形的数量，每个矩形的中心，并测量与穿过中心的矩形长边平行的轴之间的角度，并测量从水平方向逆时针方向的角度.我发现了图像中矩形的数量.我很惊讶地发现了反射的中心和角度.通过瞬间找到中心并没有给我正确的答案. 我的代码: 导入 cv2将 numpy 导入为 np导入系统img = cv2.imread(str(sys.argv[1]),0)ret,thres ..

发布时间：2022-01-09 18:04:48 python opencv image-processing computer-vision Python

Viola-Jones 的人脸检测声称拥有 18 万个特征

我一直在实施对 Viola-Jones 的人脸检测算法的改编.该技术依赖于在图像中放置一个 24x24 像素的子帧，然后将矩形特征放置在图像中的每个位置，并且可能具有各种尺寸. 这些特征可以由两个、三个或四个矩形组成.下面给出一个例子. 他们声称详尽的集合超过 180k(第 2 部分): 鉴于检测器的基本分辨率为 24x24，详尽的矩形特征集相当大，超过 180,000 个.请注 ..

发布时间：2022-01-09 18:02:08 algorithm image-processing computer-vision face-detection viola-jones 其他开发

计算旋转的 2D 图像的平移值和旋转角度

我有两张图像，其中一张是原始图像，第二张是转换图像. 我必须找出使用 3x3 变换矩阵将变换后的图像旋转了多少度.另外，我需要找出从原点翻译的距离. 两幅图像都是灰度的，并保存在矩阵变量中.它们的大小相同 [350 500]. 我发现了一些讲义，例如 this. 讲义说我应该使用以下矩阵公式进行旋转: 对于平移矩阵，给出公式: 一切都很好.但是有两个问题: ..

发布时间：2022-01-09 18:01:12 image matlab image-processing matrix computer-vision 其他开发

如何在不使用 opencv 中的 fitEllipse() 的情况下检测图像中的椭圆?

我正在尝试使用 C++ 在 OpenCV 中检测椭圆内核.我尝试获得 Canny 边缘，然后在边缘上使用 fitEllipse() 函数.虽然这会发现椭圆，但当图像有噪声或有很多边缘时，精度会很差. 我意识到要走的路是检测椭圆，而不是拟合它们.也许像霍夫圆之类的东西，但对于椭圆?我也不知道椭圆的长度，因为它因图像而异. 有人可以帮我开始吗?所有相关的答案都很模糊，我只想知道从哪里开始. ..

发布时间：2022-01-09 18:00:55 opencv image-processing computer-vision 其他开发

image-processing相关内容