image-processing相关内容

从图像中删除边框,但将文本保留在边框上(OCR 之前的预处理)

拥有如上图所示的图像,我可以将其裁剪成四个方形框,使用 OpenCV 形态学操作(基本膨胀、腐蚀)去除边框并得到如下结果: 这在大多数情况下效果很好,但如果有人越界写,这可能会被预测为 7 而不是 2. 我无法找到一种解决方案,该解决方案可以在删除边框的同时恢复写在线条上的字符部分.我拥有的图像已经转换为灰度,因此我无法根据颜色区分书写数字.解决这个问题的最佳方法是什么? 解决方 ..
发布时间:2022-01-09 18:11:39 Python

从表格图像中提取单个字段以使用 OCR 进行 Excel

我已经扫描了具有如下图所示表格的图像: 我正在尝试分别提取每个框并执行 OCR,但是当我尝试检测水平线和垂直线然后检测框时,它会返回以下图像: 当我尝试执行其他转换来检测文本(腐蚀和扩张)时,仍然会出现一些剩余的线条,如下所示: 我无法检测到仅用于执行 OCR 的文本,并且未生成正确的边界框,如下所示: 我无法使用实线得到清晰分隔的框,我已经在一个用paint(如下所示)编 ..
发布时间:2022-01-09 18:10:58 Python

如何从python中的3D图像中提取补丁?

我有一个尺寸为:Deep x Weight x Height 的 3D 图片(例如:10x20x30,表示 10 张图片,每张图片的尺寸为 20x30. 给定一个补丁大小为pd x pw x ph(如pd ),例如补丁大小:4x4x4.路径的中心点位置将是:pd/2 x pw/2 x ph/2.我们把时间t到中心点时间t+1的距离称为stride,例如stride=2. 我想将原始 3 ..
发布时间:2022-01-09 18:10:51 Python

将侧面图像与其正面图像对齐

我有一张头像: 还有一张正面图像: 输出:将侧面与正面对齐. 想法:我只需要知道我可以采取哪些 3 个共同点,这将在两个面上都可见,然后使用 affineTransform 并显示对齐的轮廓面 或任何其他**简单的方法** 开发环境.:c++和opencv 2.4.2 我尝试了什么: haarcascade 特征检测(两个图像中的共同检测点=眼睛);它不会检测到 ..
发布时间:2022-01-09 18:10:44 C/C++开发

向图像添加填充以使它们具有相同的形状

我有一组不同尺寸的图片(45,50,3), (69,34,3), (34,98,3).我想为这些图像添加填充,如下所示: 取整张图片的最大宽度和长度,然后把图片放在那个尺寸 导入操作系统导入全局导入简历2input_path="/home/images"os.chdir(输入路径)图像=glob.glob("*.png")长度=[]宽度=[]对于图像中的 img:img=cv2.imrea ..
发布时间:2022-01-09 18:10:26 Python

直方图箱的 HOG 三线性插值

我正在研究定向梯度直方图 (HOG) 特征,并且我正在尝试实现直方图箱的三线性插值,如 Dalal 博士论文中所述.他解释了如下引用的插值过程: 编辑:粗略地说,HOG 特征是从一个 64x128 像素的窗口中提取的,该窗口分为多个块.每个块由 2x2 个单元组成,一个单元是 8x8 像素区域.提取从计算图像的一阶导数开始,然后计算每个像素的方向和大小.计算每个 8x8 像素单元的块内的方向 ..
发布时间:2022-01-09 18:10:19 其他开发

计算图像中的彩色点

首先,对不起,如果这个话题已经存在(我认为这是一个常见的任务,但找不到任何东西). 关键是我有一张图像,它显示了不同颜色的不同点.我需要一个脚本来计算有多少个红点、绿点和黄点.颜色是纯红色(ff0000)、绿色(00ff00)和黄色(ffff00).这使得这更容易,并且形状定义明确. 我目前的方法是选择圆形(点)形状,选择它们,然后一旦我将所有点都远离背景图像,读取它的颜色来计算它们. ..
发布时间:2022-01-09 18:09:59 Python

Python OpenCV:魔方解算器颜色提取

说明: 我正在使用 Python & 解决魔方问题.开放式简历.为此,我试图提取立方体的所有颜色(单个立方体块),然后应用适当的算法(我设计的,没有问题). 问题: 假设如果我提取了立方体的所有颜色,我如何定位提取的立方体的位置?我怎么知道它是在上中下层还是角落中边缘? 我做了什么: 这里我刚刚提取了黄色. 颜色提取后: 原图 守则 将 numpy ..
发布时间:2022-01-09 18:09:41 Python

OpenCV点目标检测未找到所有目标,并且找到的圆圈偏移

我正在尝试检测黑/白点目标的中心,如图所示.我尝试使用 cv2.HoughCircles 方法,但 1,只能检测 2 到 3 个目标,2,当我将找到的圆圈重新绘制到图像上时,它们总是略微偏移. 我是否使用了错误的方法?我应该使用 findContours 还是完全不同的东西? 这是我的代码: 导入 cv2从 cv2 导入 cv导入操作系统将 numpy 导入为 npdef showm ..
发布时间:2022-01-09 18:09:20 Python

如何在 OpenCV(Python)中将灰度图像转换为 RGB?

我正在学习使用 OpenCV 进行实时应用程序的图像处理.我对图像进行了一些阈值处理,并希望将轮廓标记为绿色,但它们没有以绿色显示,因为我的图像是黑白的. 在程序的早期,我使用 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 将 RGB 转换为灰度,但返回时我很困惑,函数 backtorgb = cv2.cvtColor(gray,cv2.CV_ ..
发布时间:2022-01-09 18:08:07 Python

从图像中的统一背景中提取页面

如果我有一张图片,其中有一页文字是在统一的背景上拍摄的,我如何自动检测纸张和背景之间的边界? 我要检测的图像示例如下所示.我将要处理的图像由统一背景上的单个页面组成,它们可以任意角度旋转. 解决方案 一旦将图像转换为灰度,一种简单的方法是通过某个已知值对图像进行阈值处理.这种方法的问题是我们正在应用一个全局阈值,因此如果阈值设置得太高,图像底部的一些纸张将会丢失.如果你把阈值设置得太 ..
发布时间:2022-01-09 18:06:28 其他开发

如何在图像的多个矩形边界框中应用阈值?

我的问题是:我有图像中对象周围的边界框的 ROI.ROI 由 Faster R-CNN 获得.现在我想要的是应用阈值来使对象准确地包含在边界框中.该图像的 ROI 由 Faster RCNN 获得. 所以,在获得 ROI 后,我只从图像中选择 ROI 并粘贴到相同大小和尺寸的黑色图像上,从而产生以下图像.让我们说 正如您所见,盒子是矩形的,因此在某些地方它会覆盖一些背景区域以及尖刺.那 ..
发布时间:2022-01-09 18:06:07 Python

使用 OpenCV 进行椭圆检测

我想使用 OpenCV for Android 检测椭圆,使用 OpenCV 2.4.1 包中包含的 Tutorial 2-Basic 作为起点.请注意,我的椭圆将是一个完美的 Photoshop 椭圆. 据我了解,使用“HoughCircles"只会找到完美(或左右)的圆圈,因此会忽略椭圆. 任何帮助将不胜感激,因为我是 OpenCV 的初学者 这是我迄今为止尝试过的 ca ..
发布时间:2022-01-09 18:05:19 Java开发

根据文本方向检测图像方向角度

我正在执行一项 OCR 任务,以从多个身份证明文件中提取信息.一个挑战是扫描图像的方向.需要固定 PAN、Aadhaar、驾驶执照或任何身份证明的扫描图像的方向. 已经在 Stackoverflow 和其他论坛上尝试过所有建议的方法,例如 OpenCV minAreaRect、霍夫线变换、FFT、单应性、具有 psm 0 的 tesseract osd.没有一个有效. 逻辑应返回文本方 ..
发布时间:2022-01-09 18:04:54 Python

使用 Opencv 检测图像中矩形的中心和角度

我有一张如下图: 我需要找出矩形的数量,每个矩形的中心,并测量与穿过中心的矩形长边平行的轴之间的角度,并测量从水平方向逆时针方向的角度.我发现了图像中矩形的数量.我很惊讶地发现了反射的中心和角度.通过瞬间找到中心并没有给我正确的答案. 我的代码: 导入 cv2将 numpy 导入为 np导入系统img = cv2.imread(str(sys.argv[1]),0)ret,thres ..
发布时间:2022-01-09 18:04:48 Python

Viola-Jones 的人脸检测声称拥有 18 万个特征

我一直在实施对 Viola-Jones 的人脸检测算法的改编.该技术依赖于在图像中放置一个 24x24 像素的子帧,然后将矩形特征放置在图像中的每个位置,并且可能具有各种尺寸. 这些特征可以由两个、三个或四个矩形组成.下面给出一个例子. 他们声称详尽的集合超过 180k(第 2 部分): 鉴于检测器的基本分辨率为 24x24,详尽的矩形特征集相当大,超过 180,000 个.请注 ..

计算旋转的 2D 图像的平移值和旋转角度

我有两张图像,其中一张是原始图像,第二张是转换图像. 我必须找出使用 3x3 变换矩阵将变换后的图像旋转了多少度.另外,我需要找出从原点翻译的距离. 两幅图像都是灰度的,并保存在矩阵变量中.它们的大小相同 [350 500]. 我发现了一些讲义,例如 this. 讲义说我应该使用以下矩阵公式进行旋转: 对于平移矩阵,给出公式: 一切都很好.但是有两个问题: ..
发布时间:2022-01-09 18:01:12 其他开发

如何在不使用 opencv 中的 fitEllipse() 的情况下检测图像中的椭圆?

我正在尝试使用 C++ 在 OpenCV 中检测椭圆内核.我尝试获得 Canny 边缘,然后在边缘上使用 fitEllipse() 函数.虽然这会发现椭圆,但当图像有噪声或有很多边缘时,精度会很差. 我意识到要走的路是检测椭圆,而不是拟合它们.也许像霍夫圆之类的东西,但对于椭圆?我也不知道椭圆的长度,因为它因图像而异. 有人可以帮我开始吗?所有相关的答案都很模糊,我只想知道从哪里开始. ..
发布时间:2022-01-09 18:00:55 其他开发