pattern-recognition相关内容

如何从文档图像检测文本区域?

我有一个文件图片,可能是报纸或杂志。例如,扫描的报纸。我想删除所有/大多数文本,并保持图像在文档中。任何人知道如何检测文档中的文本区域?下面是一个例子。先感谢! 示例图片: https://www.mathworks.com/matlabcentral/answers/uploaded_files/21044/6ce011abjw1elr8moiof7j20jg0w9jyt.jpg 解 ..

使用OpenCV中的SURF进行模式识别的准确度测量

我目前正在使用OpenCV中的SURF进行模式识别。到目前为止我有什么:我写了一个程序在C#中,我可以选择一个源图像和模板,我想找到。之后,我将两个图片转移到一个C ++ - DLL中,我实现了一个程序使用OpenCV-SURFdetector,它返回所有的关键点,并匹配回我的C#程序,我试图画一个矩形围绕我的匹配。 p> 现在我的问题:模式识别中有常见的准确性度量吗?例如匹配的数量与模板中 ..
发布时间:2016-12-26 12:00:52 C/C++开发

定向梯度直方图与边缘定向直方图

我不清楚HOG和EOH之间的区别。 Hog基于图像导数EOH基于边缘方向。看起来HOG也以某种方式表示EOH。 您能给我一些解释EOH与HOG的区别,以及EOH与HOG的优点。在什么情况下我们可以使用EOH与HOG比较? 解决方案 我认为主要的区别是,对于HOG,方向,然后进行分箱,其中对于EOH,通过搜索一组边缘过滤器内核的最大响应来评估边缘取向。所以你可以说HOG在梯度计算之后进 ..

在图像中查找重复的图案/图像

我一直在寻找这个主题的一些文章(或信息)。 为了避免误解,我不是在说找到一个提供的模式在多个位置。 重复模式也可以理解为重复图像。这里的模式的定义不是抽象的。想象一下,例如,一堵砖墙。墙壁由单独的砖组成。墙的图片由砖的重复图像组成。 解决方案必须找到最大的重复图案。大在这种情况下可以定义两种方式:像素面积或重复次数。 在上面的例子中,你可以把砖块切成两半。为了做一个砖,你可 ..

基于几何形状检测图像上的对象

我对图像处理有一个基本的了解,现在正在深入研究Gonzales的“数字图像处理”书,但有一个紧急的任务,并将欣赏在这方面有经验的人的帮助。 当给定的图像和感兴趣的物体近似形式是已知的(例如圆形,三角形)时, 什么是在图像上找到这个对象的最佳算法/方法? $ b 解决方案 对象可以稍微变形,因此蛮力方法不会有帮助。可以尝试使用定向渐变的直方图(也称为边缘定向直方图)。我们用它们来检测 ..

圆邻域运算:matlab颜色直方图

假设我有一个灰度图像。考虑每个像素周围的圆形邻域窗口。我需要在每个像素周围获得圆形邻域的颜色直方图。 如何在MatLab中有效地实现这个问题的循环邻域操作? 解决方案 我不想给你一切,但我认为这应该能帮你很多。 你可以做一个圆圈做一些像 h = fspecial('disk',rad); h = h> 0; 然后,你可以把它放在一个更大的矩阵中执行 ..

在MATLAB中绘制形状上下文logpolar bin

我使用形状上下文直方图作为特征描述符来编码剪影图像。为了协助调试,我想查看叠加在剪影图像(从边缘图像取的样本点)上的形状上下文logpolar bin。 它应该看起来像一个点如下: 我知道如何显示圆(径向箱),但我在生成角箱(线)时遇到困难。 给定一组角度,如何绘制类似于示例图像中显示的线段? 解决方案 / p> >> figure >> axes >> ..

在哪里可以找到面部检测软件,算法等?

我对编写软件感兴趣,这取决于能够识别图片(或视频帧)中是否有人脸。它不需要标识面部 - 因此没有其他指标: 图片中是否有人脸 $ b 现在,在便宜的数码相机中出现了,所以我希望有开放源代码包做到这一点,或研究,这是很容易跟随,当滚动自己的。 解决方案 查看OpenCV库,这里有一个关于它的好wiki 。 在这里,您可以看到一个实现面部识别应用程序的示例程序。 ..

简单对象识别

=== SOLVED === 感谢您的建议和意见。通过使用开始Python可视化书中提供的flood_fill算法(第9章 - 图像处理)我已经实现了我想要的。我可以计数对象,为每个对象获取包围矩形(因此高度和宽度),最后可以为每个对象构造NumPy数组或矩阵。 虽然这不是一个优化的方法,它做我想要的。我使用的源代码(lab2.py)和png文件(lab2-particles.png) ..

如何将图像输入到神经网络?

我理解神经网络如何工作的方式,但如果我想使用它们进行图像处理,实际上是字符识别,我不能理解,我怎么能输入图像数据到神经网络,如果我可以有一个 A 信的非常大的形象! 可能是我应该尝试从图像中获得一些信息,一些图像的规格,然后使用该规范的值的向量? 它们将是神经网络的输入,他们已经做了这样的事情,请你能解释我的问题吗? 解决方案 最简单的解决方案是将所有图像标准化,无论是训练和测 ..

使用OpenCV中的SURF进行模式识别的准确度测量

我目前正在使用OpenCV中的SURF进行模式识别。到目前为止我有什么:我写了一个程序在C#中,我可以选择一个源图像和模板,我想找到。之后,我将两个图片转移到一个C ++ - DLL中,我实现了一个程序使用OpenCV-SURFdetector,它返回所有的关键点,并匹配回我的C#程序,我试图在我的匹配绘制一个矩形。 p> 现在我的问题:模式识别中有常见的准确性度量吗?例如匹配的数量与模板中 ..
发布时间:2016-10-23 21:01:00 C/C++开发

OpenCV中的旋转和尺度不变模板匹配

可能重复: 缩放和旋转模板匹配 我有一个模板灰度图象,有白色背景和黑形状在它。我也有几个类似的测试图像,旋转和形状不同。测试图像与模板不同,但它们是相似的。 我想比较这两个图像,看看模板匹配,最类似,任何测试图片。在图像中没有失真,没有噪声和没有其他缺陷。 解决方案 首先尝试最简单的方法。 如果我正确地理解你,你有一些模型 - 在白色背景的黑色形状。你可以把它当作b ..
发布时间:2016-10-22 18:52:56 C/C++开发

任何人都可以提出用于音频模式识别库?

我的问题描述: 我有个样本的音频文件,并需要找到它在另一个音频文件(例如,以找到起始和在音频文件结束识别片段的时间)。是否有任何库执行此任务? 解决方案 1) CMU狮身人面像。这是一个开源工具包用于语音识别。 说明:CMUSphinx是在BSD风格的许可证发布了一个独立扬声器大词汇量连续语音识别。这也是开源的工具和资源的集合,可以让研究人员和开发人员构建语音识别系统。 2) RWT ..
发布时间:2016-07-22 18:58:05 其他开发

模式识别算法

在过去我不得不开发一个程序,它充当了规则评估。你有一个前提和一些consecuents(动作),所以如果前因evaled为真,其中执行的操作。 当时我用了一个修改版本的 Rete算法(有三个版本RETE只有第一个公职)为前提的模式匹配。我们谈论的是一个大的系统,在这里,每个规则的运作和一些运营商在若干规则“重复”的万元。 这是可能我得在其他语言一遍实现,而且,即使我经历了RETE,没有人知道其 ..
发布时间:2015-11-30 20:49:50 C/C++

Hough变换算法文本检测中的图像

Hough变换算法的算法用于文本线检测和边缘检测中的一个。 难道Hough变换算法可以用于在图像中检测出的文字? 什么必须在Java中的进程或实现了这个问题?或者它必须是有另一种算法,使其possilble? 希望能为积极响应。 解决方案 霍夫变换最初设计用于检测直线图像中的,但后来的修改已经提出了使用类似的逻辑来检测圆或其它形状。但是字母和文字是一个比较复杂的,(大部分时间),用一个简单 ..
发布时间:2015-11-30 20:31:38 Java开发

如何从点列表查找模式(线,圆,......)?

我点的列表。每个点作为一个 X 和是坐标(这两者都是整数)。现在,我试图找到已知模式,如直线,圆弧或圆,知道点不完美的模式。 什么是做到这一点的最好方法是什么?我没有太多的线索开始。 编辑:点是有序的。用户是借鉴的东西,程序应该检测的最佳模式。例如,如果一个三角形绘制,应该检测三行 解决方案 看看的 Hough变换。你做的是:你改变你的形象,以“圆”的空间,然后你只需要找到光像素 发现光 ..

其中的算法我应该使用信号(声音)一类分类?

更新这个问题是previously评为“举一个简单的算法,我的名字信号(音)模式检测” 我的目标是检测给定图案的presence在噪声信号。我想检测一个物种的昆虫的记录的声音用麦克风的presence。我已previously记录昆虫的声音以数字格式。 在我没有试图做语音识别。 我已经使用所述输入信号和所述图案之间的卷积来确定其相似性级别。但我认为,这种技术更适合离散时间(即数字通信,在信号发生 ..

检测模式在波

我想读一个心电图一个形象和检测主波的每一个在它(P波,QRS波群和T波)。现在我可以读取图像,并得到这样一个向量(4.2; 4.4; 4.9; 4.7; ......)在心电图的价值再presentative,什么是问题的一半。我需要一个算法,可以通过这个载体行走,并检测每本波的开始和结束。 下面是它的图形之一的例子: 会很容易,如果他们总是有相同的大小,但它不喜欢它的工作原理,如果我知道 ..

确定哪些是在图像中的文本和图形区域

我不知道是否我应该在这里还是没有张贴此问题?但是,如果有人知道的话,请回答? 哪些算法,用于确定图像中的哪个区域是文本和哪一个是图形?是指如何分离这样的区域? (图或示意图) 解决方案 大多数OCR软件,如的 Ocropus ,支持布局分析,这是你所需要的。 毛,罗森菲尔德和放大器; Kanungo(2003)文献结构分析算法:文献调查提供了一个相当新的布局分析算法调查 ..
发布时间:2015-11-30 15:01:18 C/C++

模式识别算法中的Node.js或者PHP?

我想首先识别数据中的模式算法尝试。我处理很多类型的序列(图像像素,文字输入,用户移动),这将是有趣的利用模式识别,试图拉有意义的数据从不同的数据集。像大多数的网页,我的数据主要是基于文本或整数键。 是他们,让检查的基本框架模式创建的PHP或Nodejs任何类/? 解决方案 我从来没有发现,封装不同的分析模式单个库中。您可能会发现具体的解决办法很容易,但。 例如N元分析,可以用这个PHP扩展 ..
发布时间:2015-11-30 14:58:47 PHP