computer-vision相关内容

如何删除背景图像和得到的图像

有两个图片 一个是背景图片另一个是人的照片具有相同的背景,相同的大小,我想做的是删除第二个图像的背景,并提炼个人的个人资料。通常的方法是从第二个图像减去第一个图像,但我的问题是如果人的磨损的颜色类似于背景。减法的结果是可怕的。我不能得到全民的个人资料。谁有好主意去除背景给我一些建议。 提前谢谢。 解决方案 如果您对图像背景有很好的估计,与人是一个良好的第一步。但这只是第一步。之后, ..

Python中的机器视觉

我想使用Python执行一些基本的机器视觉任务,我想知道我在哪里可以找到教程来帮助我开始。 据我所知,用于Python的唯一免费的执行机器视觉的库是 PyCV (这是一个包装器 OpenCV ),但我找不到任何适当的教程。 我的主要任务是从FireWire获取图像。在不同区域中分割图像。然后对每个区域执行统计以确定像素面积和质心。 以前,我使用Matlab的图像处理Tootlbo ..
发布时间:2016-12-26 11:06:59 Python

自动我的小马驹检测和分类

我要寻找的是具有计算机视觉经验的人的建议,在这个问题上什么方法或算法是最好的。我是一个有经验的程序员(大多是.NET),但我知道没有什么关于计算机视觉,我想节省时间。 我要检测的内容: 独特的颜色,锐利的边缘,缺乏渐变和很少的噪音。 我想象的最终结果是像Picasa或Windows Live Gallery做的 - 我标记 解决方案 漫画家在他们的绘画中获得特别强的许可证 ..
发布时间:2016-12-26 11:06:46 其他开发

如何以图形方式表示HoG特征?

我正在实施的方向梯度特征的直方图从“人类检测的定向梯度直方图”,我想要可视化的结果。所有关于这些功能的论文都使用标准的可视化,但我找不到任何关于这些功能的生成的描述。 解决方案 您在论文中看到的可视化效果可以解释如下: 描述符由覆盖网格中图像窗口的M * N个单元组成。每个单元由边缘取向的直方图表示,其中离散化边缘取向的数量是参数(通常为9)。通过显示直方图中边缘取向的强度的“星”可 ..

平衡接缝图像之间的对比度和亮度

我正在开发一个图像拼接项目,我知道处理图像的对比度和亮度有不同的方法。我当然可以在我甚至缝合图像之前处理这个问题,但是结果是不一致的,我希望。所以我的问题是,是否有可能通过任何机会“平衡”或“平衡”在彩色图片的对比度和亮度发生后? 解决方案 您想要确定直方图均衡功能,而不是从整个图像,而是在他们将接触或重叠的区域。你显然需要在重叠区域有相同的直方图,所以这是你计算函数的地方。然后,您可以对 ..
发布时间:2016-12-26 11:06:04 其他开发

什么是梯度定向和梯度大小

我目前正在学习一个称为边缘检测的计算机视觉模块。 我试图理解梯度方向和梯度幅度的含义。 解决方案 “http://stackoverflow.com/users/13313/dima\"> Dima 在他的回答中,您应该熟悉渐变的数学概念,以便更好地了解字段中的渐变图像处理。 我的回答是基于回答的 mevatron 到此 您可以在黑色背景上找到白色磁盘的简单初始映像: ..
发布时间:2016-12-26 11:05:25 其他开发

隐藏马尔科夫模型与C ++

我一直在研究C ++中隐藏马尔可夫模型的实现。我想知道如果我可以使用任何现有的HMM库写在C + +使用 与动作识别(与OpenCV)? “ 可以使用 Torch3Vision 即使(看起来)它是为 设计的语音识别工作? 我的想法是,如果我们可以转换特征向量符号/观察 (使用向量量化--Kmeans聚类),我们可以使用这些符号进行 解码,推理,参数学习(Baum-Welc ..

将OpenCV图像转换为黑白图像

如何将灰度OpenCV图像转换为黑白图像?我看到类似问题已被问过,但我使用OpenCV 2.3,并且建议的解决方案似乎不再工作。 我试图将灰度图像转换为黑白,以便不是绝对黑色的白色,并将其用作 surf.detect()的掩码, 以下Python让我几乎在那里,但阈值发送到Threshold()似乎没有任何效果。如果我将它设置为0或16或128或255,结果是相同的,所有像素值> 12 ..
发布时间:2016-12-26 11:04:50 Python

分割牌照字符

我在分析车牌图片中的字元时遇到问题。 我已经应用以下方法提取车牌字符, -adaptive threshold车牌图像。 - 选择具有特定长宽比的轮廓。 如果附件中有牌照图像的阴影。 由于不正确的二进制化,我不能正确地分割字符。 图像中的阴影合并图像中的相邻字符。 我已经为不同窗口大小的图像设置了阈值, 结果附加, p> 如果图像中有阴影,如 ..
发布时间:2016-12-26 11:04:39 Python

简单对象识别

=== SOLVED === 感谢您的建议和意见。通过使用开始Python可视化书中提供的flood_fill算法(第9章 - 图像处理)我已经实现了我想要的。我可以计数对象,为每个对象获取包围矩形(因此高度和宽度),最后可以为每个对象构造NumPy数组或矩阵。 虽然这不是一个优化的方法,它做我想要的。我使用的源代码(lab2.py)和png文件(lab2-particles.png) ..

如何在Android增强现实中检测物理对象?

我发现了许多方法来检测不同的形状。但是,当我要一个物理对象时,运气很好。从我读到的,我们应该有一个围绕图像的黑色边框,以制作一个模式文件。如果我遵循这个概念,并生成一个模式,然后我的应用程序检测图像打印输出。 更新 虽然我接受一个答案,但我的问题仍然没有解决。 欢迎任何进一步的研究和链接! 在3D对象上进行对象识别是一个更复杂的问题,我不知道任何Android库提供 ..

面部识别程序如何工作?

解决方案 大致上,处理阶段是: 检测脸部位置 规范化脸部 $ b 步骤1通常使用经典中提琴与琼斯面部检测算法。这是相当快速和可靠。 步骤1中找到的人脸可能有不同的亮度,对比度和不同的大小。为了简化处理,它们都被缩放到相同的大小,并且在步骤2中补偿曝光差异(例如使用直方图均衡)。 步骤3有许多方法。早期面部检测器试图找到特定位置(眼睛的中心,鼻子的端部,嘴唇的端部等), ..
发布时间:2016-12-26 11:04:07 其他开发

立体匹配中的视差图和视差图像之间的差异

我是新的立体声匹配。我不明白差异的概念。请告诉我什么是视差图和视差图像,它们之间有什么区别? 解决方案 视差 视差是指立体对的左图像和右图像中的两个对应点之间的距离。如果你看下面的图像,你会看到一个标记点​​X(忽略X1,X2和X3)。通过遵循从X到OL的虚线,您可以看到与XL的左手平面的交点。同样的原则适用于右侧图像平面。 显然,这个过程涉及在左手帧中选择一个点,然后在右手图 ..
发布时间:2016-12-26 11:03:56 其他开发

什么是“语义分割”与“分割”相比。和“场景标记”?

语义分割只是Pleonasm还是“语义分割”和“分割”之间有区别吗? “场景标记”或“场景解析”有什么区别? 像素级和像素级分割之间有什么区别? (侧面问题:当你有这种像素级的注释,你可以免费获取对象检测,还是还有事情要做?) 请为您的定义指定来源。 使用“语义分段”的来源 Jonathan Long,Evan Shelhamer,Trevor Darrell:语法分 ..

如何画一个带有双色粒子的水晶球

我只是想着关闭的可能性。我需要画一个水晶球,红色和蓝色粒子随机放置。我想我必须去与photoshop,甚至试图使一个图像中的球,但因为这是研究论文,不必要花哨,我想知道是否有任何方法来编程与R,matlab或任何其他语言。 解决方案 在R中,使用 rgl -to-OpenGL interface): library(rgl) n ..
发布时间:2016-12-26 11:03:34 其他开发

什么是C / C ++中计算机视觉的最佳库?

在C / C ++中使用Computer Vision时,我必须选择哪些图书馆? 我意识到Google有很多好的结果, 解决方案 我们使用 OpenCV 广泛地在我工作的地方。 它提供了一套完整的视觉处理工具。我建议阅读维基的更详细的解释和更好的书面解释,我会给的。 ..
发布时间:2016-12-26 11:03:23 C/C++开发

如何开始增强现实?

我现在是计算机科学的本科生,我将进入明年的最后一年。增强现实是我觉得是一个非常有趣的话题,但我不知道从哪里开始学习它。 您从哪里开始了解这个主题和可用的图书馆? 解决方案 作为一个相当受欢迎的流行语,增强现实可以用一些不同的算法构建,可以单独学习。通常它包括: 平面对象检测(可以是标记或以前训练的对象)。 SURF / SIFT / FAST描述符,RANSAC用于单应性矩阵 ..