computer-vision相关内容

Cloud ML Engine 中部署的重新训练的 inception_v3 模型始终输出相同的预测

我按照 codelab TensorFlow For Poets 使用迁移学习inception_v3.它生成 retrained_graph.pb 和 retrained_labels.txt 文件,可用于在本地进行预测(运行 label_image.py). 然后,我想将此模型部署到 Cloud ML Engine,以便进行在线预测.为此,我必须将 retrained_graph.pb ..

如何检测不同光照条件下的颜色

我有一堆不同颜色的衣服图像,我想检测每个图像的颜色.假设我在日光条件下有一张蓝色裙子图像,我可以通过 RGB 分布获得正确的颜色.然而,在晚上很难分辨颜色,“蓝色"被识别为“黑色".很难制定一个统一的标准来通过 RGB 分布来指定颜色. 因此,我想知道是否有一种方法或算法可以检测不同照明下的颜色? 顺便说一句:我也尝试了 HSV 色彩空间,结果并不好. 解决方案 这是一个非常困 ..
发布时间:2022-01-09 18:42:32 其他开发

视野如何改变立体视觉中的深度估计?

我正在尝试从带有两个摄像头的立体系统估计深度.我使用的简单等式是: 基线*焦点深度 = ----------------------差距 两个摄像头的视野不会改变允许的最大深度?它只改变可测量的最小深度? 解决方案 在顶端,可测量的深度受到您使用的相机分辨率的限制,这反映在视差中.随着深度变得更大,差异趋于零.有了更大的视野,它在较低的深度将有效地为零.因此,更大的视野会降低可测量的 ..
发布时间:2022-01-09 18:42:24 其他开发

使用 OpenCV 检测一个图像中的对象是否在另一个图像中

我有一个包含对象的示例图像,例如下图中的耳环: http://imgur.com/luj2Z 然后我有一大组候选图像,我需要确定哪一个最有可能包含对象,例如: http://imgur.com/yBWgc 所以我需要为每个图像生成一个分数,其中最高分数对应于最有可能包含目标对象的图像.现在,在这种情况下,我有以下条件/约束可以使用/解决: 1) 我可以获取多个不同角度 ..
发布时间:2022-01-09 18:42:15 C#/.NET

在 OpenCV 中训练 SIFT 特征

我创建了一个小型 SIFT 应用程序,它可以抓取关键点并将其保存到文本文件中.我正在使用它从徽标(例如 AT&T)中获取信息,并使用它与具有该徽标的其他图像进行比较.问题是我的许多图像都有不同的徽标,由于缩放、旋转或照明,它无法识别它.我想知道是否有可能获得一组图像,抓住它的关键点,然后通过某种训练算法运行它以增强检测. 我在网上搜索了训练 SIFT 关键点的方法,但它们都在某种 phd 论 ..

在 MATLAB 中绘制形状上下文对数极坐标箱

我使用形状上下文直方图作为特征描述符来编码剪影图像.为了帮助调试,我想查看覆盖在轮廓图像上的形状上下文 logpolar 箱(从边缘图像中获取的样本点). 其中一个点的外观示例如下: 我知道如何显示圆圈(径向分格),但我在生成角度分格(线)时遇到了困难. 给定一组角度,我如何绘制类似于示例图像中所示的线段? 解决方案 这样做: >> 图>> 轴>> 坚持>> 半径 = ..

匹配模板图像(缩放)到主/更大的图像

我想在主图像中查找/检查子图像/模板图像并想知道它的坐标, 我已经使用下面链接中给出的代码来实现它, 检查 iOS 中图像中是否存在子图像 如果模板图像的大小与较大图像的匹配部分的大小完全相同,则可以正常工作. 但是,如果子图像被缩小或放大而不是匹配较大图像的一部分,则无法正确给出结果. 解决方案 使用 OpenCV 特征检测.它比模板匹配更准确.. 请尝试使 ..

计算机视觉中的卡尔曼滤波器:Q 和 R 噪声协方差的选择

我阅读了一些关于用于 CV 对象跟踪的卡尔曼滤波器的作品,但我找不到关于以下选择的参考:1)过程噪声协方差 Q;2)测量噪声协方差R.到目前为止,我已经意识到该模型是运动方程(有人使用加速度作为状态变量,其他人仅使用位置和速度)但没有人清楚Q和R的选择,包括mathworks的这个例子:http://www.mathworks.it/it/help/vision/examples/using-ka ..

OpenCV中基于已知相机方向的透视变形

我正在开展一个项目,该项目试图根据相机的已知方向从图像中消除透视失真.我的想法是,我可以根据相机的已知 X、Y 和 Z 方向创建一个旋转矩阵.然后我可以通过 WarpPerspective 方法将这些矩阵应用于图像. 在我的脚本(用 Python 编写)中,我创建了三个旋转矩阵,每个矩阵都基于一个方向角.我已经到了一个我被困在两个问题上的地步.首先,当我将每个单独的矩阵加载到 WarpPer ..
发布时间:2022-01-09 18:41:27 Python

在均匀强度图像中检测物体

我有Tiger's Pugmark(足迹印象)在泥土中的图像.我想检测 pugmark 的边界,但图像的强度是均匀的,即前景和背景无法根据强度变化来区分.我能做些什么来区分 pugmark 和背景.! 解决方案 在分割任务中,如果你有两个 良好的标记;和 感兴趣的对象周围有明显的边缘 然后它直接通过分水岭变换解决.当然,问题在于获得这些标记,以及根据需要增强相关边缘.获取这些 ..

霍夫变换 - javascript - node.js

所以,我正在尝试实现霍夫变换,这个版本是基于次要属性的一维版本(它的所有暗淡减少到 1 暗淡优化)版本.随附的是我的代码,带有示例图像...输入和输出. 明显的问题是我做错了什么.我已经检查了我的逻辑和代码三倍,而且我的参数看起来也不错.但显然我错过了一些东西. 注意,红色像素应该是椭圆中心,而蓝色像素是要去除的边缘(属于符合数学方程的椭圆). 另外,我对 openCV/matl ..

如何使用 Python OpenCV 将灰度图像转换为热图图像

我有一个 (540, 960, 1) 形状的图像,其值范围为黑白的 [0..255].我需要将其转换为“热图"表示.例如,具有 255 的像素应该是最热的,而具有 0 的像素应该是最不热的.其他介于两者之间.我还需要将热图作为 Numpy 数组返回,以便稍后将它们合并到视频中.有没有办法做到这一点? 解决方案 这里有两种方法,一种使用Matplotlib,一种只使用OpenCV 方法 ..
发布时间:2022-01-09 18:41:04 Python

如何使用 Azure 自定义视觉服务响应 boundingBox 绘制形状

我正在使用 Azure 认知服务 自定义视觉服务从捕获的图像中检测形状.根据他们的文档,我按照他们的格式收到了回复. 但是在图像上方绘制形状是一个面临的问题. {"id": "0fbda4ee-8956-4979-bf57-a252441af98d",“项目":“9ca4032b-beeb-40ad-9396-1c3fcfd9ba89",“迭代":“27c85265-a158-4fc4-b ..

如何在滑动窗口对象检测中对真阴性进行分类?

我正在收集图像检测器算法的结果.所以基本上我所做的是,从一组图像(大小为 320 x 480)中,我会通过它运行一个 64x128 的滑动窗口,并在一些预定义的比例下运行. 我明白: True Positives = 当我检测到的窗口与真实情况(带注释的边界框)重叠(在定义的交叉点大小/质心内)时 误报 = 当算法给我正窗口时,这超出了事实. False Negatives = 当 ..

OpenCV中矩阵中的元素总和?

我需要对矩阵中的所有元素求和.我使用了函数 sum(sum(A)); 在matlab中.其中 A 是一个大小为 300*360 的矩阵.我想在 OpenCV 中实现相同的功能.我用过这样的东西. double s=cv::sum(cv::sum(A)); 但显示无法将标量转换为双精度的错误.如何解决这个问题? 解决方案 与 Matlab 不同,在 opencv 中,cv::su ..
发布时间:2022-01-09 18:39:57 C/C++开发

查找 cv::Mat 的最大值

我正在尝试查找 cv::Mat 的最大像素值. 问题:*maxValue 总是返回 0. 来自 这个 S.O.线程,我知道 'max_element 返回迭代器,而不是值.这就是我使用 *maxValue' 的原因 cv::Mat imageMatrix;双 sigmaX = 0.0;int ddepth = CV_16S;//ddepth – 目标图像的所需深度cv::Gauss ..
发布时间:2022-01-09 18:39:51 C/C++开发

梯度大小的单位和界限是什么?

图像梯度幅度的单位和限制是什么?例如,我知道如何获得图像的梯度幅度(见下文).生成的 Mat 将包含我的源图像中每个边缘的边缘强度(大小). 但是“边缘强度/大小"的单位是什么?梯度方向以度/弧度为单位,幅度的单位是什么?OpenCV 中 Magnitude 的限制是什么?它是 0 到 1,即边缘的强度/大小介于 0 到 1 之间,其中 1 是完全垂直的? 因此,如果我要在直方图中绘制 ..
发布时间:2022-01-09 18:39:40 C/C++开发

基本矩阵的投影矩阵

我已经获得了两个相机之间的基本矩阵.我也将它们的内部参数放在我之前通过棋盘获得的 3 X 3 矩阵中.使用基本矩阵,我得到了 P1 和 P2 by P1 = [我 |0] 和 P2 = [ [e']x * F |e'] 这些投影矩阵在获取准确的 3D 位置方面并没有真正的用处.因为,我有内部参数 K1 和 K2,我将 P1 和 P2 更改为 P1 = K1 * [I |0] 和 ..
发布时间:2022-01-09 18:39:34 其他开发

Python OpenCV HoughLinesP 无法检测线

我正在使用 OpenCV HoughlinesP 来查找水平线和垂直线.它大部分时间都没有找到任何线路.即使它找到一条线,它甚至与实际图像都不接近. 导入 cv2将 numpy 导入为 npimg = cv2.imread('image_with_edges.jpg')灰色 = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)标志,b = cv2.threshold(灰色 ..
发布时间:2022-01-09 18:39:25 Python