computer-vision相关内容

RESNET 50与yolo或rcnn有什么不同?

作为Deep Learning的新手,我正在努力理解不同技术状态的算法及其用途之间的差异。就像RESNET或VGG与yolo或rcnn系列有什么不同。它们是这些检测模型的子组件吗?固态硬盘是否也是像yolo或rcnn这样的另一个系列? 推荐答案 Resnet是一族神经网络(使用残差函数)。很多神经网络使用ResNet架构,例如: ResNet18、ResNet50 宽ResNe ..

如何仅在一个特定类上评估TensorFlow对象检测API?

我已经从TensorFlow Object Detection APIfaster_rcnn_inception_resnet_v2_atrous_coco训练了大约10个类的对象检测模型。当我运行model_main.py文件评估模型时,它似乎只给出了所有10个类的平均准确率(AP)和平均召回率(AR),如下所示: Average Precision (AP) @[ IoU=0.50:0 ..

从opencv中的数独中提取框

我已经使用 opencv 将数独图像转换为数独网格 现在我想从图像中提取每个框,最好的方法是什么? 据我所知,我正在尝试找到线的交点以找到每个框的角 类 SudokuSolverPlay:def __init__(自我,图像):def __preProcess(self, img):""""返回灰度图像""""def __maskSudoku(self, img):""""返回蒙版图 ..
发布时间:2022-01-09 18:57:33 Python

如何从计算机视觉相机计算像素的水平角

我的程序需要从具有 120 度水平视野、640 像素宽和 480 像素高的分辨率的计算机视觉相机计算像素的角度. 程序从相机接收每个图像帧的 X,Y 像素数组.对于最左边的像素,X 为 0,角度为 -60 度.对于最右边的像素,X 为 639,角度为 60 度.对于中心像素,X 为 320,角度为 0. 当 (X is > 0 and 320 and ..
发布时间:2022-01-09 18:57:15 其他开发

Kinect:我如何识别第一个跟踪的骨架并在之后用它做些什么

我如何识别 kinect 跟踪的第一个骨架,然后对其进行处理.我只对第一个骨架感兴趣,以后我不需要它们.最好根本不跟踪进入的下一个骨架. 谁能帮我这个谢谢.目前我使用的下面的代码不起作用.我尝试了一些快速的 linq 查询,但我不太确定如何使用它.总是有错误. 谁能给我一些我可以使用的例子提前谢谢! private void SensorSkeletonFrameReady(obje ..
发布时间:2022-01-09 18:57:09 C#/.NET

在 iOS 中检查图像中是否存在子图像

我有 2 张图片,分别是 smallImage 和 largeImage.现在,我想检查smallerImage 是否是largerImage 的一部分(或子图像).我不知道如何检查.我想在 iOS 中完成这一切.在搜索之后,我发现使用 openCV 库是用于此类东西的最佳库.但我不知道如何使用 openCV 库来执行我的任务. 总之,我想知道, 1) 在大图中查找/检查子图像有哪些不 ..

cvUndistort2() 和 cvRemap() 崩溃

我正在做 Bradski 的“Learning OpenCV"的示例 11-1.不幸的是,给定的示例在我的计算机上不起作用. 该程序应该使用棋盘校准相机,然后从相机输出不失真的视频输出. 校准部分工作正常,当程序试图不扭曲图像时出现问题.我尝试了 cvUndistort2() 和 cvRemap(),在这两种情况下,输出窗口都会冻结并且程序崩溃,所以我必须强制关闭它. 代码如下: ..
发布时间:2022-01-09 18:56:51 其他开发

这是将训练集投影到特征空间的正确方法吗?MATLAB

我使用以下方法计算了 PCA: 函数 [signals,V] = pca2(data)[M,N] = 大小(数据);数据 = 重塑(数据,M*N,1);% 减去每个维度的平均值mn = 平均值(数据,2);数据= bsxfun(@减号,数据,平均值(数据,1));% 构造矩阵YY = 数据'*数据/(M*N-1);[V D] = eigs(Y, 10);% 减少到 10 维% 投影原始数据信号 ..
发布时间:2022-01-09 18:56:45 其他开发

如何使用 opencv copyTo() 函数?

我已阅读 copyTo() 的文档 但我仍然对如何将此函数应用于以下代码感到困惑.这个答案声明我们可以使用 copyTo 函数而不是 255-x.在这种情况下如何应用此功能?我将不胜感激代码片段. # 计算图像的梯度图def doLap(图像):# 你应该调整这些值以满足你的需要kernel_size = 5 # 拉普拉斯窗口的大小blur_size = 5 # 用于高斯模糊的内核有多大# 一般 ..
发布时间:2022-01-09 18:56:27 Python

如何计算“绿点"的数量?在图像中?

嗨我有一堆图像.让我们假设它们都具有相同的大小.图像有黑色背景和一些准圆形绿色斑点代表荧光.我必须计算金额(百分比)每个图像的荧光.IE.绿点面积. 知道如何做到这一点,例如在 Java 中吗? 解决方案 一些想法: 您可以进行边缘检测,然后执行 霍夫圆变换.如果您已经知道圆的半径,这应该很有效. 比较颜色时,您可以使用更适合模糊比较的颜色空间.例如 HSV 颜色空间 由于 ..

iRecognise 人的扫描图像中的眼睛

我想开发一个 iPhone 应用程序,该应用程序应该能够识别 QR 阅读器扫描的图像中的人的眼睛、面部和肤色. 如何在图像中检测眼睛? 解决方案 为了定位眼睛,我使用了 Roberto Valenti, Theo Gevers 在我的硕士论文中描述的算法“Accurate Eye Center Location and Tracking Using Isophote Curvatur ..
发布时间:2022-01-09 18:55:56 移动开发

KERAS 中的自身损失函数

如何定义我自己的损失函数,它需要 Keras 中先前层的权重和偏差参数? 如何从每一层获得 [W1, b1, W2, b2, Wout, bout]?在这里,我们需要传递比平常更多的变量 (y_true, y_pred).我附上了两张图片供您参考. 我需要实现这个损失函数.在此处输入图片描述 在此处输入图片描述 解决方案 为了回答你的第二部分,我使用以下代码来获取模型中每 ..
发布时间:2022-01-09 18:55:38 其他开发

如何识别图像中的球,然后在 3D 中建模(HawkEye 系统)

我们正在尝试为我们的大学项目开发​​用于板球的 HawkEye 系统.HawkEye系统中使用的流程如下: 需要从投球手的手到击球手(在球的整个飞行过程中)的不同时间点(不同点)的球图像 确定球在整个飞行过程中不同时间点的 (x,y) 坐标 将 (x,y) 坐标转换为对应的 3D 坐标 (x,y,z) 模拟球在整个飞行过程中的轨迹以及球的周围环境,包括场地、球场、三柱门、体育场 延长 ..
发布时间:2022-01-09 18:55:13 其他开发

Google Cloud Vision TEXT_DETECTION 仅适用于数字

有什么方法可以限制谷歌云视觉,尤其是 TEXT_DETECTION 类型只能识别数字?我认为这将大大改善我的结果. 我在互联网上根本找不到任何结果或提示.任何帮助表示赞赏. 解决方案 目前我们无法单独使用数字进行约束.您是否尝试过使用粒度 polybox 更新的响应流,看看这是否仍然是一个问题? ..

是否可以在图像和星座之间建立关联?

我要做的是在手机拍摄的图像和星座之间建立关系.假设我已经从 NASA 获得了每个星座的完整坐标,并且我可以将一些指定的对象识别为图像上的坐标点.我怎样才能在这些不同的坐标之间建立关系?如何指出图像和任何星座之间的几何相似性?什么样的算法可以帮助解决这种情况? 解决方案 我认为你最好比较星星的位置、亮度、颜色 轮廓图和星座星并不像你想象的那么相似.不知道您要使用哪种手机,但人眼可见 ..
发布时间:2022-01-09 18:54:46 其他开发

SIFT openCV 的关键点数?

我正在使用以下代码来提取和绘制图像中的 SIFT 关键点.但是在我的代码中,我没有指定要提取多少个关键点?所以,这完全取决于图像有多少关键点. 我想要什么:我想指定图像中最多需要 20 个关键点.如果 20 个关键点不存在,则无需进一步处理,或者如果关键点超过 20 个,则只考虑最重要的 20 个关键点. 我当前的代码: //存储将被SIFT提取的关键点向量关键点;//SI ..
发布时间:2022-01-09 18:54:38 其他开发

OpenCV中的Haar级联分类器数据:

我找不到有关在 OpenCV 中用于训练 Haar 分类器的数据的任何信息.我想知道这些分类器的生成方式、数量和方式(手动或通过程序). 您可以在 ..OpenCV2.3.1\opencv\data\haarcascades.. 目录中找到这些分类器的 xml 文件.谢谢 解决方案 这篇研究论文包含了答案 检测级联的经验分析快速对象的增强分类器Rainer Lienhart 博 ..