image-recognition相关内容

训练SVM是什么意思

我是图像处理的新手.在我的项目中,我正在做“使用SVM的图像分类器".我的最终软件是“我选择一些图像并将其作为输入输入到软件中,它将对该图像进行分类.如果我给出动物的图像,它将适当地将其分类为猫或蛇". 当我在Google上搜索它时,它说“首先您需要训练SVM" 培训SVM是什么意思? 在我的情况下,对SVM的实际输入是什么(图像分类)? SVM只是对图像进行分类的分类器. ..

如何使用神经网络识别手写数字

我遵循了一个使用正弦函数"使用神经网络识别手写数字创建简单神经网络的教程. a>",该教程非常简单,提供了理论和代码示例. 问题在于它没有提供使用例如,我有以下数字,我想从下图中将其识别为0 要识别数字需要使用其他技术,例如theano或tensorflow? 美好的一天! 解决方案 在以下示例的基础上,您可以在NeuralNetwork类中添加预测功能: def predi ..

使用Tensorflow和Inception V3预训练模型训练高清晰度图像

我正在对要转换为图像的PDF文档进行图像分类.我正在使用tensorflow inception v3预先训练的模型并尝试在tensorflow tuto 后使用我自己的类别重新训练最后一层.我每个类别只有1000个训练图像,只有4个类别.通过200k次迭代,我可以达到成功分类的90%,这虽然不错,但仍然需要一些工作: 这里的问题是这种经过预先训练的模型仅需要300 * 300p的图像作为输入.显 ..

寻找一些python机器学习建议

我对涉足Python和机器学习/自动数据输入感兴趣.但是,随着研究的进展,我意识到有很多不同的技术,每种技术都有自己的优势. 我已经决定,如果我朝相反的方向学习,我可能会走得更远. IE.选择一个问题/任务并通过解决/完成它来学习. 我有时不得不处理传真发票,我希望制作一个程序,一旦我扫描然后输入,便可以为我输入. 传真基本上由2个相同的表组成.每行表示一个单独的工人.第一列是工 ..

暗网YOLO图像大小

我正在尝试在Darknet YOLO v2中训练自定义对象分类器 https://pjreddie.com/darknet/yolo/ 我收集了一个图像数据集,其中大多数图像为6000 x 4000 px,分辨率也较低. 我需要在训练平方之前调整图像的大小吗? 我发现配置使用: [net] batch=64 subdivisions=8 height=416 width=4 ..

如何在同一图像中定位多个对象?

我是TensorFlow的新手. 当前,我正在TensorFlow网站上测试一些分类示例“卷积神经网络",它说明了如何将输入图像分类为预定义的类,但是问题是:我不知道如何找到多个同一张图片中的对象.例如,我有一个包含猫和狗的输入图像,并且希望我的图形在输出中显示图像中同时存在“猫和狗". 解决方案 好问题.检测同一图像中的多个对象沸腾本质上是一个“分割问题".两种不错且流行的算法是 ..

在直接比较中,为什么tensorflow的准确性比keras差?

我直接比较了具有相同参数和相同数据集(MNIST)的TensorFlow与Keras. 奇怪的是Keras在10个周期内实现96%的性能,而TensorFlow在10个周期内实现约70%的性能.我在同一实例中多次运行了此代码,并且总是会出现这种不一致的情况. 即使为TensorFlow设置了50个纪元,最终性能也达到了90%. 代码: import keras from k ..

如何在已保存的Keras顺序模型中添加新类

我有10个类别的数据集,因此我的准确率达到了85%,在保存的模型上达到了相同的准确度. 现在我想添加一个新类,如何向保存的模型中添加一个新类. 我尝试删除最后一层并进行训练,但是模型变得过拟合,并且在预测中,每个Images都显示相同的结果(新添加的类). 这就是我所做的 model.pop() base_model_layers = model.output pred = Dense ..

层conv2d_3的输入不是符号张量

嗨,我正在为一类分类构建图像分类器,其中在运行此模型时使用了自动编码器,但出现此错误(ValueError:使用非符号张量的输入调用了层conv2d_3.已收到类型:.完整输入:[(128,128,3)].该层的所有输入都应为张量.) num_of_samples = img_data.shape[0] labels = np.ones((num_of_samples,),dtype='in ..
发布时间:2020-04-25 09:42:11 其他开发

如何在Jupyter Notebook中训练和测试数据集以及如何将标签从整数转换为向量?

这是我的代码 使用75%的数据将数据分为训练和测试分组 用于培训的数据,其余25%用于测试 (trainX, testX, trainY, testY) = train_test_split(data, labels, test_size=0.25, random_state=42) 将标签从整数转换为向量 trainY = to_categorical(tra ..

PHP / jQuery / JavaScript中的免费OCR处理API

是否有免费的PHP OCR API,在PHP,jQuery或JavaScript中有详细记录? 我正在为iOS编写一个Web应用程序喜欢利用iOS 6 Safari中的新照片上传API进行OCR图像处理。 非常感谢! :) (编辑:哦,像Google-Googles这样的用于图像识别的API也足够了,它不一定是OCR ,虽然我会更喜欢它。:) 解决方案 Tesseract ..
发布时间:2019-06-05 22:34:09 PHP

使用python API进行的培训作为Java API中LabelImage模块的输入?

我有java tensorflow API的问题。我使用python tensorflow API运行训练,生成文件output_graph.pb和output_labels.txt。现在由于某种原因,我想使用这些文件作为java tensorflow API中LabelImage模块的输入。我认为一切都会正常工作,因为该模块只需要一个.pb和一个.txt。然而,当我运行模块时,我收到此错误: ..
发布时间:2018-12-17 10:00:28 Java开发

识别图像中的数字

我一直在寻找网上图片中数字识别的资源。我发现许多链接提供了关于该主题的大量资源。但不幸的是,它比帮助更令人困惑,我不知道从哪里开始。 我有一个包含5个数字的图像,没有受到干扰(没有验证码)或类似的东西)。这些数字在白色背景上是黑色的,用标准字体书写。 我的第一步是分开数字。我目前使用的算法非常简单,它只检查列是否完全是白色,因此是空格。然后它修剪每个角色,使其周围没有白色边框。这很有效 ..
发布时间:2018-12-10 12:02:25 Java开发

用于图像模式识别的java框架?

我正在寻找一个Java框架来帮助进行一些特定于图像的数据挖掘。我们有一组历史图像,我想分类和分类。我希望能找到类似weka http://www.cs.waikato。 ac.nz/ml/weka/ 或Marsyas http://marsyas.sness.net 但更多特定于筛选图像数据以找到模式。有什么建议吗? 解决方案 如何使用 OpenCV 库进行处理?从技术上讲,Process ..
发布时间:2018-12-05 09:48:01 Java开发

用java查找图片中的图片?

我想要的是以图片的形式分析来自屏幕的输入。我希望能够在更大的图像中识别图像的一部分,并在更大的图像中获得其坐标。示例: 必须位于 结果将是大图片中图片的右上角和大图片中左下角的部分。正如你所看到的,图片的白色部分是无关紧要的,我基本上只需要绿色框架。有没有可以为我做这样的事情的图书馆?运行时不是一个问题。 我想要做的就是生成一些随机像素坐标并识别该位置的大图片中的颜色,以便以后快 ..
发布时间:2018-12-05 09:43:58 Java开发

React Native中文本的图像识别

这可能是一个疯狂的问题,但我已经看过应用程序。是否有任何类型的API可用于识别图像中的文本(追逐识别支票上的数字的方式)或者,是否有可用于搜索(比如谷歌)基于图像的信息的API ?例如,如果我拍了一张商业标识的图片,google会搜索符合该商标的商家信息吗? 我知道很疯狂的问题,但我想知道是否甚至可以做到。如果可以,它可以与React Native一起使用吗?谢谢! 解决方案 Rea ..
发布时间:2018-09-20 21:14:17 移动开发

在iOS上非常简单的图像识别

是否可以进行非常基本的图像识别,将图像与图像数据库进行比较,并确定数据库中哪个图像最匹配?我不需要对任何图像进行任何处理,只需区分有限的图像列表。 是否有任何库可以实现这一点?或者它是否需要从头开始构建图像识别器? 解决方案 看看OpenCV。 OpenCV并未针对iOS进行优化,但它可以是一个良好的开端。如果我理解你在做什么是不容易实现,我不知道你是否能找到OpenCV以外的开源库 ..
发布时间:2018-09-18 09:33:47 移动开发

使用R中的CNN MXnet进行标量输出的图像识别

所以我尝试使用CN中的mxnet包使用CNN来尝试根据图像预测标量输出(在我的情况下等待时间)。 然而,当我这样做时,我得到相同的结果输出(它预测相同的数字,这可能只是所有结果的平均值)。如何让它正确预测标量输出。 此外,我的图像已经通过灰度化并转换为下面的像素格式进行了预处理。 我本质上是使用图像来预测等待时间,这就是为什么我的train_y是以秒为单位的当前等待时间,因此为什么我 ..

OpenCV只围绕大轮廓绘制矩形?

第一次发帖,希望我以正确的方式放置代码。 我正在尝试检测和计算视频中的车辆,因此如果您查看下面的代码,我会在阈值处理和扩张后找到图像的轮廓,并且然后我使用drawContours和矩形在检测到的轮廓周围绘制一个框。 我试图在drawContours / rectangle if语句中放置一个过滤器,说明是否有区域矩形不大于40,000,然后不要绘制它。 现在,如果你看看我附上的图 ..