training-data相关内容

图书馆Neurolab培训newff

我在使用python和Neurolab方面还很陌生,并且在训练前馈神经网络时遇到了问题.我建立了如下网络: net = nl.net.newff([[-1,1]]*64, [60,1]) net.init() testerr = net.train(InputT, TargetT, epochs=100, show=1) ,我的目标输出是0到4之间的向量. 当我使用控制台中的nl.tra ..
发布时间:2020-05-17 19:23:00 Python

如何在映像目录外为暹罗网络创建CaffeDB培训数据

我需要一些帮助,以从带有图像和标签文本文件的纯目录中为暹罗CNN创建CaffeDB.最好的办法是使用python方法. 问题不在于浏览目录并制作图像对.我的问题更多是从这些对中创建一个CaffeDB. 到目前为止,我仅使用 convert_imageset 从映像目录中创建CaffeDB. 感谢您的帮助! 解决方案 为什么不简单地使用旧的convert_imagest制作两个数据集? ..

--pass在Python VowpalWabbit中有什么作用?

-passes标志是训练通过的次数.但是,尚不清楚通过概念在训练Python VW模型(例如在for循环内)时意味着什么. 例如如果我正在像这样的for循环中训练一个示例的示例,则该示例: for line in train: model.learn(line) 如果每个训练样本仅从中学习一次,怎么会有多次通过? 解决方案 在Python中,passes选项仅在使用 ..
发布时间:2020-05-10 19:01:03 其他开发

Matlab预测功能不起作用

我正在尝试在具有100个维度的数据上训练线性SVM.我有80个实例需要培训.我在MATLAB中使用fitcsvm函数训练SVM,并在训练数据上使用predict检查该函数.当我使用SVM对训练数据进行分类时,所有数据点仅被分类为一类. SVM = fitcsvm(votes,b,'ClassNames',unique(b)'); predict(SVM,votes); 这给出了全0的输出 ..
发布时间:2020-05-06 15:40:24 其他开发

从Matlab脚本调用Java函数

我正在尝试从Matlab脚本调用Java函数,我尝试了网站中提供的所有解决方案,但没有遇到任何问题. 我的课程很简单: package testMatlabInterface; public class TestFunction { private double value; public TestFunction() { value=0; } pu ..
发布时间:2020-05-06 15:34:02 Java开发

在Matlab中省去crossvalind

我已经提取了用于男性和女性图片的HOG功能,现在,我正在尝试使用留一法" 对我的数据进行分类. 由于在Matlab中编写代码的标准方法是: [Train, Test] = crossvalind('LeaveMOut', N, M); 我应该写些什么而不是N和M? 另外,我应该在循环内还是循环外编写上述代码语句? 这是我的代码,其中有用于男性(80张图像)和女性(80张图像)的培训文件夹 ..
发布时间:2020-05-06 15:10:54 其他开发

相同形式的数据集具有2种不同的形状

我对机器学习非常陌生,只是在掌握技术.因此,我正在尝试使用具有4个特征和目标特征/类(真值 1 或 0 )的数据集在以下分类器上训练模型. 分类 SGD分类器 随机森林分类器 线性支持向量分类器 高斯过程分类器 我正在以下数据集上训练模型[部分数据集如下所示. 培训集:train_sop_truth.csv Subject,Predicate,Object,Co ..

如何向高管证明预测模型的可靠性?

我训练了500台设备中的数据以预测其性能.然后,我将训练有素的模型应用于另外500个设备的测试数据集,并显示出相当不错的预测结果.现在,我的高管希望我证明这种模型不仅可以在500台设备上运行,而且可以在一百万台设备上运行.显然,我们没有一百万台设备的数据.如果模型不可靠,他们希望我发现所需的火车数据量,以便对一百万个设备进行可靠的预测.我该如何应对这些没有统计分析和建模背景的高管?有什么建议?谢谢 ..

训练网络时,Caffe在验证阶段的测试准确性是恒定的

我想知道为什么我的测试精度始终保持为0.5的恒定值.我使用CaffeNet网络时,仅更改了配置 num_output:2 的完全连接层的参数. 我的训练集包含1000个阳性和1000个阴性示例,而我的验证集也包含1000个阳性和1000个阴性示例.数据集包含人物图像(全身RGB彩色).我已经在数据层中定义了平均文件和小数位值.我的网络经过训练可以学习一个人或不一个人(二进制分类器). ..
发布时间:2020-05-04 09:55:22 AI人工智能

机器学习培训与学习测试数据分割方法

我正在运行一个随机森林分类模型,最初将数据分为训练(80%)和测试(20%).但是,该预测有太多的误报,我认为这是因为训练数据中存在太多干扰,所以我决定采用其他方法拆分数据,这就是我的处理方法. 由于我认为较高的误报是由于列车数据中的噪声引起的,所以我使列车数据具有相等数量的目标变量.例如,如果我有10,000行的数据,而目标变量是8,000(0)和2,000(1),则我的训练数据总共为4, ..

如何从图像生成Tiff/Box文件以在Windows中训练Tesseract

我正在尝试在Windows中训练Tesseract,为此,我需要一个成对的tiff/box文件,并尝试使用jTessBoxEditor创建它,但它不接受图像作为输入.我也尝试过boxFactory,但无法正常运行.有谁知道从图像创建配对的最佳工具是什么? 谢谢 解决方案 如果您具有jTessBoxEditor,则您具有Tesseract bin文件.转到jTessBoxEditor的 ..
发布时间:2020-05-04 09:46:26 AI人工智能

插入子集上的r插入符号估计参数适合完整数据

我有一个550k项的数据集,我将500k用于训练而将50k用于测试.在训练阶段,必须建立每种算法的参数值的“最佳"组合.与其使用整个500k,我不愿意使用一个子集,但是在训练最终模型时,我会使用“最佳"组合,而是使用整个500k.在伪代码中,任务看起来像: subset the 500k training data to 50k for each combination of model p ..
发布时间:2020-05-04 09:22:00 AI人工智能

SVM分类-每个类别的最小输入集数

我正在尝试构建一个应用程序来检测图像,这些图像是来自网页的广告.一旦检测到这些内容,我将不允许它们在客户端显示. 在我对这个Stackoverflow问题的帮助下,我认为支持向量机是实现我目标的最佳方法. 因此,我已经为SVM和SMO编写了代码.我从UCI数据存储库中获得的数据集具有3280个实例(链接到数据集),其中大约有400种来自代表广告图像的类,其余代表非广告图像. 现在 ..
发布时间:2020-05-04 09:10:49 AI人工智能

情绪分析训练数据

在哪里可以获得在公司范围内已被归类为正面/负面情绪的文档集?我想要一大堆文档,这些文档为公司提供评论,例如分析师和媒体对公司的评论. 我发现对产品和电影有评论的语料库.业务领域是否有语料库,包括与业务语言相匹配的公司评论? 解决方案 http://www.cs.cornell.edu/home/llee/data/ http://mpqa.cs.pitt.edu/corpora ..

R:如何将数据框架分为训练,验证和测试集?

我正在使用R进行机器学习.遵循标准的机器学习方法,我想将我的数据随机分为训练,验证和测试数据集.如何在R中做到这一点? 我知道有关如何拆分为2个数据集的一些相关问题(例如,此解决方案 针对两个组的这种链接方法(使用floor)并不自然地扩展到三个.我愿意 spec = c(train = .6, test = .2, validate = .2) g = sample(cut( ..
发布时间:2020-05-04 08:52:59 AI人工智能

如何使用图像数据而不是字体文件训练tesseract 4?

我正在尝试使用图像而不是字体来训练Tesseract 4. 在文档中,他们只是在解释使用字体的方法,而不是图像. 当我使用Tesseract的早期版本时,我知道它是如何工作的,但是我没有得到如何使用box/tiff文件进行我调查了 tesstrain .sh ,用于生成 LSTM 训练数据,但找不到任何有用的信息.有什么想法吗? 解决方案 在 https:上克隆tesstrai ..
发布时间:2020-05-04 06:21:38 其他开发

在训练神经元网络之初,训练数据与验证数据之间的损失差异有多重要?

简短问题: 培训开始时(第一个时期)验证与培训损失之间的差异是否很好地指示了应使用的数据量? 例如,增加数据量直到开始时的差异尽可能小是个好方法吗?这样可以节省我的时间和计算量. 背景: 我正在研究一个过快拟合的神经元网络.在应用了许多不同的技术(例如,辍学,批量标准化,降低学习率,减小批量大小,增加数据种类,减少图层,增加过滤器大小...)之后的最佳结果仍然非常糟糕. 虽然训练损失减少得很 ..