training-data相关内容

使用多个数据集训练神经网络(KERAS)

我正在处理的数据集对应于各个时间序列信号。每个信号都是唯一的,具有不同的数据点总数,尽管每个信号代表相同的语义数据(速度单位为每小时英里)。 我正在与凯拉斯一起工作,并试图将一个基本的神经网络与数据相匹配,只是为了对其进行评估。以下是该功能的Python代码: model = Sequential() model.add(Dense(64, activation='relu')) mo ..
发布时间:2022-02-21 23:02:56 Python

Tensorflow 模型正确拟合格式数据——TypeError:无法将符号 Keras 输入/输出转换为 numpy 数组

对于 NLP 任务,我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44​​ 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44​​ 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44 ..

Tensorflow,train_step feed 不正确

我正在从 convnetjs 切换到 tensorflow,并且正在努力学习阅读图像和使用 tensorflow 训练 cnn 的基础知识. 我在两个文件夹中有一堆 160*120*1 的图像:train/go 和 train/no,所以我使用两个类. 不知何故,我可以了解 tf.train.slice_input_producer 和 sess.run(train_step. ..
发布时间:2022-01-21 12:24:07 其他开发

OpenCV正样本尺寸?

所以我遇到了很多关于 OpenCV 的 haartraining 和级联训练工具的教程.特别是我对使用 createsamples 工具训练汽车分类器很感兴趣,但是关于 -w 和 -h 参数的说法似乎到处都是相互矛盾的,所以我很困惑.我指的是命令: $ createsamples -info samples.dat -vec samples.vec -w 20 -h 20 我有以下三个问题: ..

Tensorflow 对象检测训练被杀死,资源匮乏?

在此处已部分询问此问题和 这里 没有跟进,所以也许这里不是问这个问题,但我想出了更多的信息,希望能得到这些问题的答案. 我一直在尝试在我自己的大约 1k 张照片库上训练 object_detection.我一直在使用提供的管道配置文件“ssd_inception_v2_pets.config".我相信我已经正确设置了训练数据.该程序似乎开始训练就好了.当它无法读取数据时,它会发出错误警报,我 ..

用于情感分析的训练数据

我可以从哪里获得在企业领域中已被归类为正面/负面情绪的文档语料库?我想要大量为公司提供评论的文档,例如分析师和媒体提供的公司评论. 我发现有产品和电影评论的语料库.是否有业务领域的语料库,包括与业务语言相匹配的公司评论? 解决方案 http://www.cs.cornell.edu/home/llee/data/ http://mpqa.cs.pitt.edu/corpora/ ..

为什么我的模型预测相同的标签?

我正在训练一个小型网络,训练似乎进行得很顺利,val loss 减少,我达到了 80 左右的验证准确率,一旦没有更多改进,它实际上停止了训练(耐心 = 10).它训练了 40 个 epoch.然而,它一直只为每个测试图像预测一个类!我尝试随机初始化 conv 层,我添加了正则化器,我从 Adam 切换到 SGD,我添加了 clipvalue,我添加了 dropouts.我也切换到了 softmax ..

什么是 TensorFlow Estimators 中的“batches"和“steps"?它们与 epochs 有何不同?

我正在尝试使用 TensorFlow 的估算器.在文档中,以下代码用于训练和评估网络.> # 适合nn.fit(x=training_set.data,y=training_set.target,steps=5000)# 评分准确率ev = nn.evaluate(x=test_set.data, y=test_set.target, 步骤=1)loss_score = ev[“损失"]打印(“ ..

如何从图像目录中为 siamese 网络创建 CaffeDB 训练数据

我需要一些帮助,从带有图像和标签文本文件的普通目录中为 siamese CNN 创建 CaffeDB.最好是用 python 的方式来做. 问题不是遍历目录并制作成对的图像.我的问题更多是从这些对中制作 CaffeDB. 到目前为止,我只使用 convert_imageset 从图像目录中创建 CaffeDB. 感谢帮助! 解决方案 为什么不简单地使用旧的 convert_image ..

在拆分训练和测试数据之前或之后标准化数据?

我想将我的数据分成训练集和测试集,我应该在拆分之前还是之后对数据应用标准化?在构建预测模型时有什么不同吗? 解决方案 您首先需要将数据拆分为训练集和测试集(验证集也可能有用). 不要忘记测试数据点代表真实世界的数据.解释(或预测)变量的特征归一化(或数据标准化)是一种用于通过减去均值并除以方差来使数据居中和归一化的技术.如果您采用整个数据集的均值和方差,您会将未来信息引入训练解释变量 ..

R:如何将数据框拆分为训练、验证和测试集?

我正在使用 R 进行机器学习.遵循标准的机器学习方法,我想将我的数据随机分成训练、验证和测试数据集.我如何在 R 中做到这一点? 我知道有一些关于如何拆分为 2 个数据集的相关问题(例如这个 post),但是对于 3 个拆分数据集如何执行它并不明显.顺便说一下,正确的方法是使用 3 个数据集(包括一个用于调整超参数的验证集). 解决方案 这种针对两个组的链接方法(使用 floor)不 ..
发布时间:2021-12-14 09:32:49 AI人工智能

基于 HOG 特征的 SVM 分类器用于“对象检测"在 OpenCV 中

我有一个项目,我想检测图像中的对象;我的目标是使用 HOG 功能.通过使用 OpenCV SVM 实现,我可以找到检测人的代码,并且我阅读了一些关于调整参数以检测对象而不是人的论文.不幸的是,由于一些原因我不能这样做;首先,我可能是错误地调整了参数,其次,我不是一个好的 C++ 程序员,但我必须用 C++/OpenCV 来做... 这里 你可以找到使用 C++/OpenCV 检测人的 HOG 特征 ..
发布时间:2021-12-10 21:02:53 C/C++开发

在 Android 上训练 Tesseract

我正在使用 tess-two 库在 Android 上进行 OCR 识别.我想在 Android 上创建训练数据.我遵循了这个 link 并在 linux 系统上成功创建了训练数据.如何使用 tess-two 或任何其他库在 Android 上做同样的事情? 解决方案 适用于 Android 的 tess-two 库使用与在普通 Linux 系统上运行相同的 Tesseract 代码和相同 ..
发布时间:2021-11-15 03:36:19 移动开发

将数据拆分为测试和训练,包括

如何根据数据帧变量将包含多个视频文件的文件夹拆分为 train 和 test 文件夹,这些变量告诉我哪个视频应该在 train 文件夹中,哪个视频应该在 test 文件夹中?(在 Python 3.0 中).其中多个视频位于不同的类别文件夹中 每个视频都可以在例如以下类别目录中找到: C:\Users\Me\Videos\aC:\用户\我\视频\b 这意味着对于每个类别,我都需要一个“t ..
发布时间:2021-09-09 19:03:07 其他开发

如何在交叉验证期间获取实例索引

我正在做一个二元分类.我可以知道如何在进行 K 折交叉验证时提取训练数据框的错误分类或分类实例的真实索引吗?我没有找到这个问题的答案 此处. 我按照所述获得了折叠中的值 这里: skf=StratifiedKFold(n_splits=10,random_state=111,shuffle=False)cv_results = cross_val_score(模型,X_train,y_tr ..
发布时间:2021-09-09 19:03:03 Python

Tensorflow 模型正确拟合格式数据--TypeError:无法将符号 Keras 输入/输出转换为 numpy 数组

对于 NLP 任务,我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44​​ 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44​​ 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44 ..