training-data相关内容
我添加了多个取数模式date_of_birth,有时取数正确,但有时得到的日期不是出生日期。 您可以看到我添加的patterns DOB_PATTERN = [ # dates of the form 23-12-2018 [{'IS_DIGIT': True}, {'ORTH': '/'}, {'IS_DIGIT': True}, {'ORTH': '/'}, {'I
..
我正在处理的数据集对应于各个时间序列信号。每个信号都是唯一的,具有不同的数据点总数,尽管每个信号代表相同的语义数据(速度单位为每小时英里)。 我正在与凯拉斯一起工作,并试图将一个基本的神经网络与数据相匹配,只是为了对其进行评估。以下是该功能的Python代码: model = Sequential() model.add(Dense(64, activation='relu')) mo
..
对于 NLP 任务,我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44
..
我正在从 convnetjs 切换到 tensorflow,并且正在努力学习阅读图像和使用 tensorflow 训练 cnn 的基础知识. 我在两个文件夹中有一堆 160*120*1 的图像:train/go 和 train/no,所以我使用两个类. 不知何故,我可以了解 tf.train.slice_input_producer 和 sess.run(train_step.
..
我在我的 OPENCV_ROOT 文件夹中并在 Win-x64 中运行以下命令: opencv_createsamples -bgcolor 0 -bgthresh 0 -maxxangle 1.1 -maxyangle 1.1maxzangle 0.5 -maxidev 40 -w 80 -h 40-img ABSOLUTE_PATH_TO_POSITIVE_IMAGES_FOLDER\car
..
所以我遇到了很多关于 OpenCV 的 haartraining 和级联训练工具的教程.特别是我对使用 createsamples 工具训练汽车分类器很感兴趣,但是关于 -w 和 -h 参数的说法似乎到处都是相互矛盾的,所以我很困惑.我指的是命令: $ createsamples -info samples.dat -vec samples.vec -w 20 -h 20 我有以下三个问题:
..
在此处已部分询问此问题和 这里 没有跟进,所以也许这里不是问这个问题,但我想出了更多的信息,希望能得到这些问题的答案. 我一直在尝试在我自己的大约 1k 张照片库上训练 object_detection.我一直在使用提供的管道配置文件“ssd_inception_v2_pets.config".我相信我已经正确设置了训练数据.该程序似乎开始训练就好了.当它无法读取数据时,它会发出错误警报,我
..
我可以从哪里获得在企业领域中已被归类为正面/负面情绪的文档语料库?我想要大量为公司提供评论的文档,例如分析师和媒体提供的公司评论. 我发现有产品和电影评论的语料库.是否有业务领域的语料库,包括与业务语言相匹配的公司评论? 解决方案 http://www.cs.cornell.edu/home/llee/data/ http://mpqa.cs.pitt.edu/corpora/
..
我正在训练一个小型网络,训练似乎进行得很顺利,val loss 减少,我达到了 80 左右的验证准确率,一旦没有更多改进,它实际上停止了训练(耐心 = 10).它训练了 40 个 epoch.然而,它一直只为每个测试图像预测一个类!我尝试随机初始化 conv 层,我添加了正则化器,我从 Adam 切换到 SGD,我添加了 clipvalue,我添加了 dropouts.我也切换到了 softmax
..
我正在尝试使用 TensorFlow 的估算器.在文档中,以下代码用于训练和评估网络.> # 适合nn.fit(x=training_set.data,y=training_set.target,steps=5000)# 评分准确率ev = nn.evaluate(x=test_set.data, y=test_set.target, 步骤=1)loss_score = ev[“损失"]打印(“
..
我需要一些帮助,从带有图像和标签文本文件的普通目录中为 siamese CNN 创建 CaffeDB.最好是用 python 的方式来做. 问题不是遍历目录并制作成对的图像.我的问题更多是从这些对中制作 CaffeDB. 到目前为止,我只使用 convert_imageset 从图像目录中创建 CaffeDB. 感谢帮助! 解决方案 为什么不简单地使用旧的 convert_image
..
我正在尝试使用 scikit Learn 包中的 train_test_split,但我在使用参数 stratify 时遇到问题.以下是代码: from sklearn import cross_validation, datasetsX = iris.data[:,:2]y = iris.targetcross_validation.train_test_split(X,y,stratify=
..
我想将我的数据分成训练集和测试集,我应该在拆分之前还是之后对数据应用标准化?在构建预测模型时有什么不同吗? 解决方案 您首先需要将数据拆分为训练集和测试集(验证集也可能有用). 不要忘记测试数据点代表真实世界的数据.解释(或预测)变量的特征归一化(或数据标准化)是一种用于通过减去均值并除以方差来使数据居中和归一化的技术.如果您采用整个数据集的均值和方差,您会将未来信息引入训练解释变量
..
我正在使用 R 进行机器学习.遵循标准的机器学习方法,我想将我的数据随机分成训练、验证和测试数据集.我如何在 R 中做到这一点? 我知道有一些关于如何拆分为 2 个数据集的相关问题(例如这个 post),但是对于 3 个拆分数据集如何执行它并不明显.顺便说一下,正确的方法是使用 3 个数据集(包括一个用于调整超参数的验证集). 解决方案 这种针对两个组的链接方法(使用 floor)不
..
我有一个项目,我想检测图像中的对象;我的目标是使用 HOG 功能.通过使用 OpenCV SVM 实现,我可以找到检测人的代码,并且我阅读了一些关于调整参数以检测对象而不是人的论文.不幸的是,由于一些原因我不能这样做;首先,我可能是错误地调整了参数,其次,我不是一个好的 C++ 程序员,但我必须用 C++/OpenCV 来做... 这里 你可以找到使用 C++/OpenCV 检测人的 HOG 特征
..
假设我已经使用 TextLineReader 读取了文本文件.有没有办法在 Tensorflow 中将其拆分为训练集和测试集?类似的东西: def read_my_file_format(filename_queue):读者 = tf.TextLineReader()键,record_string = reader.read(filename_queue)raw_features, label
..
我正在使用 tess-two 库在 Android 上进行 OCR 识别.我想在 Android 上创建训练数据.我遵循了这个 link 并在 linux 系统上成功创建了训练数据.如何使用 tess-two 或任何其他库在 Android 上做同样的事情? 解决方案 适用于 Android 的 tess-two 库使用与在普通 Linux 系统上运行相同的 Tesseract 代码和相同
..
如何根据数据帧变量将包含多个视频文件的文件夹拆分为 train 和 test 文件夹,这些变量告诉我哪个视频应该在 train 文件夹中,哪个视频应该在 test 文件夹中?(在 Python 3.0 中).其中多个视频位于不同的类别文件夹中 每个视频都可以在例如以下类别目录中找到: C:\Users\Me\Videos\aC:\用户\我\视频\b 这意味着对于每个类别,我都需要一个“t
..
我正在做一个二元分类.我可以知道如何在进行 K 折交叉验证时提取训练数据框的错误分类或分类实例的真实索引吗?我没有找到这个问题的答案 此处. 我按照所述获得了折叠中的值 这里: skf=StratifiedKFold(n_splits=10,random_state=111,shuffle=False)cv_results = cross_val_score(模型,X_train,y_tr
..
对于 NLP 任务,我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44
..