training-data - IT屋-程序员软件开发技术分享社区

如何在带有模式的Spacy模型中从简历中解析出生日期

我添加了多个取数模式date_of_birth，有时取数正确，但有时得到的日期不是出生日期。您可以看到我添加的patterns DOB_PATTERN = [ # dates of the form 23-12-2018 [{'IS_DIGIT': True}, {'ORTH': '/'}, {'IS_DIGIT': True}, {'ORTH': '/'}, {'I ..

发布时间：2022-06-21 16:25:33 python machine-learning data-science spacy training-data AI人工智能

使用多个数据集训练神经网络(KERAS)

我正在处理的数据集对应于各个时间序列信号。每个信号都是唯一的，具有不同的数据点总数，尽管每个信号代表相同的语义数据(速度单位为每小时英里)。我正在与凯拉斯一起工作，并试图将一个基本的神经网络与数据相匹配，只是为了对其进行评估。以下是该功能的Python代码： model = Sequential() model.add(Dense(64, activation='relu')) mo ..

发布时间：2022-02-21 23:02:56 python keras deep-learning neural-network training-data Python

Tensorflow 模型正确拟合格式数据——TypeError:无法将符号 Keras 输入/输出转换为 numpy 数组

对于 NLP 任务，我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44 ..

发布时间：2022-01-21 13:31:33 python tensorflow machine-learning dataset training-data AI人工智能

Tensorflow，train_step feed 不正确

我正在从 convnetjs 切换到 tensorflow，并且正在努力学习阅读图像和使用 tensorflow 训练 cnn 的基础知识. 我在两个文件夹中有一堆 160*120*1 的图像:train/go 和 train/no，所以我使用两个类. 不知何故，我可以了解 tf.train.slice_input_producer 和 sess.run(train_step. ..

发布时间：2022-01-21 12:24:07 image queue tensorflow training-data 其他开发

OpenCV createsamples - 无效的背景描述文件

我在我的 OPENCV_ROOT 文件夹中并在 Win-x64 中运行以下命令: opencv_createsamples -bgcolor 0 -bgthresh 0 -maxxangle 1.1 -maxyangle 1.1maxzangle 0.5 -maxidev 40 -w 80 -h 40-img ABSOLUTE_PATH_TO_POSITIVE_IMAGES_FOLDER\car ..

发布时间：2022-01-09 18:55:47 opencv computer-vision sample training-data 其他开发

OpenCV正样本尺寸?

所以我遇到了很多关于 OpenCV 的 haartraining 和级联训练工具的教程.特别是我对使用 createsamples 工具训练汽车分类器很感兴趣，但是关于 -w 和 -h 参数的说法似乎到处都是相互矛盾的，所以我很困惑.我指的是命令: $ createsamples -info samples.dat -vec samples.vec -w 20 -h 20 我有以下三个问题: ..

发布时间：2022-01-09 18:44:54 opencv image-processing computer-vision classification training-data 其他开发

Tensorflow 对象检测训练被杀死，资源匮乏?

在此处已部分询问此问题和这里没有跟进，所以也许这里不是问这个问题，但我想出了更多的信息，希望能得到这些问题的答案. 我一直在尝试在我自己的大约 1k 张照片库上训练 object_detection.我一直在使用提供的管道配置文件“ssd_inception_v2_pets.config".我相信我已经正确设置了训练数据.该程序似乎开始训练就好了.当它无法读取数据时，它会发出错误警报，我 ..

发布时间：2022-01-04 22:33:58 tensorflow linux-kernel protocol-buffers object-detection training-data 其他开发

用于情感分析的训练数据

我可以从哪里获得在企业领域中已被归类为正面/负面情绪的文档语料库?我想要大量为公司提供评论的文档，例如分析师和媒体提供的公司评论. 我发现有产品和电影评论的语料库.是否有业务领域的语料库，包括与业务语言相匹配的公司评论? 解决方案 http://www.cs.cornell.edu/home/llee/data/ http://mpqa.cs.pitt.edu/corpora/ ..

发布时间：2022-01-02 17:39:14 nlp machine-learning text-analysis sentiment-analysis training-data AI人工智能

为什么我的模型预测相同的标签?

我正在训练一个小型网络，训练似乎进行得很顺利，val loss 减少，我达到了 80 左右的验证准确率，一旦没有更多改进，它实际上停止了训练(耐心 = 10).它训练了 40 个 epoch.然而，它一直只为每个测试图像预测一个类！我尝试随机初始化 conv 层，我添加了正则化器，我从 Adam 切换到 SGD，我添加了 clipvalue，我添加了 dropouts.我也切换到了 softmax ..

发布时间：2021-12-31 17:10:31 keras neural-network deep-learning conv-neural-network training-data 其他开发

什么是 TensorFlow Estimators 中的“batches"和“steps"?它们与 epochs 有何不同?

我正在尝试使用 TensorFlow 的估算器.在文档中，以下代码用于训练和评估网络.> # 适合nn.fit(x=training_set.data，y=training_set.target，steps=5000)# 评分准确率ev = nn.evaluate(x=test_set.data, y=test_set.target, 步骤=1)loss_score = ev[“损失"]打印(“ ..

发布时间：2021-12-31 17:05:18 python machine-learning tensorflow neural-network training-data AI人工智能

如何从图像目录中为 siamese 网络创建 CaffeDB 训练数据

我需要一些帮助，从带有图像和标签文本文件的普通目录中为 siamese CNN 创建 CaffeDB.最好是用 python 的方式来做. 问题不是遍历目录并制作成对的图像.我的问题更多是从这些对中制作 CaffeDB. 到目前为止，我只使用 convert_imageset 从图像目录中创建 CaffeDB. 感谢帮助！解决方案为什么不简单地使用旧的 convert_image ..

发布时间：2021-12-27 16:52:13 neural-network deep-learning caffe conv-neural-network training-data 其他开发

参数“分层"来自方法“train_test_split"；(scikit 学习)

我正在尝试使用 scikit Learn 包中的 train_test_split，但我在使用参数 stratify 时遇到问题.以下是代码: from sklearn import cross_validation, datasetsX = iris.data[:,:2]y = iris.targetcross_validation.train_test_split(X,y,stratify= ..

发布时间：2021-12-25 14:50:07 split scikit-learn training-data test-data 其他开发

在拆分训练和测试数据之前或之后标准化数据?

我想将我的数据分成训练集和测试集，我应该在拆分之前还是之后对数据应用标准化?在构建预测模型时有什么不同吗? 解决方案您首先需要将数据拆分为训练集和测试集(验证集也可能有用). 不要忘记测试数据点代表真实世界的数据.解释(或预测)变量的特征归一化(或数据标准化)是一种用于通过减去均值并除以方差来使数据居中和归一化的技术.如果您采用整个数据集的均值和方差，您会将未来信息引入训练解释变量 ..

发布时间：2021-12-14 09:49:49 machine-learning data-science normalization training-data train-test-split AI人工智能

R:如何将数据框拆分为训练、验证和测试集?

我正在使用 R 进行机器学习.遵循标准的机器学习方法，我想将我的数据随机分成训练、验证和测试数据集.我如何在 R 中做到这一点? 我知道有一些关于如何拆分为 2 个数据集的相关问题(例如这个 post)，但是对于 3 个拆分数据集如何执行它并不明显.顺便说一下，正确的方法是使用 3 个数据集(包括一个用于调整超参数的验证集). 解决方案这种针对两个组的链接方法(使用 floor)不 ..

发布时间：2021-12-14 09:32:49 r machine-learning training-data r-faq AI人工智能

基于 HOG 特征的 SVM 分类器用于“对象检测"在 OpenCV 中

我有一个项目，我想检测图像中的对象；我的目标是使用 HOG 功能.通过使用 OpenCV SVM 实现，我可以找到检测人的代码，并且我阅读了一些关于调整参数以检测对象而不是人的论文.不幸的是，由于一些原因我不能这样做；首先，我可能是错误地调整了参数，其次，我不是一个好的 C++ 程序员，但我必须用 C++/OpenCV 来做... 这里你可以找到使用 C++/OpenCV 检测人的 HOG 特征 ..

发布时间：2021-12-10 21:02:53 c++ opencv svm object-recognition training-data C/C++开发

将张量拆分为训练集和测试集

假设我已经使用 TextLineReader 读取了文本文件.有没有办法在 Tensorflow 中将其拆分为训练集和测试集?类似的东西: def read_my_file_format(filename_queue):读者 = tf.TextLineReader()键，record_string = reader.read(filename_queue)raw_features, label ..

发布时间：2021-12-09 22:39:31 tensorflow cross-validation training-data 其他开发

在 Android 上训练 Tesseract

我正在使用 tess-two 库在 Android 上进行 OCR 识别.我想在 Android 上创建训练数据.我遵循了这个 link 并在 linux 系统上成功创建了训练数据.如何使用 tess-two 或任何其他库在 Android 上做同样的事情? 解决方案适用于 Android 的 tess-two 库使用与在普通 Linux 系统上运行相同的 Tesseract 代码和相同 ..

发布时间：2021-11-15 03:36:19 android api ocr tesseract training-data 移动开发

将数据拆分为测试和训练，包括

如何根据数据帧变量将包含多个视频文件的文件夹拆分为 train 和 test 文件夹，这些变量告诉我哪个视频应该在 train 文件夹中，哪个视频应该在 test 文件夹中?(在 Python 3.0 中).其中多个视频位于不同的类别文件夹中每个视频都可以在例如以下类别目录中找到: C:\Users\Me\Videos\aC:\用户\我\视频\b 这意味着对于每个类别，我都需要一个“t ..

发布时间：2021-09-09 19:03:07 python-3.x dataframe video split training-data 其他开发

如何在交叉验证期间获取实例索引

我正在做一个二元分类.我可以知道如何在进行 K 折交叉验证时提取训练数据框的错误分类或分类实例的真实索引吗?我没有找到这个问题的答案此处. 我按照所述获得了折叠中的值这里: skf=StratifiedKFold(n_splits=10,random_state=111,shuffle=False)cv_results = cross_val_score(模型，X_train，y_tr ..

发布时间：2021-09-09 19:03:03 python classification cross-validation training-data indices Python

Tensorflow 模型正确拟合格式数据--TypeError:无法将符号 Keras 输入/输出转换为 numpy 数组

对于 NLP 任务，我的输入数据集被转换为如下所示:整数列表.特征和标签是同一个数据集. >>>training_data = [[ 0 4 79 3179 11 44 8 1 11245 173 152 101 1138 1079][ 0 0 4 79 3179 11 44 8 11566 173 152 81 1138 1079][ 0 0 0 0 0 0 0 9 15 333 44 ..

发布时间：2021-09-09 19:03:00 python tensorflow machine-learning dataset training-data AI人工智能

training-data相关内容