multilabel-classification - IT屋-程序员软件开发技术分享社区

多标签分类KERAS度量

在KERAS中，哪些指标更适合多标签分类：accuracy或categorical_accuracy？显然，在这种情况下，最后一个激活函数是sigmoid，而AS损失函数是binary_crossentropy。推荐答案我不会对类别不平衡的分类任务使用准确性。尤其是对于多标签任务，您可能会认为您的大多数标签都是假的。也就是说，与所有可能的标签的基数相比，每个数据点只能有一小部分标 ..

发布时间：2022-06-28 21:08:49 machine-learning keras classification multilabel-classification AI人工智能

我有一个多标签分类问题，我正试图用 Pytorch 中的 CNN 解决这个问题.我有 80,000 个训练示例和 7900 个类；每个示例可以同时属于多个类，每个示例的平均类数为 130. 问题是我的数据集非常不平衡.对于某些课程，我只有大约 900 个示例，大约为 1%.对于“过度代表"的类，我有大约 12000 个示例(15%).当我训练模型时，我使用来自 pytorch 的 BCEWi ..

发布时间：2022-01-06 19:09:48 pytorch multilabel-classification imbalanced-data 其他开发

带有多标签图像的 caffe

我有一个包含多个标签的图像数据集；数据集中有 100 个类，每个图像有 1 到 5 个标签与之关联. 我正在按照以下 URL 中的说明进行操作: https://github.com/BVLC/caffe/issues/550 它说我需要生成一个文本文件，列出图像及其标签，如 /home/my_test_dir/picture-foo.jpg 0/home/my_test_di ..

发布时间：2021-12-27 16:56:12 neural-network deep-learning caffe multilabel-classification 其他开发

Keras 如何处理多标签分类?

我不确定如何解释 Keras 在以下情况下的默认行为: 我的 Y (ground truth) 是使用 scikit-learn 的 MultilabelBinarizer() 设置的. 因此，举一个随机的例子，我的 y 列的一行是这样编码的:[0,0,0,1,0,1,0,0,0,0,1]. 所以我有 11 个可以预测的类，并且不止一个类是真实的；因此问题的多标签性质.这个特定样 ..

发布时间：2021-12-19 12:14:52 python neural-network keras multilabel-classification Python

多类-多标签分类的精度/召回率

我想知道如何计算多类多标签分类的准确率和召回率，即有两个以上标签的分类，并且每个实例可以有多个标签? 解决方案对于多标签分类，您有两种方法首先考虑以下内容. 是示例的数量. 是示例.. 是示例. 是示例. 基于示例指标以每个数据点的方式计算.对于每个预测标签，仅计算其得分，然后将这些得分汇总到所有数据点上. 精度 = ，预测正确的比例.分子找出预测向 ..

发布时间：2021-12-14 09:52:11 machine-learning classification multilabel-classification precision-recall AI人工智能

多标签分类中的 Spacy TextCat 分数

在spacy的文本分类中train_textcat 示例，有两个标签指定了Positive 和Negative.因此猫的分数表示为 cats = [{"POSITIVE": bool(y), "NEGATIVE": not bool(y)} for y in label] 我正在使用多标签分类，这意味着我有两个以上的标签要在一个文本中进行标记.我已将标签添加为 textcat.a ..

发布时间：2021-09-06 19:30:07 spacy text-classification multilabel-classification 其他开发

如何从训练有素的多标签文本分类模型中预测看不见的数据?

首先，我想说我对机器学习完全陌生，并且仍在学习这些东西是如何工作的.我正在将评论分类为多个标签，并通过参考此代码. 该模型经过训练，可将评论分为 9 个标签，并且该模型分别预测每个标签的值.到目前为止，我如何训练模型以及如何测试模型如下.我没有包含文本处理部分，否则代码会很长. 这是模型，它与使用的模型相同这里 #bert 文本模型类 TEXT_MODEL(tf.keras.Mo ..

发布时间：2021-09-05 20:00:47 python tensorflow machine-learning bert-language-model multilabel-classification AI人工智能

使用 TensorFlow 的多标签文本分类

文本数据被组织为具有 20,000 个元素的向量，例如 [2, 1, 0, 0, 5, ...., 0].第 i 个元素表示第 i 个词在文本中的出现频率. ground truth 标签数据也表示为具有 4,000 个元素的向量，如 [0, 0, 1, 0, 1, ...., 0].第 i 个元素指示第 i 个标签是否是文本的正标签.文本的标签数量因文本而异. 我有一个用于单标签文本 ..

发布时间：2021-09-05 19:07:55 python tensorflow text-classification multilabel-classification Python

使用 OneVsRestClassifier 时 sklearn.svm.SVC 的哪个 decision_function_shape?

我正在做多标签分类，我试图预测问题的正确标签: (X = 问题，y = X 中每个问题的标签列表). 我想知道 sklearn.svm.SVC 应与 OneVsRestClassifier? 从文档我们可以读到 decision_function_shape 可以有两个值 'ovo' 和 'ovr': decision_function_shape : ‘ovo’, ‘ov ..

发布时间：2021-09-01 19:26:32 python scikit-learn svm text-classification multilabel-classification Python

所有训练示例中都存在标签 not x

您好，我在尝试预测标签/标签时遇到了一个问题在我的项目上.我目前正在使用类似的教程(用我自己的数据)根据给定的标签预测投诉登记册中的投诉例如 1 项投诉 --> 多种类型(保修、退款、航空调理) DF -> Tag No of Columns -> 4(原始)，2(清理)>genre_new 和clean_plot 列名 -> ID、情节、标题、流派、流派_新，clean_plot 我 ..

发布时间：2021-07-16 20:25:32 python scikit-learn multilabel-classification Python

使用 sklearn 进行多类、多标签、序数分类

我想知道如何使用 sklearn 运行多类、多标签、序数分类.我想预测目标群体的排名，范围从某个位置最流行的人群 (1) 到最不流行的人群 (7).我似乎无法做到正确.你能帮我吗? # 随机森林分类# 进口将 numpy 导入为 np将熊猫导入为 pd从 sklearn.model_selection 导入 GridSearchCV、cross_val_score、train_test_spli ..

发布时间：2021-07-16 20:19:17 python scikit-learn multilabel-classification multiclass-classification ordinal Python

Scikit 学习多标签分类，从 MultiLabelBinarizer 中取回标签

在多标签分类问题中，我使用 MultiLabelBinarizer 将我的 20 个文本标签转换为一个由 0 和 1 组成的二进制列表. 预测后，我得到了 20 个二进制值的列表，我想输出相应的文本标签. 我只是想知道 MultiLabelBinarizer() 是否提供了返回转换，或者我应该手动进行. 解决方案是的，MultiLabelBinarizer 提供了一个名为 i ..

发布时间：2021-07-16 20:08:00 scikit-learn multilabel-classification 其他开发

Sklearn - 如何预测所有目标标签的概率

我有一个数据集，其中的目标变量可以有 7 个不同的标签.我的训练集中的每个样本只有一个目标变量的标签. 对于每个样本，我想计算每个目标标签的概率.所以我的预测将包含每行 7 个概率. 在 sklearn 网站上我阅读了关于多标签分类的内容，但这似乎不是我想要的. 我尝试了以下代码，但这仅为每个样本提供了一个分类. from sklearn.multiclass import O ..

发布时间：2021-07-16 19:55:22 python scikit-learn multilabel-classification Python

用于多标签分类的 XGBoost?

是否可以使用 XGBoost 进行多标签分类?现在我使用 OneVsRestClassifier 而不是 sklearn 的 GradientBoostingClassifier.它可以工作，但只使用我 CPU 的一个内核.在我的数据中，我有大约 45 个特征，任务是用二进制(布尔)数据预测大约 20 列.指标是平均精度 (map@7).如果您有一个简短的代码示例要分享，那就太好了. 解决方 ..

发布时间：2021-07-16 19:54:01 python scikit-learn xgboost multilabel-classification Python

使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择.我想获得跨标签的最后一组特征，然后我将在另一个机器学习包中使用这些特征.我打算使用我在这里看到的方法，分别为每个标签选择相关特征. from sklearn.svm import LinearSVC从 sklearn.feature_selection 导入 chi2，SelectKBest从 sklearn.multiclass 导入 O ..

发布时间：2021-06-26 19:29:43 python-2.7 machine-learning scikit-learn feature-selection multilabel-classification AI人工智能

如何计算多标签分类的 F1-Score?

我尝试计算 f1_score，但是当我使用 sklearn f1_score 方法时，我会收到一些警告. 我有一个用于预测的多标签 5 类问题. 将 numpy 导入为 np从 sklearn.metrics 导入 f1_scorey_true = np.zeros((1,5))y_true[0,0] = 1 # =>标签 = [[1, 0, 0, 0, 0]]y_pred = np.ze ..

发布时间：2021-06-02 21:27:54 scikit-learn metrics multilabel-classification precision-recall 其他开发

Keras多标签分类' to_categorical'错误

接收 IndexError:索引3超出了尺寸1为3的轴1的边界尝试在输出向量上使用Keras to_categorical创建单点编码时. Y.shape =(178,1).请帮助(: 导入keras从keras.models导入顺序从keras.layers导入密集将numpy导入为np#酒类数量分类= 3#加载数据集数据集= np.loadtxt('wine.csv'，deli ..

发布时间：2021-05-31 18:43:08 machine-learning neural-network keras multilabel-classification AI人工智能

无法为多标签分类器进行堆叠

我正在研究多标签文本分类问题(目标标签总数90).数据分布具有长尾和类不平衡以及大约10万条记录的情况.我正在使用OAA策略(反对所有人).我正在尝试使用Stacking创建一个合奏. 文本功能: HashingVectorizer (功能数量2 ** 20，字符分析器) TSVD 降低维度(n_components=200). text_pipeline = Pipeline([(' ..

发布时间：2021-05-31 18:41:43 machine-learning scikit-learn nlp multilabel-classification ensemble-learning AI人工智能

如何使用多项式Logistic回归解决多标签分类问题?

我必须根据其他属性来预测学生所学课程的类型. prog 是一个分类变量，指示学生所在的课程类型:“一般"(1)，“学术"(2)或“职业"(3) Ses 是表明某人的社会经济阶层的分类变量:“低"(1)，“中"(2)和“高"(3) read ， write ， math ， science 是他们在不同测试中的分数荣誉是否已注册图像格式的csv文件; 将熊猫作为pd导 ..

发布时间：2021-05-30 20:54:03 python-3.x scikit-learn logistic-regression multilabel-classification 其他开发

如何使用keras实现多标签分类神经网络

我正在尝试使用Keras实现一个神经网络，该网络涉及一个涉及多标签分类的问题.我知道解决该问题的一种方法是将其转换为几个二进制分类问题.我已经实现了其中之一，但是不确定如何继续进行其他工作，主要是如何将它们结合起来?我的数据集有5个输入变量和5个标签.通常，单个数据样本将具有1-2个标签.很少有两个以上的标签. 这是我的代码(感谢machinelearningmastery.com): ..

发布时间：2021-05-28 19:13:24 keras neural-network multilabel-classification 其他开发

multilabel-classification相关内容