multilabel-classification相关内容

多标签分类KERAS度量

在KERAS中,哪些指标更适合多标签分类:accuracy或categorical_accuracy?显然,在这种情况下,最后一个激活函数是sigmoid,而AS损失函数是binary_crossentropy。 推荐答案 我不会对类别不平衡的分类任务使用准确性。 尤其是对于多标签任务,您可能会认为您的大多数标签都是假的。也就是说,与所有可能的标签的基数相比,每个数据点只能有一小部分标 ..

Pytorch 中类别不平衡的多标签分类

我有一个多标签分类问题,我正试图用 Pytorch 中的 CNN 解决这个问题.我有 80,000 个训练示例和 7900 个类;每个示例可以同时属于多个类,每个示例的平均类数为 130. 问题是我的数据集非常不平衡.对于某些课程,我只有大约 900 个示例,大约为 1%.对于“过度代表"的类,我有大约 12000 个示例(15%).当我训练模型时,我使用来自 pytorch 的 BCEWi ..
发布时间:2022-01-06 19:09:48 其他开发

Keras 如何处理多标签分类?

我不确定如何解释 Keras 在以下情况下的默认行为: 我的 Y (ground truth) 是使用 scikit-learn 的 MultilabelBinarizer() 设置的. 因此,举一个随机的例子,我的 y 列的一行是这样编码的:[0,0,0,1,0,1,0,0,0,0,1]. 所以我有 11 个可以预测的类,并且不止一个类是真实的;因此问题的多标签性质.这个特定样 ..
发布时间:2021-12-19 12:14:52 Python

多类-多标签分类的精度/召回率

我想知道如何计算多类多标签分类的准确率和召回率,即有两个以上标签的分类,并且每个实例可以有多个标签? 解决方案 对于多标签分类,您有两种方法首先考虑以下内容. 是示例的数量. 是 示例.. 是 示例. 是 示例. 基于示例 指标以每个数据点的方式计算.对于每个预测标签,仅计算其得分,然后将这些得分汇总到所有数据点上. 精度 = ,预测正确的比例.分子找出预测向 ..

如何从训练有素的多标签文本分类模型中预测看不见的数据?

首先,我想说我对机器学习完全陌生,并且仍在学习这些东西是如何工作的.我正在将评论分类为多个标签,并通过参考此 代码. 该模型经过训练,可将评论分为 9 个标签,并且该模型分别预测每个标签的值.到目前为止,我如何训练模型以及如何测试模型如下.我没有包含文本处理部分,否则代码会很长. 这是模型,它与使用的模型相同 这里 #bert 文本模型类 TEXT_MODEL(tf.keras.Mo ..

使用 TensorFlow 的多标签文本分类

文本数据被组织为具有 20,000 个元素的向量,例如 [2, 1, 0, 0, 5, ...., 0].第 i 个元素表示第 i 个词在文本中的出现频率. ground truth 标签数据也表示为具有 4,000 个元素的向量,如 [0, 0, 1, 0, 1, ...., 0].第 i 个元素指示第 i 个标签是否是文本的正标签.文本的标签数量因文本而异. 我有一个用于单标签文本 ..

使用 OneVsRestClassifier 时 sklearn.svm.SVC 的哪个 decision_function_shape?

我正在做多标签分类,我试图预测问题的正确标签: (X = 问题,y = X 中每个问题的标签列表). 我想知道 sklearn.svm.SVC 应与 OneVsRestClassifier? 从文档我们可以读到 decision_function_shape 可以有两个值 'ovo' 和 'ovr': decision_function_shape : ‘ovo’, ‘ov ..

所有训练示例中都存在标签 not x

您好,我在尝试预测标签/标签时遇到了一个问题在我的项目上.我目前正在使用类似的教程(用我自己的数据)根据给定的标签预测投诉登记册中的投诉例如 1 项投诉 --> 多种类型(保修、退款、航空调理) DF -> Tag No of Columns -> 4(原始),2(清理)>genre_new 和clean_plot 列名 -> ID、情节、标题、流派、流派_新,clean_plot 我 ..
发布时间:2021-07-16 20:25:32 Python

使用 sklearn 进行多类、多标签、序数分类

我想知道如何使用 sklearn 运行多类、多标签、序数分类.我想预测目标群体的排名,范围从某个位置最流行的人群 (1) 到最不流行的人群 (7).我似乎无法做到正确.你能帮我吗? # 随机森林分类# 进口将 numpy 导入为 np将熊猫导入为 pd从 sklearn.model_selection 导入 GridSearchCV、cross_val_score、train_test_spli ..

Scikit 学习多标签分类,从 MultiLabelBinarizer 中取回标签

在多标签分类问题中,我使用 MultiLabelBinarizer 将我的 20 个文本标签转换为一个由 0 和 1 组成的二进制列表. 预测后,我得到了 20 个二进制值的列表,我想输出相应的文本标签. 我只是想知道 MultiLabelBinarizer() 是否提供了返回转换,或者我应该手动进行. 解决方案 是的,MultiLabelBinarizer 提供了一个名为 i ..
发布时间:2021-07-16 20:08:00 其他开发

Sklearn - 如何预测所有目标标签的概率

我有一个数据集,其中的目标变量可以有 7 个不同的标签.我的训练集中的每个样本只有一个目标变量的标签. 对于每个样本,我想计算每个目标标签的概率.所以我的预测将包含每行 7 个概率. 在 sklearn 网站上我阅读了关于多标签分类的内容,但这似乎不是我想要的. 我尝试了以下代码,但这仅为每个样本提供了一个分类. from sklearn.multiclass import O ..
发布时间:2021-07-16 19:55:22 Python

用于多标签分类的 XGBoost?

是否可以使用 XGBoost 进行多标签分类?现在我使用 OneVsRestClassifier 而不是 sklearn 的 GradientBoostingClassifier.它可以工作,但只使用我 CPU 的一个内核.在我的数据中,我有大约 45 个特征,任务是用二进制(布尔)数据预测大约 20 列.指标是平均精度 (map@7).如果您有一个简短的代码示例要分享,那就太好了. 解决方 ..
发布时间:2021-07-16 19:54:01 Python

使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择.我想获得跨标签的最后一组特征,然后我将在另一个机器学习包中使用这些特征.我打算使用我在这里看到的方法,分别为每个标签选择相关特征. from sklearn.svm import LinearSVC从 sklearn.feature_selection 导入 chi2,SelectKBest从 sklearn.multiclass 导入 O ..

无法为多标签分类器进行堆叠

我正在研究多标签文本分类问题(目标标签总数90).数据分布具有长尾和类不平衡以及大约10万条记录的情况.我正在使用OAA策略(反对所有人).我正在尝试使用Stacking创建一个合奏. 文本功能: HashingVectorizer (功能数量2 ** 20,字符分析器) TSVD 降低维度(n_components=200). text_pipeline = Pipeline([(' ..

如何使用多项式Lo​​gistic回归解决多标签分类问题?

我必须根据其他属性来预测学生所学课程的类型. prog 是一个分类变量,指示学生所在的课程类型:“一般"(1),“学术"(2)或“职业"(3) Ses 是表明某人的社会经济阶层的分类变量:“低"(1),“中"(2)和“高"(3) read , write , math , science 是他们在不同测试中的分数 荣誉是否已注册 图像格式的csv文件; 将熊猫作为pd导 ..

如何使用keras实现多标签分类神经网络

我正在尝试使用Keras实现一个神经网络,该网络涉及一个涉及多标签分类的问题.我知道解决该问题的一种方法是将其转换为几个二进制分类问题.我已经实现了其中之一,但是不确定如何继续进行其他工作,主要是如何将它们结合起来?我的数据集有5个输入变量和5个标签.通常,单个数据样本将具有1-2个标签.很少有两个以上的标签. 这是我的代码(感谢machinelearningmastery.com): ..
发布时间:2021-05-28 19:13:24 其他开发