classification相关内容

在R中使用gbm进行梯度增强,其中分布="bernoulli".

我在 R 中使用 gbm 包,并应用"bernoulli"选项进行分发以构建分类器,并且得到了"nan"和“无法预测任何分类结果.但是当我使用"adaboost"时,我没有遇到相同的错误.下面是示例代码,我用虹膜数据集复制了相同的错误. ##使用gbm的虹膜数据图书馆(插入符号)图书馆(GBM)数据(虹膜)数据 ..
发布时间:2021-04-22 19:08:10 其他开发

如何在RandomForestClassifier中选择n_estimators?

我正在使用python预处理数据集上构建一个Random Forest Binary Classsifier,该数据集具有4898个实例,60-40的分层分割比率以及78%的数据属于一个目标标签,而其余的则属于另一个目标标签.我应该选择n_estimators的哪个值以实现最实用/最可能的随机森林分类器模型?我使用下面的代码段绘制了精度vs n_estimators曲线.x_trai和y_trai ..
发布时间:2021-04-22 19:08:06 Python

在Pytorch上具有相同标签的点的批次

我想在每个包含N个训练点的批次上使用梯度下降训练一个神经网络.我希望这些批次仅包含具有相同标签的点,而不是从训练集中随机取样. 例如,如果我正在使用MNIST进行训练,我希望拥有如下所示的批次: batch_1 = {0,0,0,0,0,0,0,0}batch_2 = {3,3,3,3,3,3,3,3}batch_3 = {7,7,7,7,7,7,7,7} ... ,依此类推. ..
发布时间:2021-04-22 19:08:03 Python

如何使用pytorch构建多任务DNN,例如用于100多个任务?

下面是使用pytorch为两个回归任务构造DNN的示例代码. forward 函数返回两个输出(x1,x2).网络如何处理许多回归/分类任务?例如100或1000个输出.对所有输出(例如x1,x2,...,x100)进行硬编码绝对不是一个好主意.有没有简单的方法可以做到这一点?谢谢. 导入火炬从火炬进口nn导入功能为F的torch.nn.类mynet(nn.Module):def __init ..
发布时间:2021-04-22 19:08:00 其他开发

使用rpart决策树进行数据预测

我正在使用R对称为"d"的数据帧进行分类,其中包含如下结构的数据: 运行 predict 函数时,我还会收到以下警告: 警告消息:'newdata'有4行,但是找到的变量有576666行 我在哪里做错了?! 解决方案 我认为问题是:您应该在预测代码中添加"type ='class'": 预测(fitTree,newdata,type ="class") 尝试以下代码.在此 ..
发布时间:2021-04-22 19:07:57 AI人工智能

R中用于多类分类的ROC曲线

我有一个包含6类的数据集,我想为多类分类绘制ROC曲线.Achim Zeileis在此主题中给出的第一个答案是一个很好的答案. 使用rpart包在R中的ROC曲线? 但这仅适用于二项式分类.我得到的错误是预测错误,类数不等于2 .有人为此做过多类分类吗? 这是我要执行的操作的一个简单示例.数据 ..
发布时间:2021-04-22 19:07:52 AI人工智能

List :: Util'shuffle'实际上如何工作?

我目前正在使用c5.0构建分类器.我有8000个条目的数据集,每个条目都有自己的ID号(1-8000).在测试分类器的性能时,我必须进行5组10:90的分割(训练数据:测试数据).当然,任何训练用例都不能再次出现在测试用例中,并且任何一组都不能重复出现. 为解决随机抽取训练数据示例的问题,并确保不能从测试数据中抽取示例,我开发了一种极其缓慢的方法; 在单独的行中用1-8000的数字填充 ..
发布时间:2021-04-22 19:07:49 其他开发

Scikit-Learn决策树:预测的概率是a还是b?

我使用Scikit-Learn有一个基本的决策树分类器: ##用于根据身高和鞋子的尺寸从女性中确定男性从sklearn导入树#身高和鞋码X = [[65,9],[67,7],[70,11],[62,6],[60,7],[72,13],[66,10],[67,7.5]]Y = [“男性",“女性",“男性",“女性",“女性",“男性",“男性",“女性"]#创建决策树clf = tree.De ..

Scikit-learn Ridge分类器:提取类概率

我目前正在使用sklearn的Ridge分类器,并且希望将此分类器与sklearn和其他库中的分类器结合在一起.为此,最好提取给定输入属于类别列表中每个类别的概率.目前,我正在使用model.decision_function(x)的输出压缩类,但这将返回距超平面的距离,而不是直接的概率.这些距离值从-1到1左右. 距离= dict(zip(clf.classes_,clf.decision_f ..

sklearn多类svm函数

我有多个类别的标签,想计算模型的准确性. 我对需要使用哪个sklearn函数感到困惑.据我了解,以下代码仅用于二进制分类. #将X,y分为训练数据和测试数据X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.25,random_state = 0)#训练线性SVM分类器从sklearn.svm导入SVCsvm_m ..
发布时间:2021-04-22 19:07:40 AI人工智能

在scikit-learn中获得二进制概率分类器的最大准确性

在scikit-learn中,是否有任何内置函数可以使二进制概率分类器获得最大的准确性? 例如以获得最大的F1分数: #AUCPR精度,召回率,阈值= sklearn.metrics.precision_recall_curve(y_true,y_score)auprc = sklearn.metrics.auc(调用,精度)max_f1 = 0对于zip中的r,p,t(调用,精度,阈值) ..

使用SVM预测概率

我写了这段代码,想获得分类的可能性. 从sklearn导入svm的 X = [[0,0],[10,10],[20,30],[30,30],[40,30],[80,60],[80,50]]y = [0,1,2,3,4,5,6]clf = svm.SVC()clf.probability =真实clf.fit(X,y)概率= clf.predict_proba([[10,10]])打印问题 我 ..
发布时间:2021-04-22 19:07:34 Python

使用MATLAB进行简单的二进制逻辑回归

我正在使用MATLAB进行逻辑回归,以解决一个简单的分类问题.我的协变量是一个介于0和1之间的连续变量,而我的分类响应是二进制变量0(不正确)或1(正确). 我正在寻找一个逻辑回归来建立一个预测变量,该预测变量将输出某些输入观测值(例如上述连续变量)正确或不正确的概率.尽管这是一个非常简单的场景,但是在MATLAB中运行它时遇到了一些麻烦. 我的方法如下:我有一个包含连续变量值的列向量 ..

将高斯噪声添加到浮点数据集中并保存(Python)

我正在研究分类问题,我需要在数据集中添加不同级别的高斯噪声,并进行分类实验,直到我的ML算法无法对数据集进行分类.不幸的是,我不知道该怎么做.关于如何添加高斯噪声的任何建议或编码技巧? 解决方案 您可以按照以下步骤操作: 将数据加载到熊猫数据框中 clean_signal = pd.read_csv("data_file_name") 使用numpy生成尺寸与数据集相同的高斯噪声. ..
发布时间:2021-04-22 19:07:26 AI人工智能

Twitter情绪分析的有用功能

我正在尝试实现情感分析功能,并寻找可以从推文消息中提取的有用功能.我现在脑海中的功能是: 情感词 情感图标 感叹号 否定词 强度词(非常,真的等) 此任务还有其他有用的功能吗?我的目标不仅是检测推文的正面还是负面,而且我还需要检测阳性或阴性的水平(假设范围是0到100).我们欢迎任何对印刷纸的输入或引用. 谢谢. 解决方案 其他有用的方法是: 拉长的单词(例 ..

如何在R中的线性判别分析图上绘制分类边界

我使用线性判别分析(LDA)来研究一组变量在3组之间的区别程度.然后,我使用 plot.lda()函数将数据绘制在两个线性判别式上(x轴为LD1,y轴为LD2).我现在想将LDA的分类边界添加到绘图中.我在允许此功能的函数中看不到参数. partimat()函数允许可视化LD分类边界,但是在这种情况下,变量用作x和y轴,而不是线性判别式.任何有关如何向 plot.lda 添加分类边界的建议,将不胜 ..
发布时间:2021-04-22 19:07:12 其他开发