svm相关内容

scikit-learn (SVMLIB) 中奇怪的 SVM 预测性能

我在 10000x1000 的大型数据集(10000 个具有 1000 个特征的对象)上使用来自 scikit-learn 的 SVC.我已经在其他来源中看到 SVMLIB 不能很好地扩展到超过 10000 个对象,我确实观察到了这一点: 10000个物体的训练时间:18.9s12000 个对象的训练时间:44.2s14000 个对象的训练时间:92.7s 你可以想象当我尝试 80000 时会 ..
发布时间:2021-07-16 20:08:32 Python

详细日志缩写在 SVC、scikit-learn 中的含义

我在 scikit-learn 中寻找 SVC 函数的详细日志缩写的含义? 如果nSV是支持向量数,#iter是迭代次数,nBSV, rho,obj是什么意思? 这是一个例子: 将 numpy 导入为 np从 sklearn.svm 导入 SVRsets=np.loadtxt('data\Exp Rot.txt') # 读取数据模型=SVR(内核=“rbf",C=100,伽马=1,m ..
发布时间:2021-07-16 20:07:54 Python

使用 scikit-learn python 的线性 SVM 时出现 ValueError

我目前正在研究 ODP 文档的大规模分层文本分类.提供给我的数据集采用 libSVM 格式.我正在尝试运行 python scikit-learn 的线性内核 SVM 来开发模型.以下是来自训练样本的样本数据: 29 9454:1 11742:1 18884:14 26840:1 35147:1 52782:1 72083:1 73244:1 78945:1 79913:1 79986:170: ..
发布时间:2021-07-16 20:04:35 Python

如何修复线性 SVM 的误报率?

我是 SVM 新手,这是我的用例:我有很多不平衡数据要使用线性 SVM 进行二进制分类.我需要将误报率固定在某些值并测量每个值的相应误报.我正在使用类似于以下代码的东西,利用 scikit-learn svm 实现: #定义训练数据X = [[0, 0], [1, 1]]y = [0, 1]# 定义和训练 SVMclf = svm.LinearSVC(C=0.01, class_weight=' ..
发布时间:2021-07-16 20:04:15 Python

如何加速sklearn SVR?

我正在使用 sklearn python 中的 svr 包.我的稀疏矩阵的大小为 146860 x 10202.我将其划分为大小为 2500 x 10202 的各种子矩阵.对于每个子矩阵,SVR 拟合大约需要 10 分钟.有什么方法可以加快这个过程?请建议任何不同的方法或不同的 python 包.谢谢! 解决方案 您可以平均 SVR 子模型预测. 或者,您可以尝试在使用 Nystro ..
发布时间:2021-07-16 20:03:19 Python

SVM 内核的速度?线性 vs RBF vs Poly

我在 Python 中使用 scikitlearn 来创建一些 SVM 模型,同时尝试不同的内核.代码很简单,格式如下: from sklearn import svmclf = svm.SVC(kernel='rbf', C=1, gamma=0.1)clf = svm.SVC(内核=“线性",C=1,伽马=0.1)clf = svm.SVC(kernel='poly', C=1, gamma ..
发布时间:2021-07-16 20:02:54 Python

scikit-learn:SVC 和 SGD 有什么区别?

SVM:http://scikit-learn.org/stable/modules/svm.html#classification SGD:http://scikit-learn.org/stable/modules/sgd.html#classification 在我看来,似乎也差不多,因为他们写道“SGD 实现了一个线性模型".有人能解释一下它们之间的区别吗? 解决方案 ..
发布时间:2021-07-16 20:01:19 Python

为什么 scikit-learn SVM.SVC() 非常慢?

我尝试使用 SVM 分类器来训练包含大约 10 万个样本的数据,但我发现它非常慢,甚至在两个小时后也没有响应.当数据集有大约 1k 个样本时,我可以立即得到结果.我还尝试了 SGDClassifier 和朴素贝叶斯,它们非常快,我在几分钟内就得到了结果.你能解释一下这个现象吗? 解决方案 关于 SVM 学习的一般说明 使用非线性内核的 SVM 训练,这是 sklearn 的 SVC ..
发布时间:2021-07-16 20:00:57 Python

AUC 的网格搜索查找参数

我正在尝试为我的 SVM 找到参数,这给我最好的 AUC.但是我在 sklearn 中找不到 AUC 的任何评分函数.有人有想法吗?这是我的代码: 参数 = {"C":[0.1, 1, 10, 100, 1000], "gamma":[0.1, 0.01, 0.001, 0.0001, 0.00001]}clf = SVC(内核 = "rbf")clf = GridSearchCV(clf, ..
发布时间:2021-07-16 20:00:51 Python

如何在 scikit-learn 中生成自定义交叉验证生成器?

我有一个不平衡的数据集,所以我有一个过采样策略,我只在我的数据训练期间应用.我想使用像 GridSearchCV 或 cross_val_score 这样的 scikit-learn 类来探索或交叉验证我的估算器(例如 SVC)上的一些参数.但是,我看到您要么传递了 cv 折叠数,要么传递了标准的交叉验证生成器. 我想创建一个自定义的 cv 生成器,所以我得到并分层 5 倍并仅对我的训练数据 ..
发布时间:2021-07-16 19:59:50 Python

SciKit One-class SVM 分类器训练时间随着训练数据的大小呈指数增长

我正在使用 Python SciKit OneClass SVM 分类器来检测文本行中的异常值.首先使用词袋和TF-IDF将文本转换为数字特征. 当我训练(拟合)在我的计算机上运行的分类器时,时间似乎随着训练集中项目的数量呈指数增长: 训练数据中的项目数和训练时间:10K:1 秒、15K:2 秒、20K:8 秒、25k:12 秒、30K:16 秒、45K:44 秒. 有什么我可以 ..
发布时间:2021-07-16 19:57:00 Python

如何在 scikit-learn 中使用字符串内核?

我正在尝试生成一个字符串内核,用于提供支持向量分类器.我用一个计算内核的函数试了一下,类似这样 def stringkernel(K, G):对于范围内(len(K)):对于范围内的 b(len(G)):R[a][b] = scipy.exp(editdistance(K[a], G[b]) ** 2)返回 R 当我将它作为参数传递给 SVC 时,我得到 clf = svm.SVC(ker ..
发布时间:2021-07-16 19:54:39 Python

使用 Scikit Learn SVM 为文本分类准备数据

我正在尝试应用 Scikit 中的 SVM 学习对我收集的推文进行分类.因此,将有两个类别,将它们命名为 A 和 B.现在,我将所有推文归类到两个文本文件“A.txt"和“B.txt"中.但是,我不确定 Scikit Learn SVM 要求什么类型的数据输入.我有一个以标签(A 和 B)作为键的字典和一个特征字典(一元组)及其频率作为值.抱歉,我对机器学习真的很陌生,不确定我应该怎么做才能让 S ..
发布时间:2021-07-16 19:53:04 Python

非整数类标签 Scikit-Learn

scikit-learn 的快速 SVM 问题.当你训练一个 SVM 时,就像 from sklearn import svms = svm.SVC()s.fit(training_data,标签) 有没有办法让 labels 成为一个非数字类型的列表?例如,如果我想将向量分类为“猫"或“狗",而不必使用某种将“猫"和“狗"编码为 1 和 2 的外部查找表.当我尝试只传递一个字符串列表时,我得 ..
发布时间:2021-07-16 19:52:38 Python

sklearn 中 dual_coef_ 的维度.SVC

在用于多分类的SVC() 中,训练一对一分类器.所以总共应该有 n_class * (n_class - 1)/2 个分类器.但是为什么 clf.dual_coef_ 只返回我 (n_class - 1) * n_SV?那么每一行代表什么? 解决方案 在多类设置中 sklearn.svm.SVC 的对偶系数很难解释.scikit-learn 文档中有解释.sklearn.svm.SVC 使 ..
发布时间:2021-07-16 19:52:12 其他开发

使 SVM 在 Python 中运行得更快

将代码用于python中的svm: from sklearn import datasets从 sklearn.multiclass 导入 OneVsRestClassifier从 sklearn.svm 导入 SVC虹膜 = datasets.load_iris()X, y = iris.data, iris.targetclf = OneVsRestClassifier(SVC(kernel ..
发布时间:2021-07-16 19:50:00 Python