svm相关内容

是否可以逐步训练 sklearn 模型(例如 SVM)?

我正在尝试对 twitter 数据集“Sentiment140"进行情感分析,该数据集包含 160 万条带标签的推文.我正在使用 Bag Of Words (Unigram) 模型构建我的特征向量,因此每条推文由大约 20000 个特征表示.现在要使用此数据集训练我的 sklearn 模型(SVM、逻辑回归、朴素贝叶斯),我必须将整个 1.6m x 20000 特征向量加载到一个变量中,然后将其提 ..

scikit-learn 支持向量机的 predict_proba 的混淆概率

我的目的是根据特定类别的每个样本的排序概率绘制 PR 曲线.但是,我发现当我使用两个不同的标准数据集时,svm 的 predict_proba() 获得的概率有两种不同的行为:虹膜和数字. 第一种情况是用“iris"情况和下面的python代码进行评估的,它的工作原理是类获得最高概率. D = datasets.load_iris()clf = SVC(kernel=chi2_kernel ..
发布时间:2021-12-25 14:44:52 Python

如何获取特征的权重

我正在处理高度不平衡的数据集,我的想法是从我的 libSVM 模型中获取特征权重的值.至于现在我对线性内核没问题,在那里我可以获得特征权重,但是当我使用 rbf 或 poly 时,我无法达到我的目标. 这里我使用 sklearn 作为我的模型,使用 .coef_ 很容易获得线性核的特征权重.谁能帮我为 rbf 或 poly 做同样的事情?到目前为止,我尝试做的事情如下: svr = SVC(C ..
发布时间:2021-12-25 14:40:09 AI人工智能

Scikit 学习 SVC 决策函数和预测

我试图理解decision_function和predict之间的关系,它们是SVC的实例方法(http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html).到目前为止,我已经收集到决策函数返回类之间的成对分数.我的印象是 predict 选择最大化其成对分数的类,但我对此进行了测试并得到了不同的结果.这是我用来尝试理 ..
发布时间:2021-12-25 14:20:36 Python

如何在python中使用tf-idf svm sklearn绘制文本分类

我已经按照 本教程 分类工作正常.现在我想绘制 tf-idf 值(即特征),并查看最终生成的超平面如何将数据分为两类. 实现的代码如下: 导入操作系统将 numpy 导入为 np从 sklearn.naive_bayes 导入 MultinomialNB从 sklearn.metrics 导入混淆_矩阵从 sklearn.svm 导入 LinearSVC从 sklearn.featu ..
发布时间:2021-12-24 14:23:42 Python

Opencv 3 SVM 训练

如您所知,OpenCV 3 中的许多内容都发生了变化(与 openCV2 或旧的第一个版本相比). 在过去,训练 SVM 会使用: CvSVMParams 参数;params.svm_type = CvSVM::C_SVC;params.kernel_type = CvSVM::POLY;params.gamma = 3;CvSVM 支持向量机;svm.train(training_mat ..
发布时间:2021-12-14 10:14:06 AI人工智能

如何使用自定义 SVM 内核?

我想用 Python 实现我自己的高斯内核,仅供练习.我正在使用:sklearn.svm.SVC(kernel=my_kernel) 但我真的不明白发生了什么. 我希望函数 my_kernel 以 X 矩阵的列作为参数被调用,而不是我用 X, X 调用它> 作为参数.看例子就不清楚了. 我错过了什么? 这是我的代码: '''创建于 2014 年 11 月 15 日@作者:路易吉 ..
发布时间:2021-12-14 10:12:20 AI人工智能

如何处理高维输入空间的机器学习问题?

当我尝试将一些 ML 算法(分类,更具体地说,特别是 SVM)应用于一些高维输入时,我应该如何处理这种情况,而我得到的结果并不十分令人满意? 1、2 或 3 维数据可以与算法的结果一起可视化,因此您可以了解正在发生的事情,并了解如何解决问题.一旦数据超过 3 维,除了直观地玩弄参数之外,我真的不知道如何攻击它? 解决方案 你对数据做了什么?我的回答是:没有.SVM 被设计用于处理高维 ..
发布时间:2021-12-14 10:10:45 AI人工智能

从神经网络的不同成本函数和激活函数中选择

最近我开始玩弄神经网络.我试图用 Tensorflow 实现一个 AND 门.我无法理解何时使用不同的成本和激活函数.这是一个基本的神经网络,只有输入和输出层,没有隐藏层. 首先我尝试以这种方式实现它.正如你所看到的,这是一个糟糕的实现,但我认为它完成了工作,至少在某种程度上是这样.所以,我只尝试了真正的输出,没有人尝试真正的热输出.对于激活函数,我使用了 sigmoid 函数,而对于成本函 ..
发布时间:2021-12-14 10:10:38 AI人工智能

SVM - 硬边距还是软边距?

给定一个线性可分的数据集,使用硬边界 SVM 是否一定比使用软边界 SVM 更好? 解决方案 即使训练数据集是线性可分的,我也希望 soft-margin SVM 更好.原因是在硬边界 SVM 中,单个异常值可以确定边界,这使得分类器对数据中的噪声过于敏感. 在下图中,单个红色异常值基本上决定了边界,这是过拟合的标志 要了解 soft-margin SVM 正在做什么,最好在对 ..
发布时间:2021-12-14 10:06:53 AI人工智能

支持向量的数量与训练数据和分类器性能之间有什么关系?

我正在使用 LibSVM 对一些文档进行分类.如最终结果所示,这些文件似乎有点难以分类.但是,我在训练模型时注意到了一些事情.那就是:如果我的训练集是例如 1000 个,大约 800 个被选为支持向量.我到处找找这是好事还是坏事.我的意思是支持向量的数量和分类器的性能之间有关系吗?我已阅读此上一篇文章 但我正在执行参数选择,而且我确信特征向量中的属性都是有序的.我只需要知道这种关系.谢谢.ps:我 ..
发布时间:2021-12-14 10:06:06 AI人工智能

多类 SVM(一个对所有)

我知道 LIBSVM 在涉及多类 SVM 时只允许一对一分类.但是,我想稍微调整一下以执行一对一分类.我试图在下面进行一对一的比赛.这是正确的方法吗? 代码: TrainLabel;TrainVec;TestVec;TestLaBel;u=唯一(火车标签);N=长度(u);如果(N>2)tr=1;班级=0;while((classes~=1)&&(itr ..
发布时间:2021-12-14 09:53:24 AI人工智能

什么时候应该使用 LinearSVC 或 SVC?

从我的研究中,我发现了三个相互矛盾的结果: SVC(kernel="线性") 更好 LinearSVC 更好 没关系 谁能解释一下什么时候使用 LinearSVC 和 SVC(kernel="linear")? 似乎 LinearSVC 比 SVC 稍微好一点,而且通常更挑剔.但是如果 scikit 决定花时间为线性分类实现一个特定的案例,为什么 LinearSVC 不会优于 ..
发布时间:2021-12-14 09:52:01 AI人工智能

人工神经网络与支持向量机相比有哪些优势?

ANN(人工神经网络)和 SVM(支持向量机)是监督机器学习和分类的两种流行策略.通常不清楚哪种方法更适合特定项目,我确信答案总是“视情况而定".通常,将两者与贝叶斯分类结合使用. 关于 ANN 与 SVM 的这些关于 Stackoverflow 的问题已经被问到: ANN 和 SVM 分类 ANN之间有什么区别, SVM 和 KNN 在我的分类问题中 文本的支持向量机或人 ..
发布时间:2021-12-14 09:47:32 AI人工智能

在 CvSVM 中获取权重,OpenCV 的 SVM 实现

我在 iOS 上使用 OpenCV(基于 LibSVM)的 SVM 实现.是否可以在训练后获得权重向量? 谢谢! 解决方案 经过处理,我已经能够获得权重.为了获得权重,必须首先获得支持向量,然后将它们乘以 alpha 值相加. //通过将支持向量乘以 alpha 值得到 svm 权重int numSupportVectors = SVM.get_support_vector_cou ..
发布时间:2021-12-14 09:45:52 AI人工智能

svm 缩放输入值

我正在使用 libSVM.假设我的特征值采用以下格式: instance1 : f11, f12, f13, f14实例2:f21、f22、f23、f24实例3:f31、f32、f33、f34实例4:f41、f42、f43、f44……………………………………………………………………………………………………………………………………………………………………实例N : fN1, fN2, fN3, ..
发布时间:2021-12-14 09:41:55 AI人工智能