svm相关内容

支持向量机-数据是否有可指示最佳参数的属性(例如,C、伽马)

使用交叉验证来确定最佳参数似乎相当标准。当然,这通常是一个耗时的过程。有什么捷径吗?有没有其他更快的探索性分析形式,可以提供关于哪些值将是最佳的提示? 例如,以我目前对机器学习和支持向量机的理解,我可能会做一些事情,比如在C的指数为10的[10e-5,10e5]范围内执行初始网格搜索,然后从那里进行微调。但有没有一种方法可以让我快速估计出最佳的C在10e3和10e5之间,然后执行更具体的搜索? ..
发布时间:2022-07-12 18:58:44 AI人工智能

可以用Joblib倾倒多个对象吗?

我有这个代码。我可以使用joblib.ump将‘pca’和‘svm_clf’保存到一个文件吗?如果没有,还有其他方法吗? from sklearn.svm import SVC from sklearn.externals import joblib from sklearn import decomposition from sklearn import svm X = [[1,3,4, ..
发布时间:2022-04-07 23:15:26 Python

硬边距支持向量机的Sklearn内置函数

我知道软边距支持向量机有一个内置函数,如下所示。 from sklearn.svm import SVC clf = SVC(C=1, kernel = 'linear') clf.fit(X, y) 但对于硬间隔支持向量机,我们需要C=0,对吗?但当我让C=0时,代码报告错误ValueError: C ..
发布时间:2022-04-07 23:14:17 Python

将LinearSVC的决策函数转换为概率(Scikit学习Python)

我使用来自SCRKIT学习的线性支持向量机(LinearSVC)来解决二值分类问题。我知道LinearSVC可以给我预测的标签和决策得分,但我想要概率估计(对标签的信心)。由于速度的原因,我想继续使用LinearSVC(与使用线性内核的sklearn.svm.SVC相比)使用Logistic函数将决策分数转换为概率是否合理? import sklearn.svm as suppmach # ..
发布时间:2022-04-07 23:07:12 AI人工智能

支持向量机模型将概率得分大于0.1(默认阈值0.5)的实例预测为正值

我正在处理一个二进制分类问题。在这种情况下,我使用了从skLearning导入的Logistic回归和支持向量机模型。这两个模型用相同的、不平衡的训练数据进行拟合,并调整了类权重。他们也取得了可比的成绩。当我使用这两个预先训练好的模型来预测新的数据集时。LR模型和SVM模型预测的实例数与正数相似。并且预测的实例共享很大的重叠。 然而,当我查看被归类为阳性的概率得分时,LR的分布是从0.5到1,而 ..
发布时间:2022-02-21 16:31:00 AI人工智能

标准化 SVM 的特征值

我一直在玩一些 SVM 实现,我想知道 - 将特征值标准化以适应一个范围的最佳方法是什么?(从 0 到 1) 假设我有 3 个特征值在以下范围内: 3 - 5. 0.02 - 0.05 10-15. 如何将所有这些值转换为 [0,1] 的范围? 如果在训练期间,我将遇到的特征编号 1 的最大值是 5,而在我开始在更大的数据集上使用我的模型后,我会偶然发现高达 7 ..

用于测试非线性 SVM 的数据集

我正在实现一个非线性 SVM,我想在一个简单的非线性可分数据上测试我的实现.谷歌没有帮我找到我想要的.你能告诉我在哪里可以找到这样的数据吗?或者至少,我怎样才能手动生成这样的数据? 谢谢, 解决方案 嗯,SVM 是两类分类器 - 即,这些分类器将数据放置在单个决策边界的任一侧. 因此,我建议一个仅包含两个类的数据集(这不是绝对必要的,因为 SVM 可以通过多次(串行)传递分类器 ..

在 R 中使用支持向量机 (SVM) 进行时间序列预测

我已尝试搜索,但找不到此问题的具体答案.到目前为止,我能够意识到使用 SVM 可以进行时间序列预测.我浏览了几篇执行相同但没有提及任何代码的论文/文章,而是解释了算法(我不太明白).有些人使用python完成了它.我的问题是:我有一个公司 2010 年到 2017 年的销售额数据(比如单变量).我需要使用 R 中的 SVM 预测 2018 年的销售额.您能否通过一个小示例简单地介绍和解释 R 代码 ..
发布时间:2022-01-11 10:12:40 其他开发

这是将训练集投影到特征空间的正确方法吗?MATLAB

我使用以下方法计算了 PCA: 函数 [signals,V] = pca2(data)[M,N] = 大小(数据);数据 = 重塑(数据,M*N,1);% 减去每个维度的平均值mn = 平均值(数据,2);数据= bsxfun(@减号,数据,平均值(数据,1));% 构造矩阵YY = 数据'*数据/(M*N-1);[V D] = eigs(Y, 10);% 减少到 10 维% 投影原始数据信号 ..
发布时间:2022-01-09 18:56:45 其他开发

在 OpenCV 2.2 中使用 C++ 语法的 PCA + SVM

我在使用最新的 C++ 语法与 Mat 和 PCA 类一起工作时遇到问题.较旧的 C 语法采用 IplImage* 数组作为参数来执行其处理,而当前 API 仅采用按 Column 或 Row 格式化的 Mat.我采用了 Row 方法,使用 reshape 函数来拟合我的图像矩阵以适合单行.我最终想要获取这些数据,然后使用 SVM 算法进行检测,但是当我这样做时,我的所有数据都只是一个 0 流.有 ..
发布时间:2022-01-09 18:19:49 C/C++开发

支持向量机缩放输入值

我正在使用 libSVM.假设我的特征值采用以下格式: instance1 : f11, f12, f13, f14实例2:f21、f22、f23、f24实例3:f31、f32、f33、f34实例4:f41、f42、f43、f44.........................................实例N:fN1、fN2、fN3、fN4 我认为有两种缩放可以应用. 缩放每个 ..
发布时间:2022-01-09 18:04:42 AI人工智能

分类分数:SVM

我使用 libsvm 进行多类分类.我如何附加分类分数,以比较分类的置信度,与给定样本的输出为: Class 1: score1第 2 类:分数 2第 3 类:分数 3第 4 类:分数 4 解决方案 您可以首先使用一种与全部方法,并通过在 libSVM 中设置决策值选项将它们视为 2class 分类.这是通过将每个类作为正类,将类的其余部分作为每个分类的负类来实现的. 然后比较结果的决 ..
发布时间:2022-01-07 23:25:59 其他开发

文本分类的特征选择和减少

我目前正在做一个项目,一个简单的情绪分析器,这样在单独的案例中会有2和3个类.我使用的语料库在独特的词(大约 200.000)方面非常丰富.我使用词袋方法进行特征选择并减少独特特征的数量,由于消除发生频率的>阈值.最终的一组特征包括大约 20.000 个特征,这实际上减少了 90%,但不足以达到预期的准确性测试预测的强>.我依次使用 LibSVM 和 SVM-light 进行训练和预测(线性 和 ..
发布时间:2022-01-02 17:22:29 Python

如何将标准化应用于 scikit-learn 中的 SVM?

我正在使用 scikit-learn 的当前稳定版本 0.13.我正在使用 sklearn.svm.LinearSVC. 在 scikit-learn 文档的关于预处理的章节中,我已经阅读以下内容: 在学习算法的目标函数中使用的许多元素(例如支持向量机的 RBF 内核或线性模型的 l1 和 l2 正则化器)假设所有特征都以零为中心并且具有相同顺序的方差.如果一个特征的方差比其他特征大几 ..
发布时间:2021-12-25 14:52:49 Python