svm - IT屋-程序员软件开发技术分享社区

如何在SkLearning上拆分均衡训练集和测试集上的数据

我正在使用skLearning执行多分类任务。我需要将所有数据拆分为Train_Set和TestSet。我想从每个班级随机抽取相同的样本号。实际上，我觉得这个功能很有趣 X_train, X_test, y_train, y_test = cross_validation.train_test_split(Data, Target, test_size=0.3, random_state= ..

发布时间：2022-09-06 10:19:24 machine-learning scikit-learn svm cross-validation AI人工智能

支持向量机-数据是否有可指示最佳参数的属性(例如，C、伽马)

使用交叉验证来确定最佳参数似乎相当标准。当然，这通常是一个耗时的过程。有什么捷径吗？有没有其他更快的探索性分析形式，可以提供关于哪些值将是最佳的提示？例如，以我目前对机器学习和支持向量机的理解，我可能会做一些事情，比如在C的指数为10的[10e-5，10e5]范围内执行初始网格搜索，然后从那里进行微调。但有没有一种方法可以让我快速估计出最佳的C在10e3和10e5之间，然后执行更具体的搜索？ ..

发布时间：2022-07-12 18:58:44 machine-learning svm cross-validation AI人工智能

可以用Joblib倾倒多个对象吗？

我有这个代码。我可以使用joblib.ump将‘pca’和‘svm_clf’保存到一个文件吗？如果没有，还有其他方法吗？ from sklearn.svm import SVC from sklearn.externals import joblib from sklearn import decomposition from sklearn import svm X = [[1,3,4, ..

发布时间：2022-04-07 23:15:26 python svm pca joblib Python

硬边距支持向量机的Sklearn内置函数

我知道软边距支持向量机有一个内置函数，如下所示。 from sklearn.svm import SVC clf = SVC(C=1, kernel = 'linear') clf.fit(X, y) 但对于硬间隔支持向量机，我们需要C=0，对吗？但当我让C=0时，代码报告错误ValueError: C ..

发布时间：2022-04-07 23:14:17 python scikit-learn svm Python

在R中绘制支持向量机线性分离器

我正在尝试用e1071的支持向量机绘制分隔三类问题的二维超平面(线)。我使用了默认方法(因此不涉及公式)，如下所示： library('e1071') ## S3 method for class 'default': machine ..

发布时间：2022-04-07 23:11:36 r plot machine-learning svm AI人工智能

R-文本分类中的Plot支持向量机模型

我在R中使用的是e1017中的支持向量机模型。我曾使用支持向量机进行文本挖掘和分类。所以我的数据是DTM(从文档语料库获得的文档术语矩阵)。如何开始绘制我的支持向量机模型？下面是我在类预测代码中使用的支持向量机模型 model ..

发布时间：2022-04-07 23:09:58 r machine-learning svm text-classification AI人工智能

将LinearSVC的决策函数转换为概率(Scikit学习Python)

我使用来自SCRKIT学习的线性支持向量机(LinearSVC)来解决二值分类问题。我知道LinearSVC可以给我预测的标签和决策得分，但我想要概率估计(对标签的信心)。由于速度的原因，我想继续使用LinearSVC(与使用线性内核的sklearn.svm.SVC相比)使用Logistic函数将决策分数转换为概率是否合理？ import sklearn.svm as suppmach # ..

发布时间：2022-04-07 23:07:12 python machine-learning scikit-learn svm AI人工智能

在GridSearchCV中使用管道

假设我有这个Pipeline对象： from sklearn.pipeline import Pipeline pipe = Pipeline([ ('my_transform', my_transform()), ('estimator', SVC()) ]) 要将超参数传递给我的支持向量分类器(SVC)，我可以执行如下操作： pipe_parameters = ..

发布时间：2022-04-07 23:05:25 scikit-learn svm pipeline grid-search 其他开发

TypeError：init()获取意外的关键字参数'；iid'；

我使用GridSearchCV和RandomizedSearchCV为我的TCSVM模型找到了最佳参数和最佳分数。现在我想使用BayesSearchCV来与以前的方法进行比较，但是我收到了这个错误__init__() got an unexpected keyword argument 'iid' 这是我使用的代码： model2 = make_pipeline(Standa ..

发布时间：2022-03-02 09:43:49 python data-science svm bayessearchcv Python

支持向量机模型将概率得分大于0.1(默认阈值0.5)的实例预测为正值

我正在处理一个二进制分类问题。在这种情况下，我使用了从skLearning导入的Logistic回归和支持向量机模型。这两个模型用相同的、不平衡的训练数据进行拟合，并调整了类权重。他们也取得了可比的成绩。当我使用这两个预先训练好的模型来预测新的数据集时。LR模型和SVM模型预测的实例数与正数相似。并且预测的实例共享很大的重叠。然而，当我查看被归类为阳性的概率得分时，LR的分布是从0.5到1，而 ..

发布时间：2022-02-21 16:31:00 machine-learning scikit-learn svm prediction AI人工智能

标准化 SVM 的特征值

我一直在玩一些 SVM 实现，我想知道 - 将特征值标准化以适应一个范围的最佳方法是什么?(从 0 到 1) 假设我有 3 个特征值在以下范围内: 3 - 5. 0.02 - 0.05 10-15. 如何将所有这些值转换为 [0,1] 的范围? 如果在训练期间，我将遇到的特征编号 1 的最大值是 5，而在我开始在更大的数据集上使用我的模型后，我会偶然发现高达 7 ..

发布时间：2022-01-24 19:59:24 machine-learning range normalization svm feature-selection AI人工智能

用于测试非线性 SVM 的数据集

我正在实现一个非线性 SVM，我想在一个简单的非线性可分数据上测试我的实现.谷歌没有帮我找到我想要的.你能告诉我在哪里可以找到这样的数据吗?或者至少，我怎样才能手动生成这样的数据? 谢谢，解决方案嗯，SVM 是两类分类器 - 即，这些分类器将数据放置在单个决策边界的任一侧. 因此，我建议一个仅包含两个类的数据集(这不是绝对必要的，因为 SVM 可以通过多次(串行)传递分类器 ..

发布时间：2022-01-21 13:10:06 dataset artificial-intelligence machine-learning svm AI人工智能

在 R 中使用支持向量机 (SVM) 进行时间序列预测

我已尝试搜索，但找不到此问题的具体答案.到目前为止，我能够意识到使用 SVM 可以进行时间序列预测.我浏览了几篇执行相同但没有提及任何代码的论文/文章，而是解释了算法(我不太明白).有些人使用python完成了它.我的问题是:我有一个公司 2010 年到 2017 年的销售额数据(比如单变量).我需要使用 R 中的 SVM 预测 2018 年的销售额.您能否通过一个小示例简单地介绍和解释 R 代码 ..

发布时间：2022-01-11 10:12:40 r time-series svm forecasting 其他开发

这是将训练集投影到特征空间的正确方法吗?MATLAB

我使用以下方法计算了 PCA: 函数 [signals,V] = pca2(data)[M,N] = 大小(数据)；数据 = 重塑(数据，M*N，1)；% 减去每个维度的平均值mn = 平均值(数据，2)；数据= bsxfun(@减号，数据，平均值(数据，1))；% 构造矩阵YY = 数据'*数据/(M*N-1);[V D] = eigs(Y, 10);% 减少到 10 维% 投影原始数据信号 ..

发布时间：2022-01-09 18:56:45 matlab computer-vision svm face-recognition pca 其他开发

将 SVM 与 SURF 结合使用时出错

以下是我的代码，运行良好，但经过长时间处理后，它显示运行时错误 //初始化常量值常量 int nb_cars = files.size();常量 int not_cars = files_no.size();常量 int num_img = nb_cars + not_cars;//获取图片数量//初始化你的训练集.cv::Mat training_mat(num_img,dictionaryS ..

发布时间：2022-01-09 18:54:22 c++ opencv image-processing computer-vision svm C/C++开发

在 OpenCV 2.2 中使用 C++ 语法的 PCA + SVM

我在使用最新的 C++ 语法与 Mat 和 PCA 类一起工作时遇到问题.较旧的 C 语法采用 IplImage* 数组作为参数来执行其处理，而当前 API 仅采用按 Column 或 Row 格式化的 Mat.我采用了 Row 方法，使用 reshape 函数来拟合我的图像矩阵以适合单行.我最终想要获取这些数据，然后使用 SVM 算法进行检测，但是当我这样做时，我的所有数据都只是一个 0 流.有 ..

发布时间：2022-01-09 18:19:49 c++ opencv computer-vision svm pca C/C++开发

支持向量机缩放输入值

我正在使用 libSVM.假设我的特征值采用以下格式: instance1 : f11, f12, f13, f14实例2:f21、f22、f23、f24实例3:f31、f32、f33、f34实例4:f41、f42、f43、f44.........................................实例N:fN1、fN2、fN3、fN4 我认为有两种缩放可以应用. 缩放每个 ..

发布时间：2022-01-09 18:04:42 machine-learning computer-vision svm libsvm AI人工智能

分类分数:SVM

我使用 libsvm 进行多类分类.我如何附加分类分数，以比较分类的置信度，与给定样本的输出为: Class 1: score1第 2 类:分数 2第 3 类:分数 3第 4 类:分数 4 解决方案您可以首先使用一种与全部方法，并通过在 libSVM 中设置决策值选项将它们视为 2class 分类.这是通过将每个类作为正类，将类的其余部分作为每个分类的负类来实现的. 然后比较结果的决 ..

发布时间：2022-01-07 23:25:59 statistics classification svm libsvm 其他开发

文本分类的特征选择和减少

我目前正在做一个项目，一个简单的情绪分析器，这样在单独的案例中会有2和3个类.我使用的语料库在独特的词(大约 200.000)方面非常丰富.我使用词袋方法进行特征选择并减少独特特征的数量，由于消除发生频率的>阈值.最终的一组特征包括大约 20.000 个特征，这实际上减少了 90%，但不足以达到预期的准确性测试预测的强>.我依次使用 LibSVM 和 SVM-light 进行训练和预测(线性和 ..

发布时间：2022-01-02 17:22:29 python nlp svm sentiment-analysis feature-extraction Python

如何将标准化应用于 scikit-learn 中的 SVM?

我正在使用 scikit-learn 的当前稳定版本 0.13.我正在使用 sklearn.svm.LinearSVC. 在 scikit-learn 文档的关于预处理的章节中，我已经阅读以下内容: 在学习算法的目标函数中使用的许多元素(例如支持向量机的 RBF 内核或线性模型的 l1 和 l2 正则化器)假设所有特征都以零为中心并且具有相同顺序的方差.如果一个特征的方差比其他特征大几 ..

发布时间：2021-12-25 14:52:49 python scikit-learn classification svm normalization Python

svm相关内容