pipeline 第13页 - IT屋-程序员软件开发技术分享社区

从Scikit(Python)中的管道检索中间特征

我使用的管道与在此示例中: >>> text_clf = Pipeline([('vect', CountVectorizer()), ... ('tfidf', TfidfTransformer()), ... ('clf', MultinomialNB()), ... ]) 我使用GridSearch ..

发布时间：2020-05-28 00:44:32 python scikit-learn pipeline Python

从sklearn.pipeline.Pipeline获取转换器结果

我正在使用sklearn.pipeline.Pipeline对象进行群集. pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1), ('transformer2': transformer2), ..

发布时间：2020-05-28 00:44:29 python-2.7 scikit-learn pipeline 其他开发

单例数组array(<函数在0x7f3a311320d0> ;, dtype = object)被认为是有效的集合

不确定如何解决.任何帮助，不胜感激.我看到了向量化:不是有效的集合，但不确定我是否理解 train = df1.iloc[:,[4,6]] target =df1.iloc[:,[0]] def train(classifier, X, y): X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2 ..

发布时间：2020-05-28 00:44:25 python pandas scikit-learn pipeline train-test-split Python

目标是让每个人都可以就每条失败的管道获得通知(由他们自行决定).当前，我们中的任何人都可以在该项目分支上运行管道，并且管道的创建者会收到一封电子邮件，其他任何人都不会.我尝试在项目，组和全局级别将通知级别设置为watch和custom (with failed pipelines checked)，但没有成功.关于通知的帮助页面说，自定义通知级别的失败管道复选框会通知作者流水线(这是我正在经历的行 ..

发布时间：2020-05-28 00:44:23 notifications gitlab pipeline 其他开发

使用VectorAssembler处理动态列

使用spark矢量汇编器，需要预先定义要组装的列. 但是，如果在前面步骤将修改数据帧的列的管道中使用向量汇编器，如何在不手动对所有值进行硬编码的情况下指定列? 因为当调用向量汇编器的构造函数时，df.columns将不包含正确的值，但是我看不到另一种处理或拆分管道的方法，这也很糟糕因为CrossValidator将不再正常工作. val vectorAssembler = new ..

发布时间：2020-05-28 00:44:19 apache-spark pipeline apache-spark-ml 其他开发

sklearn中带有数据标签的定制变压器Mixin

我正在做一个小项目，尝试使用SMOTE“综合少数族裔过采样技术"，我的数据不平衡.. 我为SMOTE功能创建了一个定制的TransformerMixin .. class smote(BaseEstimator, TransformerMixin): def fit(self, X, y=None): print(X.shape, ' ', type(X)) # ..

发布时间：2020-05-28 00:44:15 python scikit-learn pipeline Python

将sklearn管道+嵌套交叉验证放在一起进行KNN回归

我试图弄清楚如何为sklearn.neighbors.KNeighborsRegressor构建工作流程，其中包括: 标准化功能特征选择(20个数字特征的最佳子集，没有特定总数) 交叉验证1至20范围内的超参数K 交叉验证模型将RMSE用作错误指标在scikit-learn中有很多不同的选项，我在决定我需要的课程时有点不知所措. 除了sklearn.neighbor ..

发布时间：2020-05-28 00:44:12 python scikit-learn pipeline feature-selection hyperparameters Python

Pipeline中用于GridSearchCV的备用不同模型

我想在sklearn中构建管道并使用GridSearchCV测试不同的模型. 仅是一个示例(请不要注意选择了哪种特定模型): reg = LogisticRegression() proj1 = PCA(n_components=2) proj2 = MDS() proj3 = TSNE() pipe = [('proj', proj1), ('reg' , reg)] pipe ..

发布时间：2020-05-28 00:44:08 python scikit-learn pipeline cross-validation grid-search Python

在资产管道中需要树

我在资产管道中有一个名为typefaces的文件夹.它无需添加application.rb即可工作. 在目录中，我有不同的字体类型，例如文件夹中的.eof，.ttf等 Assets Typefaces Eof ...files Ttf ...files 除非字体在资产/字体中，否则它们不会成为资产管 ..

发布时间：2020-05-28 00:43:37 ruby-on-rails ruby pipeline assets 其他开发

sklearn中管道对象的返回系数

我已经将Pipeline对象与RandomizedSearchCV pipe_sgd = Pipeline([('scl', StandardScaler()), ('clf', SGDClassifier(n_jobs=-1))]) param_dist_sgd = {'clf__loss': ['log'], ' ..

发布时间：2020-05-28 00:43:26 python scikit-learn pipeline cross-validation Python

R:在管道中合并几个gsub()函数

要清除一些混乱的数据，我想开始使用管道%>%，但是如果gsub()不在管道的开头，则我的R代码无法正常工作，应该延迟很晚(注意:这个问题是不关心适当的导入，但与数据清理有关. 简单的例子: df ..

发布时间：2020-05-28 00:43:23 r pipeline gsub 其他开发

是否可以在spark.ml管道中访问estimator属性?

我在Spark 1.5.1中有一个spark.ml管道，该管道由一系列转换器和一个k均值估计器组成.我希望能够访问 KMeansModel .clusterCenters居中，但无法确定具体方法.是否有与sklearn的pipeline.named_steps功能等效的spark.ml? 我发现了此答案，其中提供了两种选择.如果我将k-means模型从管道中取出并单独进行拟合，则第一个方法可 ..

发布时间：2020-05-28 00:43:20 scala apache-spark pipeline apache-spark-ml 其他开发

如何在Sklearn管道中执行Onehotencoding

我正在尝试对我的Pandas数据框的分类变量进行热编码，其中包括分类变量和继续变量.我意识到可以使用pandas .get_dummies()函数轻松完成此操作，但是我需要使用管道，以便稍后可以生成PMML文件. 这是创建映射器的代码.我要编码的类别变量存储在名为“假人"的列表中. from sklearn_pandas import DataFrameMapper from skle ..

发布时间：2020-05-28 00:43:17 python scikit-learn pipeline sklearn-pandas Python

如何在node.js中流水线到Redis?

我有很多数据要插入(SET \ INCR)到Redis DB，所以我正在寻找管道 \ node.js a href ="http://redis.io/topics/mass-insert">大量插入. 我在node.js中找不到任何好的示例/API，因此任何帮助都将非常有用！解决方案是的，我必须同意缺少示例，但是我设法创建了一个流，在该流上我批量发送了多个插入命令. 您应 ..

发布时间：2020-05-28 00:43:15 node.js redis pipeline node-redis 其他开发

如何在交叉验证和GridSearchCV中实现SMOTE

我对Python比较陌生.您可以帮助我将SMOTE的实施改进到适当的流程吗?我想要的是对每个k倍迭代的训练集应用过采样和欠采样，以便在平衡的数据集上训练模型，并在不平衡的遗漏片段上进行评估.问题是，当我这样做时，无法使用熟悉的sklearn界面进行评估和网格搜索. 是否可以制作类似于model_selection.RandomizedSearchCV的内容.我对此: df = pd.r ..

发布时间：2020-05-28 00:43:11 python scikit-learn pipeline cross-validation grid-search Python

如何使用"if"管道中的语句

我正在尝试在管道内使用if. 我知道有where(别名为?)过滤器，但是如果我想仅在满足特定条件的情况下才激活过滤器，该怎么办? 我的意思是，例如: get-something | ? {$_.someone -eq 'somespecific'} | format-table 如何在管道内使用if来打开/关闭过滤器?是否有可能?有道理吗? 谢谢已编辑以澄清 ..

发布时间：2020-05-28 00:43:09 powershell pipeline conditional-statements statements 其他开发

sklearn估计器管道的参数无效

我正在使用Python 2.7和sklearn 0.16实现O'Reilly的书" Python机器学习入门"中的示例. 我正在使用的代码: pipe = make_pipeline(TfidfVectorizer(), LogisticRegression()) param_grid = {"logisticregression_C": [0.001, 0.01, 0.1, 1, 1 ..

发布时间：2020-05-28 00:43:06 python scikit-learn pipeline grid-search Python

Sklearn如何保存使用Joblib或Pickle从管道和GridSearchCV创建的模型?

使用pipeline和GridSearchCV确定最佳参数后，如何在pickle/joblib中重新使用此过程?我看到了当它是单个分类器时该怎么做... from sklearn.externals import joblib joblib.dump(clf, 'filename.pkl') 但是在执行并完成gridsearch之后，如何使用最佳参数保存总体pipeline? 我 ..

发布时间：2020-05-28 00:43:03 python scikit-learn pipeline grid-search Python

python管道只有标准输入，输出一次，怎么办两次或更多次

成功的python管道标准输入，仅此源一次 main.py import subprocess from subprocess import PIPE, STDOUT player_pipe = subprocess.Popen(["source\call.py", 'arg1'], stdin=PIPE, stdout=PIPE, stderr=STDOUT, shell ..

发布时间：2020-05-28 00:43:01 python pipeline Python

配置Azure DevOps电子邮件模板

我已配置 Microsoft Azure DevOps 来构建我们的软件并自动发布它. (通过内部版本和发布管道) 成功发布后，我将其设置为向所有项目成员发送电子邮件. 我的问题是:我可以以某种方式配置此电子邮件吗? 例如我需要删除“摘要"部分. Azure Devops是否可以通过某种方式实现? 当前电子邮件的屏幕截图: 解决方案否，当前您无法配置电子邮件模板.有一个 ..

发布时间：2020-05-28 00:42:58 azure azure-devops azure-pipelines pipeline azure-pipelines-release-pipeline 其他开发

pipeline相关内容