pipeline 第17页 - IT屋-程序员软件开发技术分享社区

尝试使用github操作将代码部署到github包时出现错误代码400

我正在为使用github动作工作流将maven项目部署到github包的(貌似)简单的任务而苦苦挣扎.首先，这是我在maven deploy阶段遇到的错误: [ERROR] Failed to execute goal org.apache.maven.plugins:maven-deploy-plugin:2.7:deploy (default-deploy) on project [pr ..

发布时间：2020-05-07 22:29:33 java maven github repository pipeline Java开发

如何在收益/收益率中停止多余的重复，同时仍保持给定键:值对的运行总额?

将Pcollection传递到下一个变换后，对于给定的街道和事故计数，我只需要一个KV对，就可以将变换的收益/收益相乘. 我的理解是，生成器可以通过保持值来帮助实现这一点，但这只能解决部分问题.我曾尝试确定大小，然后再发送到下一个转换，但是我还没有找到任何能使我真正传递Pcollection元素大小的方法. class CountAccidents(beam.DoFn): ac ..

发布时间：2020-05-05 14:34:15 python dictionary generator pipeline apache-beam Python

管道中的Sklearn_pandas返回TypeError:"builtin_function_or_method"对象不可迭代

我有一个具有分类和数字功能的数据集，我想在其上应用一些转换，然后再加上XGBClassifier. 链接到数据集: https://www .kaggle.com/blastchar/telco-customer-churn 由于数字和分类特征的转换不同，因此我使用了sklearn_pandas及其DataFrameMapper. 要对分类特征执行一键编码，我想使用DictVec ..

发布时间：2020-05-04 10:04:39 python machine-learning scikit-learn pipeline sklearn-pandas AI人工智能

在管道中的分类器之后使用指标

我将继续研究管道.我的目标是仅使用流水线执行机器学习的每个步骤.使我的管道与其他用例相适应将更加灵活和容易.所以我该怎么做: 第1步:填写NaN值第2步:将分类值转换为数字第3步:分类器第4步:GridSearch 第5步:添加指标(失败) 这是我的代码: import pandas as pd from sklearn.base import BaseEstima ..

发布时间：2020-05-04 09:57:39 python machine-learning scikit-learn pipeline grid-search AI人工智能

为什么sklearn Pipeline调用transform()的次数比fit()的次数多?

在大量阅读并检查了不同verbose参数设置下的pipeline.fit()操作之后，我仍然感到困惑，为什么我的管道会多次访问某个步骤的transform方法. 下面是一个简单的示例，其中pipeline，fit和GridSearchCV使用三折交叉验证，但是只有一个超参数集的param-grid.因此，我希望有3条管道贯穿整个流程.正如预期的那样，step1和step2都有fit调用了三次 ..

发布时间：2020-05-04 09:53:58 python machine-learning scikit-learn pipeline AI人工智能

如何在sklearn的管道中腌制单个步骤?

我正在使用sklearn中的Pipeline对文本进行分类. 在此示例Pipeline中，我有一个TfidfVectorizer以及一些用FeatureUnion和一个分类器包装的自定义功能，作为Pipeline步骤，然后我拟合训练数据并进行预测: from sklearn.pipeline import FeatureUnion, Pipeline from sklearn.feat ..

发布时间：2020-05-04 09:53:11 python machine-learning scikit-learn classification pipeline AI人工智能

将自定义函数放在Sklearn管道中

在我的分类方案中，有几个步骤，包括: SMOTE(综合少数族裔过采样技术) 选择功能的Fisher标准标准化(Z分数标准化) SVC(支持向量分类器) 上面方案中要调整的主要参数是百分位(2.)和SVC的超参数(4.)，我想通过网格搜索进行调整. 当前解决方案在方案clf = Pipeline([('normal',preprocessing.StandardScaler ..

发布时间：2020-05-04 09:40:53 machine-learning scikit-learn pipeline cross-validation feature-selection AI人工智能

如何在sklearn管道中适应不同的输入?

我正在使用sklearn中的Pipeline对文本进行分类. 在此示例管道中，我有一个TfIDF矢量化器，以及一些自定义功能，这些特征包装有FeatureUnion和一个分类器，作为管道的步骤，然后拟合训练数据并进行预测: from sklearn.pipeline import FeatureUnion, Pipeline from sklearn.feature_extractio ..

发布时间：2020-05-04 09:40:22 python machine-learning scikit-learn classification pipeline AI人工智能

为什么我在python的sklearn中使用pipline和不使用pipline获得不同的值

我将recursive feature elimination with cross-validation (rfecv)与GridSearchCV和RandomForest分类器结合使用，如下所示使用管道和不使用管道. 我的带有管道的代码如下. X = df[my_features_all] y = df['gold_standard'] #get development and ..

发布时间：2020-05-04 09:19:04 python machine-learning scikit-learn pipeline cross-validation AI人工智能

如果我们在管道中包含转换器，来自scikit-learn的cross_val_score和gridsearchCV的k折交叉验证分数是否有偏差?

应该使用诸如StandardScaler之类的数据预处理器来fit_transform训练集，并且仅转换(不适合)测试集.我希望相同的拟合/转换过程适用于交叉验证以调整模型.但是，我发现cross_val_score和GridSearchCV用预处理器拟合了整个火车集合(而不是fit_transform inner_train集合，并变换了inner_validation集合).我相信这可以人为地 ..

发布时间：2020-05-04 09:17:26 machine-learning scikit-learn pipeline cross-validation grid-search AI人工智能

繁重的处理:阶段还是循环线程?

我需要创建一个处理大量图像的程序.该过程中大约需要10个不同的阶段，这些阶段需要顺序发生. 我想问一问，使用下面描述的管道模式，在每个处理阶段都有自己的线程和缓冲区的情况下，创建一个管道是否更好: https://msdn.microsoft.com/en-us/library/ff963548.aspx 或创建一个线程池并仅使用Parallel.Foreach将一个图像分配给一个线程 ..

发布时间：2020-05-04 05:43:47 c# multithreading loops pipeline C#/.NET

使用Spark ml进行逻辑回归(数据框)

我为逻辑回归编写了以下代码，我想使用spark.ml提供的管道API.但是，在尝试打印系数和截距后，它给了我一个错误.另外，我在计算混淆矩阵和其他指标(如精度，召回率)时遇到了麻烦. #Logistic Regression: from pyspark.mllib.linalg import Vectors from pyspark.ml.classification import Logi ..

发布时间：2020-05-04 03:21:38 python pyspark pipeline logistic-regression apache-spark-ml Python

Spark:从管道模型中提取ML Logistic回归模型的摘要

我估计使用管道进行逻辑回归. 我在进行逻辑回归之前的最后几行: from pyspark.ml.feature import VectorAssembler from pyspark.ml.classification import LogisticRegression lr = LogisticRegression(featuresCol="lr_features", labelCo ..

发布时间：2020-05-04 03:20:22 python apache-spark pyspark pipeline logistic-regression Python

是否可以在Azure Data Factory管道中向数据添加具有特定值的列

我要将数据从系统X复制为镶木地板文件或excel文件到blob存储中，是否可以再增加一个步骤，以帮助我在管道运行ID或触发器ID上再增加一列? 先谢谢您解决方案您要从哪里提取数据?如果它是数据库，则很容易，因为您可以将其添加到选择数据时使用的sql语句中.例如: select *, NewColumn='Value' from yourTable 如果您想为每种可能的数 ..

发布时间：2020-05-03 08:46:58 azure logging metadata pipeline azure-data-factory-2 其他开发

在C中实现流水线.做到这一点的最佳方法是什么?

我想不出任何可行的方法来在c中实现流水线工作.这就是为什么我决定在这里写的原因.我必须说，我了解管道/叉子/mkfifo的工作方式.我已经看到了很多实施2-3条管道的示例.这简单.当我必须实现Shell时，我的问题就开始了，而管道计数是未知的. 我现在所拥有的: 例如. ls -al | tr a-z A-Z | tr A-Z a-z | tr a-z A-Z 我将这样的行转换为类 ..

发布时间：2020-05-01 08:46:07 c linux pipe pipeline mkfifo 服务器开发

预测现代超标量处理器上的操作延迟需要考虑哪些因素，我该如何手动计算它们?

我希望能够手动预测任意算术运算(即没有分支或内存，尽管这也很好)，但考虑到指令重新排序，x86-64汇编代码在给定的特定架构下将采用多长时间，超标量，延迟，CPI等. 要实现此目标，必须遵循什么/描述规则? 我认为我已经弄清了一些初步规则，但是在将任何示例代码分解到如此详细的级别时，我还找不到任何参考，因此我不得不做出一些猜测. (例如，英特尔优化手册几乎没有对提及指令进行重新排序.) ..

发布时间：2020-04-29 03:32:58 assembly x86-64 pipeline latency superscalar 其他开发

sh和ksh之间的管道行为不同

我已将问题隔离到以下代码段中: 以下说明，使用ksh运行脚本时，会将空字符串分配给LATEST_FILE_NAME=''；但是使用sh运行时，脚本会将值正确分配给变量$LATEST_FILE_NAME.反过来，这会影响$FILE_LIST_COUNT的值. 但是由于脚本位于KornShell(ksh)中，所以我不确定是什么引起了该问题. 当我注释掉下面一行中的tee命令时，ksh脚本可以 ..

发布时间：2020-04-26 13:06:55 shell scripting sh ksh pipeline 其他开发

Sklearn Pipeline:如何为kmeans构建文本文本?

我的文字如下所示: list1 = ["My name is xyz", "My name is pqr", "I work in abc"] 以上内容是使用kmeans对文本进行聚类的训练集. list2 = ["My name is xyz", "I work in abc"] 以上是我的测试集. 我已经建立了矢量化器和模型，如下所示: vectorizer ..

发布时间：2020-04-26 10:20:18 python machine-learning scikit-learn k-means pipeline AI人工智能

使用带有管道和不带管道的Scikit Learn StandardScaler进行Keras回归

我正在比较使用Scikit-Learn StandardScaler的两个有关KerasRegressor程序的性能:一个使用Scikit-Learn Pipeline的程序和一个不使用Pipeline的程序. 程序1: estimators = [] estimators.append(('standardise', StandardScaler())) estimators.app ..

发布时间：2020-04-25 10:41:23 python scikit-learn keras pipeline Python

如何将Keras模型插入scikit-learn管道?

我将Scikit-Learn自定义管道(sklearn.pipeline.Pipeline)与RandomizedSearchCV结合使用以进行超参数优化.效果很好. 现在，我想在管道中插入Keras模型作为第一步.模型的参数应优化.然后，应该稍后在管道中通过其他步骤使用计算(拟合)的Keras模型，因此我认为我必须将模型存储为全局变量，以便其他管道步骤可以使用它.是这样吗? 我知道K ..

发布时间：2020-04-25 09:50:02 machine-learning scikit-learn pipeline keras hyperparameters AI人工智能

pipeline相关内容