kedro - IT屋-程序员软件开发技术分享社区

如何编目数据集 &通过 S3 URI 建模，但保留本地副本?

我想弄清楚如何在本地和 S3 上存储中间 Kedro 管道对象.特别是，假设我在 S3 上有一个数据集: my_big_dataset.hdf5:类型:kedro.extras.datasets.pandas.HDFDataSet文件路径:“s3://my_bucket/data/04_feature/my_big_dataset.hdf5"；我想通过 S3 URI 引用目录中的这些对象，以 ..

发布时间：2021-10-27 19:04:01 amazon-s3 caching devops kedro 其他开发

如何将 tf.data.Dataset 与 kedro 一起使用?

我正在使用 tf.data.Dataset 准备用于训练 tf.kears 模型的流数据集.使用 kedro，有没有办法创建节点并返回创建的 tf.data.Dataset 在下一个训练节点中使用它? MemoryDataset 可能不会工作，因为 tf.data.Dataset 不能被腌制(deepcopy 是不可能的)，另见这个问题.根据 issue #91，MemoryDataset ..

发布时间：2021-06-17 18:43:59 tensorflow pickle tensorflow-datasets kedro tf.data.dataset 其他开发

Kedro-如何将嵌套参数直接传递给节点

kedro 建议将参数存储在 conf/base/parameters.yml .假设它看起来像这样: step_size:1model_params:学习率:0.01test_data_ratio:0.2num_train_steps:10000 现在想象一下我有一些 data_engineering 管道，其 nodes.py 具有看起来像这样的功能: def some_pipel ..

发布时间：2021-05-31 18:37:46 machine-learning yaml pipeline kedro AI人工智能

如何按kedro管道中的声明顺序运行节点?

在Kedro管道中，节点(类似于python函数)是按顺序声明的.在某些情况下，一个节点的输入就是前一个节点的输出.但是，有时，在命令行中调用kedro run API时，节点不会按顺序运行. 在kedro文档中，它说默认情况下节点是按顺序运行的. 我的run.py代码: def main( tags: Iterable[str] = None, env: str = None, ..

发布时间：2020-05-04 10:08:53 python machine-learning kedro AI人工智能

kedro相关内容