kedro相关内容
我想弄清楚如何在本地和 S3 上存储中间 Kedro 管道对象.特别是,假设我在 S3 上有一个数据集: my_big_dataset.hdf5:类型:kedro.extras.datasets.pandas.HDFDataSet文件路径:“s3://my_bucket/data/04_feature/my_big_dataset.hdf5"; 我想通过 S3 URI 引用目录中的这些对象,以
..
我正在使用 tf.data.Dataset 准备用于训练 tf.kears 模型的流数据集.使用 kedro,有没有办法创建节点并返回创建的 tf.data.Dataset 在下一个训练节点中使用它? MemoryDataset 可能不会工作,因为 tf.data.Dataset 不能被腌制(deepcopy 是不可能的),另见 这个问题.根据 issue #91,MemoryDataset
..
kedro 建议将参数存储在 conf/base/parameters.yml .假设它看起来像这样: step_size:1model_params:学习率:0.01test_data_ratio:0.2num_train_steps:10000 现在想象一下我有一些 data_engineering 管道,其 nodes.py 具有看起来像这样的功能: def some_pipel
..
在Kedro管道中,节点(类似于python函数)是按顺序声明的.在某些情况下,一个节点的输入就是前一个节点的输出.但是,有时,在命令行中调用kedro run API时,节点不会按顺序运行. 在kedro文档中,它说默认情况下节点是按顺序运行的. 我的run.py代码: def main( tags: Iterable[str] = None, env: str = None,
..