papermill相关内容

Jupyter笔记本和造纸厂辅助气流中的ETL

所以我的问题是,我在气流中构建ETL管道,但真正要先在Jupyter笔记本中开发和测试提取、转换和加载功能。因此,我总是在Airflow Python操作符代码和Jupyter笔记本之间来回复制粘贴,效率相当低!我的直觉告诉我,所有这些都可以自动完成。 基本上,我希望用Jupyter编写我的提取、转换和加载函数,并让它们保留在那里,同时仍然在气流中运行管道,并显示提取、转换和加载任务,以及重 ..
发布时间:2022-03-01 20:34:54 Python

如何每天自动运行带有 Python 代码的 Jupyter Notebook?

我在 Jupyter notebook 中有一些 Python 代码,我需要每天自动运行它,所以我想知道是否有办法设置它.我非常感谢您对此的任何建议. 解决方案 如果想要更高的质量,最好结合气流.我将它们打包在一个 docker 镜像中,https://github.com/michaelchanwahyan/datalab.> 它是通过修改一个开源包nbparameterize并集成e ..
发布时间:2021-12-31 23:27:11 Python

在 jupyter/ipython notebook 中将命令行参数传递给 argv

我想知道是否可以在 jupyter/ipython 笔记本中使用命令行参数填充 sys.argv(或其他结构),类似于通过 python 脚本完成的方式. 例如,如果我要按如下方式运行 python 脚本: python test.py 错误 然后 sys.argv 将包含参数 False.但是如果我以类似的方式运行 jupyter notebook: jupyter no ..
发布时间:2021-12-31 23:09:38 Python

气流错误 - 出现意外的关键字参数“min"

我正在尝试运行一个非常简单的测试 DAG 来掌握 GCP Cloud Composer 的基本功能,但是每次我触发 DAG 时,都会弹出一个令人讨厌的错误,我似乎找不到任何有关怎么解决. 错误是: 2020-03-18 22:20:56,627] {taskinstance.py:1059} 错误 - __init__() 得到一个意外的关键字参数 'min'@-@{"workflow": ..

Jupyter Notebooks和Papermill辅助的气流中的ETL

因此,我的问题是我在Airflow中构建ETL管道,但实际上首先要在Jupyter笔记本电脑中开发和测试Extract,Transform和Load功能.因此,我最终总是在我的Airflow Python操作员代码和Jupyter笔记本之间来回复制粘贴,效率很低!我的直觉告诉我,所有这些都可以自动化. 基本上,我想在Jupyter中编写我的Extract,Transform和Load函数,并 ..
发布时间:2021-05-18 18:35:12 其他开发

如何每天自动运行python jupyter笔记本

我在python jupyter笔记本中有一个代码,但是我每天都需要运行此代码,所以我想知道是否有一种设置方法,对此我非常感谢 解决方案 如果要获得更高的质量,最好与气流结合使用. 我将它们打包在一个docker映像中, https://github.com/michaelchanwahyan/datalab . 这是通过修改开源软件包nbparameterize并集成传递的参数(例如e ..
发布时间:2020-04-25 06:34:17 Python

如何在K8s上运行的JuPyterHub上为每个笔记本设置参数

我想设置一些此处定义的参数( https://github.com /nteract/papermill#python-version-support ).问题是,我希望能够通过UI做到这一点.我在群集上安装了一个JHub,在打开它时,我希望默认情况下设置某些参数. 此外,当我通过papermill传递参数时(上面的脚本保存在某个地方,然后我将通过papermill运行它),我希望后者覆盖前 ..
发布时间:2020-04-25 06:24:37 其他开发

从python代码连接到远程python内核

我一直在使用 PaperMill 定期执行我的python笔记本.要执行计算密集型笔记本,我需要连接到在我的EMR集群中运行的远程内核. 对于Jupyter笔记本,我可以通过使用jupyter notebook --gateway-url=http://my-gateway-server:8888启动jupyter服务器来做到这一点,并且能够在远程内核上执行我的代码.但是,如何让我的本地py ..
发布时间:2020-04-25 06:22:13 Python

在jupyter/ipython笔记本中将命令行参数传递给argv

我想知道是否有可能在jupyter/ipython笔记本中用命令行参数填充sys.argv(或其他结构),这与通过python脚本完成操作的方式类似. 例如,如果我要按如下方式运行python脚本: python test.py False 然后,sys.argv将包含参数False.但是,如果我以类似的方式运行jupyter笔记本,则: jupyter notebook ..