当我使用Selify Python进行Web自动化时,有没有办法确定文件在Azure数据库中的下载位置? [英] Is there a way to identify where the file gets downloaded in Azure Databricks when I do web automation using Selenium Python?

查看:23
本文介绍了当我使用Selify Python进行Web自动化时,有没有办法确定文件在Azure数据库中的下载位置?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用Selify实现Web自动化,使用Python作为一种语言,并在Chrome浏览器上执行此操作。

我在Azure数据库中有此设置。我想从网站上下载一个Excel,我可以通过点击"导出到Excel"按钮来完成。现在,如果我在我的本地系统中执行同样的操作,它将被下载到我本地机器的下载文件夹中,但有人能帮我找到它现在下载到哪里吗,因为它是通过Azure Databricks笔记本运行的。

有什么方法可以将该文件直接下载到BLOB存储或任何其他特定存储中?先谢谢你。

导出到Excel按钮

exportToExcel = driver.find_element_by_xpath('//*[@id="excelReport"]')
exportToExcel.click()
time.sleep(10)

推荐答案

这些选项可用于将文件上载到Azure Databricks文件系统dBFS。

选项1:使用Databricks CLI将文件从本地计算机上载到dBFS。

Steps for installing and configuring Databricks CLI

安装Databricks cli后,可以使用以下命令将文件复制到dBFS

dbfs cp test.txt dbfs:/test.txt
# Or recursively
dbfs cp -r test-dir dbfs:/test-dir

选项2:DBFS Explorer for Databricks

DBFS资源管理器是作为将文件上载和下载到数据库文件系统(DBFS)的一种快速方法而创建的。这将适用于Databricks的AWS和Azure实例。您需要在Web界面中创建持有者令牌才能连接。

该工具非常基本,现在您可以:[上传、下载、创建文件夹、 删除文件]

从Windows资源管理器/Finder拖放文件

选项3:您可以将数据上载到任何Azure存储帐户,例如[Azure Blob存储,ADLS Gen1/Gen2],并且您可以将Blob存储容器或容器内的文件夹装载到数据库文件系统(DBFS)。装载是指向Blob存储容器的指针,因此数据永远不会在本地同步。

参考:Databricks - Azure Blob storage

这篇关于当我使用Selify Python进行Web自动化时,有没有办法确定文件在Azure数据库中的下载位置?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆