ADF-如何将包含多个工作表的Excel工作表复制到单独的.csv文件中 [英] ADF - How to copy an Excel Sheet with Multiple Sheets into separate .csv files

查看:60
本文介绍了ADF-如何将包含多个工作表的Excel工作表复制到单独的.csv文件中的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我当前有一个包含多个工作表(超过11个)的Excel文件。此Excel文件当前位于远程文件服务器中。我正在尝试使用Azure Data FactoryV2复制Excel文件,并在ADLS Gen2文件夹中将每个工作表拆分为其自己的.csv文件。这是因为并不是每个选项卡都有相同的架构,我希望以后只选择有效的。

我目前有一个ADF数据集,它正确地指向Excel数据集,并使用@Dataet.SheetName为工作表名称创建了一个参数。我不确定下一步该去哪里。创建新管道后,我尝试将复制活动嵌套在ForEach活动中,但它要求提供SheetName值。

如何构造此管道以获取Excel文件中存在的工作表的名称,然后为每个工作表迭代复制活动?我不能假设我知道工作表的名称或将有多少工作表。如果可能,我希望避免为Excel文件创建多个数据集。

如果您有任何见解,我们将不胜感激。

在推荐答案中获取Excel工作表名称列表尚不受支持,您可以投票here

  1. 因此您可以使用azure funcion获取工作表名称。
import pandas

xl = pandas.ExcelFile('data.xlsx')

# see all sheet names
print(xl.sheet_names )

  1. 然后在ADF中使用数组类型变量来获取和遍历该数组。

这篇关于ADF-如何将包含多个工作表的Excel工作表复制到单独的.csv文件中的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
相关文章
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆