azure-data-flow相关内容

如何获取Azure数据工厂数据流中的管道元数据?我想要创建调试管道

我有一个任务,需要创建一个仪表板来提供在Azure数据工厂中运行的管道的详细信息。为此,我想将数据加载到SQL中。其目的是测试任何数据流的性能。管道将是即插即用模型,我们只需拖放要测试的数据流,进行连接,并在每次管道运行时从管道获取以下数据。以下是我要填写的列名: **Sr No:** Auto Increment, Primary key **pipeline ..

我们可以在Azure映射数据流中进行数据转置吗?

我使用映射数据流在ADF中实现我的M查询脚本。在M查询中有两个函数,一个是Table.Pivot,另一个是Table.Transspose。 映射数据流有枢轴变换,但没有转置。 谁能告诉我,我们是否可以在Azure映射数据流中进行数据转置,或者我需要使用除映射数据流之外的其他东西(数据库、Spark SQL)? 转置会将所有行旋转为列,并将列旋转为行。 推荐答案 我设法像这样转置 ..

在数据流(ADF)中拆分json字符串列或展平转换

我将以下csv文件复制到ADF中的数据流. “数据"列具有json格式,但被视为字符串.我想将“数据"列展平为单独的行.我尝试了扁平化转换,但由于Data列不是json而不起作用.我该如何处理?我也尝试了拆分表达式,但它也不起作用.谢谢 解决方案 仅从您的屏幕截图中,我们可以发现: Data 中的数据不是JSON格式. 数据最像一个数组. “数组"有9个元素. 我必须 ..
发布时间:2021-04-13 20:28:22 其他开发

检查Data Factory中的CSV文件编码

我正在实现一条管道,以将CSV文件从UTF8编码的条件下,将csv文件从一个文件夹移动到数据湖中的另一个文件夹中. 是否可以直接在数据工厂/数据流中检查csv文件的编码? 实际上,编码是在数据集的连接条件中设置的.如果csv文件的编码不同,在这种情况下会发生什么情况? 如果csv文件使用错误的编码暂存,在数据库级别会发生什么? 谢谢. 解决方案 到目前为止,我们无法 ..
发布时间:2021-04-13 20:27:27 其他开发

Azure数据工厂数据流以静默方式使日期列为NULL

我正在尝试使用Azure数据工厂将CSV插入到Azure SQL表中.在我检查结果之前,一切似乎都还不错.列之一是可为空的日期.CSV包含类似 1/2/2020 12:00:00 AM 的值.数据流以静默方式插入 NULL 而不是抛出错误,因为它不喜欢输入.那么,如何获取数据流以将字符串正确地转换为日期时间,然后在以后出现类似问题时出错呢?我真的不希望出现静默故障和不良数据. 解决方案 空 ..

如何从SQL Server表导出到Azure Data Factory中的多个csv文件

我在sql server中有一个简单的客户表,其中包含2列-客户名称和城市.在Azure数据工厂中,如何将该表导出到多个csv文件中,每个文件将仅包含来自同一城市的客户端列表,这将是文件名 我已经尝试并成功使用 lookup和foreach 将其拆分为不同的文件,但是数据仍然没有被城市过滤 有人有任何想法吗? 解决方案 您需要遵循以下流程图: 查找活动:查询:从表格中选择 ..

按列值进行数据流分区时不会向每个文件夹写入唯一的列值

我正在读取一个SQL DB作为源,它输出下表. 我的意图是使用数据流将每个唯一类型保存到可能命名为特定类型的数据湖文件夹分区中. 我设法创建了单个文件夹,但是我的数据流将所有类型的整个表保存到每个文件夹中. 我的数据流 来源 窗口 水槽 请注意,请勿在水槽侧再次设置优化. 我们可以获得的输出文件夹架构: 就目前而言,Data Factory D ..

多个数据流与所有转换合而为一

嗨,我是Azure数据工厂的新手,并不是所有人都熟悉幕后运行的后端处理.我想知道与将所有转换都包含在一个数据流中相比,并行运行几个数据流是否会对性能产生影响. 我正在尝试通过不存在的转换来暂存一些数据.我必须为多个表执行此操作.当我测试并行运行两个数据流时,同时将两个数据流聚集在一起.但是我不确定这是将表的负载分配到几个数据流中还是将所有转换都包含在一个数据流中的最佳方法 解决方案 ..
发布时间:2021-04-13 20:26:06 其他开发

Azure数据工厂-如何使用ForEach循环遍历CSV文件中的记录

我要实现的目标: 我有一个包含以下各列的CSV(FlattenedListDocument.csv) DocumentKey,DocumentName 示例值如下(此CSV文件中大约有240,000行): 12212,银河系旅行者指南12233,MoneyBall 我必须为CSV文件中的每一行创建一个JSON文件,该文件将由另一个实用程序使用(每行一个文件). 我对 ..
发布时间:2021-04-13 19:52:34 其他开发

如何使用数据流在Blob存储中获取JSON数组

我正在Data-Factory中使用Azure Dataflow.我有一个Azure SQL数据库作为源.下面是示例: 名字姓氏年龄手机唐·博斯科56 34578970 134643455亚伯拉罕·林肯87 56789065 246643556 下面是数据流: 源->接收器(JSON Blob存储) 在接收器中,我得到一个文件,输出如下: {“名字":"Don",“姓氏":Bosc ..

如何使用Azure将数据加载到SQL Sink?

我正在尝试使用azure数据流将数据加载到Azure SQL数据库中.但是由于某种原因,我无法连接到我的接收器数据库.我已经尝试了一切,但是没有运气.创建数据集时,我可以连接到SQL数据库,但是为什么在使用数据集作为接收器时却无法连接到数据库. 请在下面找到我的流程的摘要: 但是当我想使用该数据集将数据加载到数据流中时,它给了我以下错误.我想将数据加载到SQL中的原因是我要删除行和CS ..

Azure数据流为身份关系创建/管理密钥

好奇地发现最好的方法是通过ADF生成关系身份. 现在,我正在使用没有任何身份信息的JSON数据.然后,将这些数据转换为具有关系(1..n等)的多个数据库接收器表.由于某些目标接收器表受到FK限制,因此必须一次“建立"这些关系. 这种方法似乎有点笨拙,所以我想看看是否还有其他我不知道的选项. 请注意,我需要为每个插入内容包含代理密钥生成.如果不执行此操作,则基于输出数据库架构,将收 ..

ADF/数据流-将多个CSV转换为实木复合地板

在ADLS Gen2中,TextFiles文件夹包含3个CSV文件.每个文件中的列名都不同. 我们需要将所有3个CSV文件转换为3个实木复合地板文件,并将其放入ParquetFiles文件夹中 我尝试使用“复制活动",但失败,因为列名称中包含空白,并且镶木地板文件不允许使用 要删除空格,我使用了“数据流:源->".选择(在列名中用下划线替换空格)并接收.这适用于单个文件.当我尝试 ..
发布时间:2020-09-16 23:39:23 其他开发

如何通过Blob中的CSV文件在SQL数据库中创建一个表,该表包含所有列名称及其通过数据流或ADF管道的数据类型?

我的Azure Blob存储中有一个CSV文件,其中包含所有列名及其相应表的数据数据类型. 我想从此Blob文件中使用相同的列名及其相应的数据类型在SQL数据库中创建一个表,而无需执行映射. 我已经通过数据流创建了一个表,但是我必须手动设置每列的数据类型.但是我不想这样做. 创建表时,它应该在源中接受相同的数据类型,并在CSV文件中接受同步. [ [当我导入架构时,它将整列作为I ..