u-sql相关内容

将 Power BI 连接到 S3 存储桶

需要一些指导,因为我是 Power BI 和 Redshift 的新手.. 我的原始 JSON 数据以 .gz 文件的形式存储在 Amazon S3 存储桶中(每个 .gz 文件都有多行 JSON 数据)我想将 Power BI 连接到 Amazon s3 Bucket.截至目前,根据我的研究,我得到了三种方法: Amazon S3 是一种 Web 服务,支持 REST API.我们可 ..
发布时间:2022-01-10 16:25:37 其他开发

Azure 数据湖中的 U-SQL 输出

如果我不知道表包含多少个不同的键值,是否可以根据列值自动将表拆分为多个文件?是否可以将键值放入文件名中? 解决方案 这是我们的 top ask(之前已经也在 stackoverflow 上询问 :).我们目前正在研究它,希望能在夏天推出. 在那之前,您必须编写一个脚本生成器.我倾向于使用 U-SQL 来生成脚本,但您可以使用 Powershell 或 T4 等来完成. 这是一个例子 ..
发布时间:2021-12-06 18:07:25 其他开发

在U-SQL中将数据附加到现有文件中

我们可以在U-SQL的现有文件中追加数据吗?我已经在U-SQL中创建了一个CSV文件作为输出.我正在编写另一个U-SQL查询,我想将该查询的输出附加到现有文件中.有可能吗? 解决方案 不支持它,并且与健壮,分布式,幂等大数据系统的设计背道而驰(尽管您可以通过读取先前的输出来实现该行为:行集并执行UNION ALL. 处理此问题的最佳方法是正确使用分区,例如,为每个执行创建一个或多个新 ..
发布时间:2021-04-13 20:28:50 其他开发

如何在U-SQL中引发错误或引发异常?

在U-Sql脚本中引发错误或异常的机制是什么?我有一个正在处理CSV文件的场景,如果发现重复文件,则需要放弃处理. 在SQL中,我可以执行 raiseerror ,它在U-Sql中的等效方法是什么? 解决方案 创建一个c#函数以引发自定义错误(或输出到文件): DECLARE @RaiseError Func=(错误)=>{抛出新的异常(错误);返回0; ..
发布时间:2021-04-13 20:28:47 其他开发

使用参考组件时出现U-SQL错误

我使用Azure API创建了一个U-SQL库,并在具有所有依赖项的Azure云上注册了程序集.我在U-SQL项目中添加了该库,并在U-SQL脚本中的 行下添加了 USE主机;参考大会[AzureLibrary]; 在使用我在库中创建的函数或方法时,出现以下错误消息. 用户表达式的内部异常:无法加载文件或程序集'Microsoft.Azure.Management.DataLake ..
发布时间:2021-04-13 19:00:34 C#/.NET

将Power BI连接到S3存储桶

我是Power BI和Redshift的新手,需要一些指导. 我的原始JSON数据以.gz文件的形式存储在Amazon S3存储桶中(每个.gz文件都有多行JSON数据)我想将Power BI连接到Amazon s3 Bucket.到目前为止,根据我的研究,我得到了三种方法: Amazon S3是一项Web服务,并支持REST API.我们可以尝试使用网络数据源获取数据 问题:是 ..
发布时间:2021-04-03 19:30:21 其他开发

如何结合不同的模式

我正在使用自定义输出从我的“平面数据"生成XML,如下所示: SELECT *.. OUTPUT @all_data TO "/patient/{ID}.tsv" USING new Microsoft.Analytics.Samples.Formats.Xml.XmlOutputter("Patient"); 哪个会生成如下所示的单个文件: 5 ..
发布时间:2020-09-17 00:08:56 其他开发

我们不能使用USQL自定义代码和usql上传文档/图像吗?

情况:我们在Azure数据湖分析中创建了数据库"CLSTrackOMeter"和表"Customer_Information". Customer_Information,将图像的路径存储在暂存文件夹中(目前,我已经在类库中对源图像的路径进行了硬编码). 议程:使用CustInfo中的值将数据上传到Azure数据湖存储"Customer_Image"文件夹中 尝试过的解决方案 - ..
发布时间:2020-09-17 00:08:50 其他开发

Azure数据湖分析IOutputter E_RUNTIME_USER_ROWTOOBIG

我正在尝试将自定义IOutputter的结果写入本地磁盘上的中间文件. 之后,我要将数据库文件(〜20MB)复制到adl输出存储中. 可悲的是,脚本以以下字符终止: 类型的未处理异常 'Microsoft.Cosmos.ScopeStudio.BusinessObjects.Debugger.ScopeDebugException' 发生在Microsoft.Cosmos.Sco ..
发布时间:2020-09-17 00:08:46 其他开发

如何对U-SQL脚本进行单元测试?

我目前有一个带有一组不同脚本的U-SQL项目,并且我正在尝试为它们创建单元测试.我可以使用带有一组测试数据的Azure Data Lake工具在本地运行脚本,并生成预期的输出. 这些脚本是纯U-SQL数据操作/转换,因此,由于没有任何方法,我不确定测试该方法的正确方法是什么? 如果有人对应该如何做有任何经验/想法或任何文档,请随时提供帮助. 谢谢 解决方案 Azure Data La ..
发布时间:2020-09-17 00:04:56 其他开发

并发读/写ADLA

问:1 我们正在考虑将读/写并行化到ADLA表,并且想知道这种设计的含义是什么. 我认为读取是可以的,但是对同一ADLA表进行并发写入的最佳实践应该是什么. Q:2 假设我们有USQL脚本,该脚本在相同/不同的ADLA表中具有多个行集和多个输出/插入. USQL中的事务作用域故事是什么.如果输出/插入语句中的任何一条失败,那么它将导致所有先前的插入回滚或不回滚.如何处理交易范围 谢谢 ..
发布时间:2020-09-17 00:03:46 其他开发

ADLA作业未产生预期结果

我正在用U-SQL处理数据,但没有得到预期的结果.这是我在做什么: 1- Select data from ADL table partitions and assign it to @data1 2- Aggregate data using Group BY and assign it to @data2 3- Truncate partitions 4- Insert data( ..
发布时间:2020-09-17 00:03:40 其他开发

U-SQL语句中的动态FROM

我正在尝试在U-SQL中生成动态FROM子句,以便我们可以基于先前的查询结果从不同的文件中提取数据.就像这样: @filesToExtract = SELECT whatevergeneratesthepaths from @foo; ..
发布时间:2020-09-17 00:02:36 其他开发

使用VS 2017的ADL工具进行USQL单元测试-升级到2.3.4000.x后出现错误

将VS的ADL工具升级到2.3.4000.x版后,其中一个团队成员出现了以下错误. 错误:(-1,-1)'E_CSC_SYSTEM_INTERNAL:内部错误! ObjectManager发现无效数量的修复程序. 这通常表明格式化程序存在问题." 编译失败! 试图降级到版本(2.3.3000.2),并没有太大帮助. 如果遇到类似问题,找到原因并解决,请分享. 解 ..
发布时间:2020-09-17 00:02:34 其他开发