u-sql - IT屋-程序员软件开发技术分享社区

将 Power BI 连接到 S3 存储桶

需要一些指导，因为我是 Power BI 和 Redshift 的新手.. 我的原始 JSON 数据以 .gz 文件的形式存储在 Amazon S3 存储桶中(每个 .gz 文件都有多行 JSON 数据)我想将 Power BI 连接到 Amazon s3 Bucket.截至目前，根据我的研究，我得到了三种方法: Amazon S3 是一种 Web 服务，支持 REST API.我们可 ..

发布时间：2022-01-10 16:25:37 amazon-web-services azure amazon-s3 powerbi u-sql 其他开发

Azure 数据湖中的 U-SQL 输出

如果我不知道表包含多少个不同的键值，是否可以根据列值自动将表拆分为多个文件?是否可以将键值放入文件名中? 解决方案这是我们的 top ask(之前已经也在 stackoverflow 上询问 :).我们目前正在研究它，希望能在夏天推出. 在那之前，您必须编写一个脚本生成器.我倾向于使用 U-SQL 来生成脚本，但您可以使用 Powershell 或 T4 等来完成. 这是一个例子 ..

发布时间：2021-12-06 18:07:25 azure output azure-data-lake u-sql data-partitioning 其他开发

USQL - 如何使用 xml 提取器从 xml 文件中提取属性值

如何使用自定义提取器使用 U-SQL 作业从 XML 文件中提取属性值.我可以从 XML 文件中提取子元素值. 示例 Xml 文件:大卫bachamxyz ..

发布时间：2021-10-01 20:06:00 xml u-sql 其他开发

在U-SQL中将数据附加到现有文件中

我们可以在U-SQL的现有文件中追加数据吗?我已经在U-SQL中创建了一个CSV文件作为输出.我正在编写另一个U-SQL查询，我想将该查询的输出附加到现有文件中.有可能吗? 解决方案不支持它，并且与健壮，分布式，幂等大数据系统的设计背道而驰(尽管您可以通过读取先前的输出来实现该行为:行集并执行UNION ALL. 处理此问题的最佳方法是正确使用分区，例如，为每个执行创建一个或多个新 ..

发布时间：2021-04-13 20:28:50 azure-data-lake u-sql 其他开发

如何在U-SQL中引发错误或引发异常?

在U-Sql脚本中引发错误或异常的机制是什么?我有一个正在处理CSV文件的场景，如果发现重复文件，则需要放弃处理. 在SQL中，我可以执行 raiseerror ，它在U-Sql中的等效方法是什么? 解决方案创建一个c#函数以引发自定义错误(或输出到文件): DECLARE @RaiseError Func=(错误)=>{抛出新的异常(错误)；返回0; ..

发布时间：2021-04-13 20:28:47 azure-data-lake u-sql 其他开发

使用参考组件时出现U-SQL错误

我使用Azure API创建了一个U-SQL库，并在具有所有依赖项的Azure云上注册了程序集.我在U-SQL项目中添加了该库，并在U-SQL脚本中的行下添加了 USE主机；参考大会[AzureLibrary]; 在使用我在库中创建的函数或方法时，出现以下错误消息. 用户表达式的内部异常:无法加载文件或程序集'Microsoft.Azure.Management.DataLake ..

发布时间：2021-04-13 19:00:34 c# azure u-sql C#/.NET

将Power BI连接到S3存储桶

我是Power BI和Redshift的新手，需要一些指导. 我的原始JSON数据以.gz文件的形式存储在Amazon S3存储桶中(每个.gz文件都有多行JSON数据)我想将Power BI连接到Amazon s3 Bucket.到目前为止，根据我的研究，我得到了三种方法: Amazon S3是一项Web服务，并支持REST API.我们可以尝试使用网络数据源获取数据问题:是 ..

发布时间：2021-04-03 19:30:21 amazon-web-services azure amazon-s3 powerbi u-sql 其他开发

使用U-SQL查询JSON嵌套对象

我正在尝试从下面获取国家和类别. 我可以获取国家/地区信息，而不是类别. 示例输入: [{ "context": { "location": { "clientip": "0.0.0.0", "continent": "Asia", "country": "Singapore" ..

发布时间：2020-09-17 00:10:05 azure azure-data-lake u-sql 其他开发

如何结合不同的模式

我正在使用自定义输出从我的“平面数据"生成XML，如下所示: SELECT *.. OUTPUT @all_data TO "/patient/{ID}.tsv" USING new Microsoft.Analytics.Samples.Formats.Xml.XmlOutputter("Patient"); 哪个会生成如下所示的单个文件: 5 ..

发布时间：2020-09-17 00:08:56 azure-data-lake u-sql 其他开发

我们不能使用USQL自定义代码和usql上传文档/图像吗?

情况:我们在Azure数据湖分析中创建了数据库"CLSTrackOMeter"和表"Customer_Information". Customer_Information，将图像的路径存储在暂存文件夹中(目前，我已经在类库中对源图像的路径进行了硬编码). 议程:使用CustInfo中的值将数据上传到Azure数据湖存储"Customer_Image"文件夹中尝试过的解决方案 - ..

发布时间：2020-09-17 00:08:50 azure azure-data-lake u-sql 其他开发

使用USQL进行复制活动可以使任何主体共享脚本

使用U-SQL复制活动可以使任何主体共享脚本我想使用U-SQL进行复制活动来读取文件，并使用U-SQL在输出时将该文件写入文件中解决方案以下是执行此操作的UDO.其他示例也非常有用. https://github.com/Azure/usql/tree/master/Examples/FileCopyUDOs ..

发布时间：2020-09-17 00:08:48 azure-data-lake u-sql 其他开发

Azure数据湖分析IOutputter E_RUNTIME_USER_ROWTOOBIG

我正在尝试将自定义IOutputter的结果写入本地磁盘上的中间文件. 之后，我要将数据库文件(〜20MB)复制到adl输出存储中. 可悲的是，脚本以以下字符终止: 类型的未处理异常 'Microsoft.Cosmos.ScopeStudio.BusinessObjects.Debugger.ScopeDebugException' 发生在Microsoft.Cosmos.Sco ..

发布时间：2020-09-17 00:08:46 azure azure-data-lake u-sql 其他开发

U-SQL从模式获取文件路径

我需要获取文件列表，然后过滤此集合 DECLARE @input_file string = @"\data\{*}\{*}\{*}.avro"; @filenames = SELECT filename FROM @input_file; @filtered = SELECT filename FROM @filenames WHERE {condition} 如果可能的话... ..

发布时间：2020-09-17 00:08:29 azure azure-data-lake u-sql azure-stream-analytics 其他开发

使用VSTS Powershell任务的Azure U-SQL连续部署

我正在为我的Azure Data Lake Analytics-USQL代码构建CI/CD，并在使用VSTS Power Shell任务部署发布时遇到以下错误. “来自'example-app1'的访问被拒绝.请向用户授予Azure门户上的必要角色.跟踪:03e7229d-e7ca-43d5-a7be-6e0a3a3b9317" 我已通过以下链接创建了Azure AAD-@search ..

发布时间：2020-09-17 00:07:19 azure-data-lake u-sql azure-pipelines-release-pipeline 其他开发

如何对U-SQL脚本进行单元测试?

我目前有一个带有一组不同脚本的U-SQL项目，并且我正在尝试为它们创建单元测试.我可以使用带有一组测试数据的Azure Data Lake工具在本地运行脚本，并生成预期的输出. 这些脚本是纯U-SQL数据操作/转换，因此，由于没有任何方法，我不确定测试该方法的正确方法是什么? 如果有人对应该如何做有任何经验/想法或任何文档，请随时提供帮助. 谢谢解决方案 Azure Data La ..

发布时间：2020-09-17 00:04:56 unit-testing azure azure-data-lake u-sql 其他开发

并发读/写ADLA

问:1 我们正在考虑将读/写并行化到ADLA表，并且想知道这种设计的含义是什么. 我认为读取是可以的，但是对同一ADLA表进行并发写入的最佳实践应该是什么. Q:2 假设我们有USQL脚本，该脚本在相同/不同的ADLA表中具有多个行集和多个输出/插入. USQL中的事务作用域故事是什么.如果输出/插入语句中的任何一条失败，那么它将导致所有先前的插入回滚或不回滚.如何处理交易范围谢谢 ..

发布时间：2020-09-17 00:03:46 azure-data-lake u-sql 其他开发

ADLA作业未产生预期结果

我正在用U-SQL处理数据，但没有得到预期的结果.这是我在做什么: 1- Select data from ADL table partitions and assign it to @data1 2- Aggregate data using Group BY and assign it to @data2 3- Truncate partitions 4- Insert data( ..

发布时间：2020-09-17 00:03:40 azure-data-lake u-sql 其他开发

U-SQL语句中的动态FROM

我正在尝试在U-SQL中生成动态FROM子句，以便我们可以基于先前的查询结果从不同的文件中提取数据.就像这样: @filesToExtract = SELECT whatevergeneratesthepaths from @foo; ..

发布时间：2020-09-17 00:02:36 azure-data-lake u-sql 其他开发

使用VS 2017的ADL工具进行USQL单元测试-升级到2.3.4000.x后出现错误

将VS的ADL工具升级到2.3.4000.x版后，其中一个团队成员出现了以下错误. 错误:(-1，-1)'E_CSC_SYSTEM_INTERNAL:内部错误！ ObjectManager发现无效数量的修复程序. 这通常表明格式化程序存在问题." 编译失败！试图降级到版本(2.3.3000.2)，并没有太大帮助. 如果遇到类似问题，找到原因并解决，请分享. 解 ..

发布时间：2020-09-17 00:02:34 testing azure-data-lake u-sql 其他开发

如何解析大字符串U-SQL正则表达式

我有一个包含大字符串的大CSV.我想用U-SQL解析它们. @t1 = SELECT Regex.Match("ID=881cf2f5f474579a:T=1489536183:S=ALNI_MZsMMpA4voGE4kQMYxooceW2AOr0Q", "ID=(?\\w+):T=(?\\w+):S=(?[\\w\\d_]*)") AS p FROM ..

发布时间：2020-09-17 00:02:28 azure-data-lake u-sql 其他开发

u-sql相关内容