u-sql相关内容
需要一些指导,因为我是 Power BI 和 Redshift 的新手.. 我的原始 JSON 数据以 .gz 文件的形式存储在 Amazon S3 存储桶中(每个 .gz 文件都有多行 JSON 数据)我想将 Power BI 连接到 Amazon s3 Bucket.截至目前,根据我的研究,我得到了三种方法: Amazon S3 是一种 Web 服务,支持 REST API.我们可
..
如果我不知道表包含多少个不同的键值,是否可以根据列值自动将表拆分为多个文件?是否可以将键值放入文件名中? 解决方案 这是我们的 top ask(之前已经也在 stackoverflow 上询问 :).我们目前正在研究它,希望能在夏天推出. 在那之前,您必须编写一个脚本生成器.我倾向于使用 U-SQL 来生成脚本,但您可以使用 Powershell 或 T4 等来完成. 这是一个例子
..
如何使用自定义提取器使用 U-SQL 作业从 XML 文件中提取属性值.我可以从 XML 文件中提取子元素值. 示例 Xml 文件:大卫bachamxyz
..
我们可以在U-SQL的现有文件中追加数据吗?我已经在U-SQL中创建了一个CSV文件作为输出.我正在编写另一个U-SQL查询,我想将该查询的输出附加到现有文件中.有可能吗? 解决方案 不支持它,并且与健壮,分布式,幂等大数据系统的设计背道而驰(尽管您可以通过读取先前的输出来实现该行为:行集并执行UNION ALL. 处理此问题的最佳方法是正确使用分区,例如,为每个执行创建一个或多个新
..
在U-Sql脚本中引发错误或异常的机制是什么?我有一个正在处理CSV文件的场景,如果发现重复文件,则需要放弃处理. 在SQL中,我可以执行 raiseerror ,它在U-Sql中的等效方法是什么? 解决方案 创建一个c#函数以引发自定义错误(或输出到文件): DECLARE @RaiseError Func=(错误)=>{抛出新的异常(错误);返回0;
..
我使用Azure API创建了一个U-SQL库,并在具有所有依赖项的Azure云上注册了程序集.我在U-SQL项目中添加了该库,并在U-SQL脚本中的 行下添加了 USE主机;参考大会[AzureLibrary]; 在使用我在库中创建的函数或方法时,出现以下错误消息. 用户表达式的内部异常:无法加载文件或程序集'Microsoft.Azure.Management.DataLake
..
我是Power BI和Redshift的新手,需要一些指导. 我的原始JSON数据以.gz文件的形式存储在Amazon S3存储桶中(每个.gz文件都有多行JSON数据)我想将Power BI连接到Amazon s3 Bucket.到目前为止,根据我的研究,我得到了三种方法: Amazon S3是一项Web服务,并支持REST API.我们可以尝试使用网络数据源获取数据 问题:是
..
我正在尝试从下面获取国家和类别. 我可以获取国家/地区信息,而不是类别. 示例输入: [{ "context": { "location": { "clientip": "0.0.0.0", "continent": "Asia", "country": "Singapore"
..
我正在使用自定义输出从我的“平面数据"生成XML,如下所示: SELECT *.. OUTPUT @all_data TO "/patient/{ID}.tsv" USING new Microsoft.Analytics.Samples.Formats.Xml.XmlOutputter("Patient"); 哪个会生成如下所示的单个文件: 5
..
情况:我们在Azure数据湖分析中创建了数据库"CLSTrackOMeter"和表"Customer_Information". Customer_Information,将图像的路径存储在暂存文件夹中(目前,我已经在类库中对源图像的路径进行了硬编码). 议程:使用CustInfo中的值将数据上传到Azure数据湖存储"Customer_Image"文件夹中 尝试过的解决方案 -
..
使用U-SQL复制活动可以使任何主体共享脚本 我想使用U-SQL进行复制活动来读取文件,并使用U-SQL在输出时将该文件写入文件中 解决方案 以下是执行此操作的UDO.其他示例也非常有用. https://github.com/Azure/usql/tree/master/Examples/FileCopyUDOs
..
我正在尝试将自定义IOutputter的结果写入本地磁盘上的中间文件. 之后,我要将数据库文件(〜20MB)复制到adl输出存储中. 可悲的是,脚本以以下字符终止: 类型的未处理异常 'Microsoft.Cosmos.ScopeStudio.BusinessObjects.Debugger.ScopeDebugException' 发生在Microsoft.Cosmos.Sco
..
我需要获取文件列表,然后过滤此集合 DECLARE @input_file string = @"\data\{*}\{*}\{*}.avro"; @filenames = SELECT filename FROM @input_file; @filtered = SELECT filename FROM @filenames WHERE {condition} 如果可能的话...
..
我正在为我的Azure Data Lake Analytics-USQL代码构建CI/CD,并在使用VSTS Power Shell任务部署发布时遇到以下错误. “来自'example-app1'的访问被拒绝.请向用户授予Azure门户上的必要角色.跟踪:03e7229d-e7ca-43d5-a7be-6e0a3a3b9317" 我已通过以下链接创建了Azure AAD-@search
..
我目前有一个带有一组不同脚本的U-SQL项目,并且我正在尝试为它们创建单元测试.我可以使用带有一组测试数据的Azure Data Lake工具在本地运行脚本,并生成预期的输出. 这些脚本是纯U-SQL数据操作/转换,因此,由于没有任何方法,我不确定测试该方法的正确方法是什么? 如果有人对应该如何做有任何经验/想法或任何文档,请随时提供帮助. 谢谢 解决方案 Azure Data La
..
问:1 我们正在考虑将读/写并行化到ADLA表,并且想知道这种设计的含义是什么. 我认为读取是可以的,但是对同一ADLA表进行并发写入的最佳实践应该是什么. Q:2 假设我们有USQL脚本,该脚本在相同/不同的ADLA表中具有多个行集和多个输出/插入. USQL中的事务作用域故事是什么.如果输出/插入语句中的任何一条失败,那么它将导致所有先前的插入回滚或不回滚.如何处理交易范围 谢谢
..
我正在用U-SQL处理数据,但没有得到预期的结果.这是我在做什么: 1- Select data from ADL table partitions and assign it to @data1 2- Aggregate data using Group BY and assign it to @data2 3- Truncate partitions 4- Insert data(
..
我正在尝试在U-SQL中生成动态FROM子句,以便我们可以基于先前的查询结果从不同的文件中提取数据.就像这样: @filesToExtract = SELECT whatevergeneratesthepaths from @foo;
..
将VS的ADL工具升级到2.3.4000.x版后,其中一个团队成员出现了以下错误. 错误:(-1,-1)'E_CSC_SYSTEM_INTERNAL:内部错误! ObjectManager发现无效数量的修复程序. 这通常表明格式化程序存在问题." 编译失败! 试图降级到版本(2.3.3000.2),并没有太大帮助. 如果遇到类似问题,找到原因并解决,请分享. 解
..
我有一个包含大字符串的大CSV.我想用U-SQL解析它们. @t1 = SELECT Regex.Match("ID=881cf2f5f474579a:T=1489536183:S=ALNI_MZsMMpA4voGE4kQMYxooceW2AOr0Q", "ID=(?\\w+):T=(?\\w+):S=(?[\\w\\d_]*)") AS p FROM
..