google-bigquery相关内容

平整BigQuery将字段内容嵌套到新列中而不是行中

我有一些BigQuery数据,格式如下: “thing”:[ { “name”:“gameLost”, “params”:[ { “key”:“total_games”, “val”:{ “str_val “:”3“, ”int_val“:null } }, { ”key“:”games_won“, ”val“ :{ “str_val”:“2”, “int_val”:null } ..
发布时间:2018-05-07 17:38:11 其他开发

Semijoin表达式必须是逻辑AND的一部分

我有一个表(我们可以称之为“A”)和一些字段(model:string,age:integer,code1:integer,code2:integer,code3:integer)和另一个表(可以是“codes” )分类代码(code:integer,codetype:string,description:string)。 该字段代码类型用于组代码。例如,200到300之间的代码是棕色的。每 ..
发布时间:2018-05-07 17:38:09 其他开发

将操作插入到bigquery表中

我想将SQL Server表的所有行插入具有相同模式的BigQuery表中。 流式插入行逐行非常慢:要插入1000行,执行下面的代码需要大约10分钟。 在此代码中,我循环遍历某个文件夹中的前10个文件,并将此文件的内容插入到唯一的SQL Server表中。一旦我打开了愿望文件,我循环遍历SQL Server表(它包含所有文件的所有行),并将内容逐行插入BigQuery表中。最后我删除这些文件, ..
发布时间:2018-05-07 17:38:04 数据库

通过google BigQuery将unsigned int转换为signed int

我尝试在谷歌BigQuery api上运行一个查询,并得到一个异常,如下所示: “函数中的参数类型不匹配IF: 'distinctPlayers'是类型'TYPE_UINT64','0'是类型'TYPE_INT32'。“ 查询太大,所以我写了 QUERY:sum(if(action_type == 3,distinctPlayers,0))as Game_Viral_Accept ..
发布时间:2018-05-07 17:38:00 其他开发

Google BigQuery查询速度很慢

我正在使用Google BigQuery,并且正在执行一些来自PHP的简单查询。 (例如SELECT * from emails WHERE email='mail@test.com')我只是检查电子邮件是否存在于表格中。 表格“emails”是现在空了。但PHP脚本仍然需要大约4分钟的时间来检查一张空桌子上的175封电子邮件。我希望将来这张桌子将会被填满,并且将会有50万封邮件,那么我估计 ..
发布时间:2018-05-07 17:37:57 PHP

无法创建视图。未知的TVF:myFunc

我试图在BigQuery中创建一个包含javascript UDF(myFunc)的视图。在控制台中运行时,查询可以正常工作,UDF内联或在Google云端存储中引用URI。但是,当试图使用任何引用将查询保存为视图时,我会收到错误消息: 创建视图失败。未知的TVF:myFunc 有什么方法可以在使用UDF的BigQuery中保存视图?我没有使用过REST API,但似乎可能 ..
发布时间:2018-05-07 17:37:55 其他开发

BigQuery将表导出到csv文件

我尝试将BigQuery表单用户界面导出到Google存储表中,但面临以下错误: 错误: 表格gs:/ /mybucket/delta.csv.gz太大而无法导出到单个文件。指定一个uri,包括一个到shard的导出。 (错误代码:无效) 在查询后尝试导出时,我得到: 下载不可用此结果集包含太多要下载的行。请使用“另存为表格”,然后导出结果表格。 使用BigQuery可以导出最 ..
发布时间:2018-05-07 17:37:53 其他开发

重复记录以填充Google BigQuery中的日期之间的差距

所以我发现了类似的资源,解决了如何在SQL中执行此操作,如下所示: 重复记录以填补日期间的差距 据我所知,BigQuery可能不是最好的地方,所以我试图看看它是否完全可能。当试图运行上面链接中的某些方法时,由于BigQuery中不支持某些函数,因此我打了一面墙。 如果存在表数据结构如下: MODIFY_DATE SKU STORE STOCK_ON_HAND 08/01/ ..
发布时间:2018-05-07 17:37:48 其他开发

如何排除WHERE NOT EXISTS之类的记录

我想排除包含存储在exclusion_list表中的关键字的记录。 在典型的数据库中,我们可以通过使用下面的WHERE NOT EXISTS短语来实现这一点; SELECT datetime,server,页面,uniq_id,client_req,域,search_keyword 从apache_log a WHERE不存在 (SELECT 0 FROM exclusion_li ..
发布时间:2018-05-07 17:37:43 其他开发

在BigQuery中UNNESTING多个数组

在这个例子中,我有一本书数据库,每本书有一个记录。记录包含书籍所有者,流派和其他信息。我需要返回每个所有者,每个流派的前20位的样本以及该行中的所有数据。 我有这个代码,这是我需要的对于行中的一个数据点(Data_one): pre $ lt; code> WITH`project.dataset.table` AS( SELECT 名称名称, 类型流派, Data_one o ..
发布时间:2018-05-07 17:37:41 其他开发

BigQuery:是否可以在UDF内执行另一个查询?

我有一张表格,每天为每个独特用户记录一行,并在当天为该用户汇总一些统计信息,而且我需要生成一份报告,告诉我每天的信息。包括当天在过去30天内的唯一用户数。 例如。 8月31日,它将计算8月2日至8月31日的唯一用户数量。 对于8月30日,它将计算8月1日至8月30日的独特用户数。 ... 我看了一些相关的问题,但他们不是我所需要的 - 如果用户在过去30天内登录多天,他应该只计算一 ..

如何查询在bigquery表中存储为字符串的json?

如何在bigquery表中查询存储为字符串的json? 我有一个表,列中的值( subscriptions )看起来像这样: { “data”:[{ “application_fee_percent”:null, “canceled_at”:null, “created”:1500476240, “items”:{ “data”:[{ “created”:1500476240, “id” ..
发布时间:2018-05-07 17:37:30 其他开发

如何从Google Dataflow中的PCollection中获取元素列表并在流水线中使用它来循环写入变换?

我想: 获取主PCollection中的唯一日期列表 循环访问该列表中的日期以创建筛选的PCollections(每个日期均具有唯一的日期),然后分别写入将过滤的PCollection过滤到BigQuery中时分区表中的分区。 如何获取该列表?在下面的组合转换之后,我创建了一个ListPCollectionView对象,但我无法迭代该对象: class ToUniqueLis ..
发布时间:2018-05-07 17:37:25 Python

将数据流式传输到BigQuery中的旋转日志表中

我想用 insertAll 将一些时间序列数据流入BigQuery,但只保留最后3个月(比如说)以避免无限存储成本。通常的答案是将每天的数据保存到一个单独的表格,但AFAICT这需要每个这样的表格将被预先创建。我打算直接从只有 bigquery.insertdata 作用域的令牌授权的不安全客户端传输数据,因此他们无法自行创建日常表。我能想到的唯一解决方案就是运行一个安全的每日cron作业来创建表 ..
发布时间:2018-05-07 17:37:22 其他开发

BigQuery select *除了嵌套列

我想要做的事情应该很简单:给定一个BigQuery模式,我想选择除了几个之外的所有表(包括嵌套的表)。棘手的是,BigQuery有一个嵌套结构,我想排除的少数嵌套在其他记录中。 我发现SELECT *一个href =“https://cloud.google.com/bigquery/docs/reference/standard-sql/query-syntax#select-modifi ..
发布时间:2018-05-07 17:37:20 其他开发

将BigQuery查询结果直接写入GCS - 是否有可能?

我尝试了 bq 命令行工具,但似乎没有办法直接将结果写入GCS。我可以看到的唯一方法就是: $ b $ ol 查询 - >表 - >导出 查询 - >控制台 - >本地CSV文件 - >上传到GCS 我正在寻找一种方法将结果直接写入GCS。 解决方案 您无法直接将查询结果写入GCS。正如您已经指出的那样,最简单的方法是: 将查询结果写入输出表 将您的表格导出至GCS ..

是否有可能在google bigquery中检索扩展或完整的查询历史记录?

由于BigQuery中的表删除操作是永久性的,因此,我们最近发现我从BigQuery中意外删除了一个表,这是通过查询其他表(我仍然有这些表) (对吧?),我想重建丢失的表,最好不重写查询。 webUI中的查询历史记录显然只显示有限数量的查询。我所寻找的是不幸的不在列表中。 所以我的问题是,是否有可能以某种方式恢复查询历史中消失的查询? (我知道查询的创建日期) 解决方案 ..
发布时间:2018-05-07 17:37:15 其他开发