google-bigquery相关内容

“活动用户指标”的差异Firebase Analytics仪表板和BigQuery导出之间

根据Firebase Analytics文档( https://support.google.com / firebase / answer / 6317517#活动用户数),活动用户数是在给定日期发起会话的唯一用户数。同样根据文档,每次会话开始时都会发送一个名为 session_start 名字的事件。我试图使用BigQuery的导出来获取这个指标,但是我的查询给了我不同的结果(BigQuery ..
发布时间:2017-11-10 19:55:14 其他开发

BigQuery - 检查表已存在

我在BigQuery中有一个数据集。此数据集包含多个表。 我以编程方式使用BigQuery API执行以下步骤: 查询数据集中的表 - 由于我的响应太大,我启用了allowLargeResults参数并将我的响应转移到目标表。 我是然后将数据从目的地表导出到GCS桶。 要求: 假设我的进程在步骤2中失败,我想重新运行此步骤。 但是,在我重新运行之前,我想检查/验 ..

Google BigQuery基础架构

所以我刚刚开始在大约10分钟前搞砸了Google BigQuery,我想知道是否有人知道他们用来存储数据的底层架构?例如,这只是他们自己的BigTable基础设施的下一代? 此外,它是否清楚他们用于索引,索引重建等等的策略类型?我只是想分析这是否成熟,在这一点上,你可以100%确定你的数据端到端,或有一个黑盒子区域,“东西只是工作“ 解决方案 没有索引...每个查询都是一个表扫描。查 ..
发布时间:2017-03-17 19:12:01 其他数据库

使用google脚本上传csv文件到bigquery失败

我做了一个google脚本来自动将csv文件上传到bigquery。这是一个小文件(5mb),它的工作。现在,我试图用同一个脚本上传一个150MB的csv文件,我总是得到一个“服务器错误”。它应该工作到1GB,不是吗? 我感谢您的帮助! Albert 解决方案 Bigquery有1GB的限制,但Google Apps Script UrlFetch Post Size最大可达1 ..
发布时间:2017-02-25 00:21:13 Office

如何做嵌套SQL select count

我查询的系统不允许使用 DISTINCT ,因此我的替代方法是执行 GROUP BY 以接近结果 我想要的查询的意图如下: SELECT SUM(column1)AS column1, SUM(column2)AS column2, COUNT(DISTINCT(column3))AS column3 FROM table pre> ,我会认为我需要一些类 ..
发布时间:2017-01-12 20:08:31 其他开发

通过Windows服务在BigQuery表中插入记录

我创建了一个使用服务帐户授权与Google BigQuery API完美通信的Windows服务。为了测试目的,我可以从BigQuery表中提取数据,以检查我的Windows服务和BigQuery API之间的通信。但是这个服务将基本上从MSSQL服务器获取记录,然后逐一插入或附加记录到BigQuery中的目标表。我不想使用CSV或JSON文件作为数据源。有没有办法这样做? 解决方案 不, ..
发布时间:2016-10-11 11:52:55 C#/.NET

是否有可能使用JSON的关键,而不是为服务帐户凭据P12关键?

我使用“Google.Apis.Bigquery.v2客户端库”用C#。 我使用的“服务帐户”授权给谷歌的BigQuery(见 http://www.afterlogic.com/mailbee-net/docs/OAuth2GoogleServiceAccounts.html )。要创建我使用来自谷歌开发者控制台的P12键X509证书。然而,现在的关键JSON是默认的。我可以用它代替P12 ..
发布时间:2016-09-26 13:16:34 C#/.NET

谷歌的OAuth2服务帐户访问令牌请求给予“无效请求的回应

我想用我的应用程序的通信通过服务器启用BigQuery的API服务器的方法。 我已经打勾这个谷歌指南所有的箱子为构建我的智威汤逊,尽我所能在C# 和我有那个必要Base64Url EN codeD的一切。 不过,我从谷歌得到的唯一回应是400错误的请求 “错误”:“INVALID_REQUEST” 我已经从所有这些做题下面的确信: The签名是使用RSA和SHA256 适当加密 ..
发布时间:2016-08-28 14:45:04 C#/.NET

如何权威性到BigQuery在谷歌计算引擎?

什么是身份验证到谷歌的BigQuery当在谷歌Compute Engine的实例?最简单的方法 解决方案 请确保您的实例必须首先访问的BigQuery范围 - 只能在创建时决定这 在bash脚本,通过调用获得的OAuth令牌: 的accessToken =`卷曲-s“HTTP://元/ computeMetadata / V1 /实例/服务的帐户/默认/令牌”-H“X-谷歌的元数据请求 ..
发布时间:2016-08-03 11:37:36 Python

X509Certificate2未能在Azure中Webjobs调用谷歌API

我有一个使用Azure的WebJobs安排一个控制台应用程序。试图读取P12证书的私钥时,执行总是失败。有趣的是,我不能捕获的异常,我不得不用好老 Console.WriteLine 调试。 下面是我的code的片段: VAR证书=新X509Certificate2(数据,“notasecret”,X509KeyStorageFlags.Exportable);ServiceAccountCre ..
发布时间:2016-07-29 18:15:57 云存储

如何鉴别不同的服务帐户凭据谷歌的API?

由于人谁曾经不得不与谷歌CLI二进制编程方式将已经意识到了一整套互动,与 gcloud ,的gsutil , BQ 等,是远离直观的或微不足道的,的尤其的,当你需要跨工作不同的项目。 我正在运行与谷歌云存储和交互的BigQuery为不同的项目不同的cron作业。由于cron作业可能会重叠,重命名配置文件显然不是一个选项,也不会任何理智的人采取这种方法。 有肯定是某种传递路径服务帐户的密钥对文件 ..

谷歌的BigQuery底层架构

所以我刚开始与谷歌的BigQuery乱搞大约10分钟前,我想知道是否有人意识到,他们正在使用到存储数据的底层架构?例如,这只是下一代自己的BigTable基础设施的? 此外,是明确表示,他们正在使用什么样的策略索引,索引重建等?我只是试图分析这是否是足够成熟,在这一点上,你可以100%肯定这是怎么回事与您的数据终端到终端的,或者是有一个黑盒区域,“事情只是工作的“ 解决方案 有没有索引. ..
发布时间:2016-05-28 10:58:58 其他开发

标记与纬度/元素巨大的名单长,地理定位数据的大名单

我有一个巨大的地理定位事件的列表: 事件(1十亿) ------ ID 约会时间 纬度 长 和从开放街道地图加载兴趣点的列表: POI(100万) ------ ID 标签(厅,餐厅等) 纬度 长 我想分配给每个对每个事件的兴趣点的标记。什么是实现这一问题的最佳架构?我们尝试使用谷歌的BigQuery,但我们必须做一个交叉连接,它不工作。我们是开放使用任何其他大数据系统。 解决方案 ..

通过Hadoop的输入格式例如BigQuery的连接器,用于pyspark

我已经存入的BigQuery桌的大型数据集,我希望将其加载到pypark RDD为ETL数据处理。 我意识到,BigQuery的支持Hadoop的输入/输出格式为: https://cloud.google.com/hadoop/writing-with- BigQuery的连接器 和pyspark应能,以便通过使用该方法“newAPIHadoopRDD”创建一个RDD使用这个接口。 ht ..

javax.net.ssl​​.SSLHandshakeException:远程主机关闭握手期间连接,同时插入在BigQuery中的行

你好我工作的Andr​​oid应用程序中,我有集成BigQuery中。我看到有时我们得到了很多的SSL异常而将数据插入到大的查询表。我不知道该如何处理这个问题。请帮究竟是什么这个问题的原因。这里是同一个线程,但无人接听 javax.net.ssl​​.SSLHandshakeException:远程主机关闭握手期间连接 在sun.security.ssl.SSLSocketImpl.readRec ..

BigQuery中的S3集成

难道BigQuery中必须从S3导入数据的功能? 如果没有,那么最新最好的替代路径,你可以建议? 解决方案 BigQuery中不支持从S3桶的数据直接摄取。但是,它很容易使用的gsutil命令行工具S3水桶谷歌云存储移动数据。我建议将数据移动到云存储,那么摄取到BigQuery中从那里。 https://developers.google.com/storage/docs/gsutil ..
发布时间:2015-12-01 10:59:16 云存储