amazon-redshift相关内容

从前一个空值开始获取第一个非空值的滞后时间

下面是我要在Redshift数据库中尝试实现的示例. 我有一个变量current_value,我想创建一个新列value_desired,即: 如果上一行为空,则与current_value相同 等于上一个非空值,如果前一行为非空 听起来很容易,但是我还没有找到一种方法. row_numb current_value value_desired 1 2 3 ..
发布时间:2020-04-26 15:02:49 其他开发

我可以将Kibana与Amazon Redshift连接吗?

我在将Kibana与Amazon Redshift连接时遇到困难. 是否可以在没有Elasticsearch的情况下连接Kibana? 是否可以直接将Kibana与Amazon Redshift连接以进行可视化? 解决方案 否.您必须从节拍/对数开始获取弹性数据,然后使用kibana进行可视化. ..
发布时间:2020-04-26 09:43:04 其他开发

导出JSON数据并加载到关系数据库中

是否存在将JSON数据转换为具有多个表的关系数据库的标准方法?我们需要从MongoDB实例导出数据并将其导入Redshift集群.唯一的问题是,MongoDB的某些字段包含对象和数组. Redshift群集接受CSV,因此我认为每个新表的输出至少是一个CSV文件. 我不需要特定的实现.我只是想了解有关如何有效地将JSON/NoSQL数据转换为关系格式的概念. 解决方案 我们有用于存储 ..
发布时间:2019-11-24 21:00:27 其他开发

您可以在Redshift上存储JSON字段吗?

Redshift是否支持JSON字段,例如Postgresql的json数据类型?如果是这样,我该怎么做? 解决方案 您可以在普通文本字段内将JSON存储在Amazon Redshift中. 有一些功能可以从JSON字段中提取数据,但这不是存储数据的有效方法,因为它没有利用Redshift基于列的体系结构的全部功能. 请参阅: Amazon Redshift文档-JSON函数 ..
发布时间:2019-11-24 20:08:18 其他开发

“自动"将数据从S3加载到Redshift表中时,大小写是否重要?

按照此文档,用于在AWS中使用“自动"格式,并我的数据是高度嵌套的JSON格式,并且我创建了redshift表,以使列名与JSON结构的最高级别完全匹配(允许“自动"工作). 例如,我的JSON数据如下: {"timestamp":{"value":"1480536125926814862"}, "Version":{"value":"0.5.0"}, "token":{"timest ..
发布时间:2019-11-24 19:01:10 其他开发

使用联接更新Redshift表

我有3个表t1,t2和t3. t1有2列-> id1,val1 t2 -> id2, val2 t3 -> id3, val3 If id1=id2 and id2 = id3 然后我需要更新val1和val3. 但是我重复了id1,每个都应该有相同的val3 我正在使用 update t1 inner join t2 on t1.id1 = t2.id2 i ..
发布时间:2019-09-19 16:25:56 其他开发

JOIN(SELECT ...)ue ON 1 = 1?

我正在Redshift中读取SQL查询,但不了解最后一部分: ... LEFT JOIN (SELECT MIN(modified) AS first_modified FROM user) ue ON 1=1 ON 1=1在这里是什么意思? 解决方案 它只是在进行交叉连接,它选择了第一张表中的所有行和第二张表中的所有行,并显示为笛卡尔积,即具有所有可能. JOIN(向左, ..
发布时间:2019-09-19 16:00:31 其他开发

尝试通过AWS Lambda连接到Redshift

我在我的AWS Redshift数据库中使用 node-postgres 客户端. 在本地,我可以在node中运行以下代码,获取">>连接"和">>>成功查询的打印语句.jsonResult:". 但是,当我在Amazon Lambda中运行此代码时,除了“尝试连接..."之外,我看不到任何日志语句. console.log("trying to connect..."); va ..
发布时间:2019-09-02 13:39:03 Java相关

SQL Workbench/J中的Redshift连接问题

我开始学习Amazon redshift,并按照其文档创建集群. 我选择了2个月的免费试用.当我尝试从SQL Workbench/J连接到Redshift db时,它说“连接超时错误". 我检查了一下,然后输入的所有详细信息都是正确的!我正在通过公司LAN从笔记本电脑访问Redshift数据库.我认为这是一个问题.告诉我如何通过公司局域网连接连接到Redshift? 当我尝试连接 ..
发布时间:2019-09-02 13:24:50 Java相关

在DataGrip中定义Redshift连接

我正在尝试在DataGrip中定义Redshift连接,但是在UI中找不到任何Redshift驱动程序.我试过同时使用Postgres和通用数据库驱动程序. 有人可以配置吗? 解决方案 DataGrip添加了对Amazon Redshift的本机支持.所以现在变得容易多了. ..
发布时间:2019-09-02 13:16:24 Java相关

使用COPY导入时,Redshift添加列

在Amazon Redshift中我有一个表格,我需要从多个CSV文件加载数据: create table my_table( id整数, 名称varchar(50)NULL email varchar(50)NULL, processed_file varchar(256)NULL ); 前三列是指文件中的数据。最后一列 processed_filed 表示从 ..
发布时间:2018-08-01 11:31:32 其他开发

配置单元 - 跨文件分割数据

有没有办法指示Hive将数据分割成多个输出文件?或者可能会限制输出文件的大小。 我打算使用Redshift,它建议将数据分割为多个文件以允许并行加载 http://docs.aws.amazon.com/redshift/latest/dg/t_splitting-data-files。 html 我们预先处理蜂巢中的所有数据,我想知道是否有创建方法,比如说10个1GB文件可能会使复制 ..

为建立基于hadoop的数据管道安排工具的建议

在Apache Oozie, Spotify / Luigi 和 airbnb / airflow ,他们每个人的优点和缺点是什么? 过去我使用oozie和airflow来建立一个使用PIG和Hive的数据摄入管道。目前,我正在构建一个查看日志并提取有用事件并将其置于红移的管道。 我发现气流更容易使用/测试/设置。它有一个更酷的用户界面,并允许用户从用户界面本身执行操作,这与Oozie ..
发布时间:2018-05-31 19:41:33 分布式计算/Hadoop