amazon-redshift相关内容
下面是我要在Redshift数据库中尝试实现的示例. 我有一个变量current_value,我想创建一个新列value_desired,即: 如果上一行为空,则与current_value相同 等于上一个非空值,如果前一行为非空 听起来很容易,但是我还没有找到一种方法. row_numb current_value value_desired 1 2 3
..
我在将Kibana与Amazon Redshift连接时遇到困难. 是否可以在没有Elasticsearch的情况下连接Kibana? 是否可以直接将Kibana与Amazon Redshift连接以进行可视化? 解决方案 否.您必须从节拍/对数开始获取弹性数据,然后使用kibana进行可视化.
..
是否存在将JSON数据转换为具有多个表的关系数据库的标准方法?我们需要从MongoDB实例导出数据并将其导入Redshift集群.唯一的问题是,MongoDB的某些字段包含对象和数组. Redshift群集接受CSV,因此我认为每个新表的输出至少是一个CSV文件. 我不需要特定的实现.我只是想了解有关如何有效地将JSON/NoSQL数据转换为关系格式的概念. 解决方案 我们有用于存储
..
Redshift是否支持JSON字段,例如Postgresql的json数据类型?如果是这样,我该怎么做? 解决方案 您可以在普通文本字段内将JSON存储在Amazon Redshift中. 有一些功能可以从JSON字段中提取数据,但这不是存储数据的有效方法,因为它没有利用Redshift基于列的体系结构的全部功能. 请参阅: Amazon Redshift文档-JSON函数
..
按照此文档,用于在AWS中使用“自动"格式,并我的数据是高度嵌套的JSON格式,并且我创建了redshift表,以使列名与JSON结构的最高级别完全匹配(允许“自动"工作). 例如,我的JSON数据如下: {"timestamp":{"value":"1480536125926814862"}, "Version":{"value":"0.5.0"}, "token":{"timest
..
我有一个Redshift表,如下所示: id | metadata --------------------------------------------------------------------------- 1 | [{"pet":"dog"},{"country":"uk"}] 2 | [{"pet":"cat"}] 3 | [] 4 | [{"country
..
在使用带有连接的case语句时遇到问题. 我有两个桌子. Tbl_a: 和Tbl_b: 我正在运行以下查询: SELECT tbl_a.id, ( CASE WHEN tbl_b.param_type = 'Ignition' Then param_value WHEN tbl_b.param_ty
..
我有3个表t1,t2和t3. t1有2列-> id1,val1 t2 -> id2, val2 t3 -> id3, val3 If id1=id2 and id2 = id3 然后我需要更新val1和val3. 但是我重复了id1,每个都应该有相同的val3 我正在使用 update t1 inner join t2 on t1.id1 = t2.id2 i
..
我正在Redshift中读取SQL查询,但不了解最后一部分: ... LEFT JOIN (SELECT MIN(modified) AS first_modified FROM user) ue ON 1=1 ON 1=1在这里是什么意思? 解决方案 它只是在进行交叉连接,它选择了第一张表中的所有行和第二张表中的所有行,并显示为笛卡尔积,即具有所有可能. JOIN(向左,
..
我想使用齐柏林飞艇(Zeppelin)在Redshift中浏览我的数据.一个带有Spark的小型EMR集群正在运行.我正在加载databricks的spark-redshift库 %dep z.reset() z.load("com.databricks:spark-redshift_2.10:0.6.0") 然后 import org.apache.spark.sql.DataF
..
我尝试使用此代码链接,但出现错误 驱动程序
..
尝试从Aws Lambda加载Redshift jdbc jar时出现以下错误. java.io.IOException:无法加载驱动程序:预期为JAR,但不是 成立. java.sql.SQLException:找不到适合的驱动程序 jdbc:redshift://insightlyanalytics.c0ubofza4jil.us-west-2.redshift.amazonaws.co
..
我在我的AWS Redshift数据库中使用 node-postgres 客户端. 在本地,我可以在node中运行以下代码,获取">>连接"和">>>成功查询的打印语句.jsonResult:". 但是,当我在Amazon Lambda中运行此代码时,除了“尝试连接..."之外,我看不到任何日志语句. console.log("trying to connect..."); va
..
我开始学习Amazon redshift,并按照其文档创建集群. 我选择了2个月的免费试用.当我尝试从SQL Workbench/J连接到Redshift db时,它说“连接超时错误". 我检查了一下,然后输入的所有详细信息都是正确的!我正在通过公司LAN从笔记本电脑访问Redshift数据库.我认为这是一个问题.告诉我如何通过公司局域网连接连接到Redshift? 当我尝试连接
..
我正在尝试在DataGrip中定义Redshift连接,但是在UI中找不到任何Redshift驱动程序.我试过同时使用Postgres和通用数据库驱动程序. 有人可以配置吗? 解决方案 DataGrip添加了对Amazon Redshift的本机支持.所以现在变得容易多了.
..
我尝试使用下面的REGEXP_SUBSTR Sql函数从20个字符的字符串中提取所有数字。 select REGEXP_SUBSTR(substring(mycolumn,1,20),'^ [0-9]',1) || REGEXP_SUBSTR(substring(mycolumn,1,20),'^ [0-9]',2) || REGEXP_SUBSTR(substring(mycol
..
我正在尝试在Amazon Redshift中创建索引但我收到错误 在session_log上创建索引(UserId); UserId 是一个整数字段。 解决方案 如果您尝试在Redshift表上创建索引(带名称): 在“SomeTable”(“UserId”)上创建索引IX1; 您将收到错误 执行SQL命令时发生错误:
..
在Amazon Redshift中我有一个表格,我需要从多个CSV文件加载数据: create table my_table( id整数, 名称varchar(50)NULL email varchar(50)NULL, processed_file varchar(256)NULL ); 前三列是指文件中的数据。最后一列 processed_filed 表示从
..
有没有办法指示Hive将数据分割成多个输出文件?或者可能会限制输出文件的大小。 我打算使用Redshift,它建议将数据分割为多个文件以允许并行加载 http://docs.aws.amazon.com/redshift/latest/dg/t_splitting-data-files。 html 我们预先处理蜂巢中的所有数据,我想知道是否有创建方法,比如说10个1GB文件可能会使复制
..
在Apache Oozie, Spotify / Luigi 和 airbnb / airflow ,他们每个人的优点和缺点是什么? 过去我使用oozie和airflow来建立一个使用PIG和Hive的数据摄入管道。目前,我正在构建一个查看日志并提取有用事件并将其置于红移的管道。 我发现气流更容易使用/测试/设置。它有一个更酷的用户界面,并允许用户从用户界面本身执行操作,这与Oozie
..