cloudera相关内容

猪铸造/数据类型

我正在尝试将关系转储到 AVRO 文件中,但出现一个奇怪的错误: org.apache.pig.data.DataByteArray 不能转换为 java.lang.CharSequence 我不使用DataByteArray(字节数组),见下面的关系描述. sensitiveSet: {rank_ID: long,name: chararray,customerId: long,VIN: ..
发布时间:2021-11-12 04:13:28 Java开发

CDH4 Hbase 使用 Pig ERROR 2998 java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/filter/Filter

我在伪分布式模式下使用 CDH4,并且在将 HBase 和 Pig 一起使用时遇到了一些问题(但两者单独工作都很好). 我正在一步一步地学习这个不错的教程:http://blog.whitepages.com/2011/10/27/hbase-storage-和-猪/ 所以我的 Pig 脚本看起来像这样 注册/usr/lib/zookeeper/zookeeper-3.4.3-cdh ..
发布时间:2021-11-12 04:02:45 其他开发

Cloudera 上的 Kafka - test=TOPIC_AUTHORIZATION_FAILED

我们刚刚从 CDH 5.3.6 升级到 5.10.0,并且在尝试写入 Kafka 主题时开始出现错误.我们对一切都有默认设置,没有启用 SSL 或 Kerberos 身份验证.当使用控制台生产者写入我的主题之一时,我收到此错误: /usr/bin/kafka-console-producer --broker-list=myhost1.dev.com:9092,myhost2.dev.com ..

如何让消费者在 Kafka 0.8 API 中工作

我即将编写一个用于发布和使用 kafka 消息的原型.我们确实已经设置了 Cloudera 基础设施(动物园管理员、代理等),而且我已经成功地使用了 Kafka 命令行工具来生成和使用消息. 我正在使用 [org.apache.kafka/kafka_2.10 "0.8.2.1"] 作为依赖项,并且已经能够使用客户端 API 来设置 KafkaProducer 发布带有纯字符串内容的消息,并 ..
发布时间:2021-11-12 02:43:41 其他开发

Python3 连接到 Kerberos Hbase 节俭 HTTPS

我们有 Python3 应用程序可以连接到 Hbase 并获取数据. 连接在 Kerberos Hbase Thrift 二进制协议(在 TSocket 中)运行良好,直到 Hadoop 团队将 Hadoop 系统移至 Cloudera 和 Cloudera 管理器,后者以 HTTPS 模式启动 Kerberos Hbase Thrift. 现在协议从 TSocket 更改为 HTTP ..
发布时间:2021-09-07 19:13:45 Python

将HDFS挂载到本地目录失败

我目前正在尝试将hdfs挂载到ubuntu机器上的本地目录中.我正在使用hadoop-fuse-dfs软件包. 因此,我正在执行以下命令 ubuntu @ dev:〜$ hadoop-fuse-dfs dfs://localhost:8020/mnt/hdfs 输出 INFO/var/lib/jenkins/workspace/generic-package-ubuntu64- ..
发布时间:2021-04-22 19:37:05 Java开发

为什么我收到此错误“安装失败.无法从代理接收心跳."在cloudera安装中

我正在本地计算机上安装cloudera Manager.尝试添加新主机时出现以下错误 安装失败.无法从代理接收心跳. 确保正确配置了主机的主机名. 确保在Cloudera Manager服务器上可访问端口7182(检查防火墙规则). 确保要添加的主机上的端口9000和9001空闲. 检查代理在/var/log/cloudera-scm-agent/所在主机上的日志添加 ..
发布时间:2021-04-22 19:36:59 其他开发

Impala:显示类似查询的表格

我正在使用Impala,并使用如下所示的模式从数据库中获取表的列表. 假设我有一个数据库 bank ,该数据库下的表如下所示. cust_profilecust_quarter1_transactioncust_quarter2_transactionproduct_cust_xyz........等等 现在我正在过滤 显示银行中的表格,例如"* cust *" 它正在返回预期 ..
发布时间:2021-04-22 19:36:55 其他开发

hadoop hdfs指向file:///而不是hdfs://

因此,我在CentOS 5上通过Cloudera Manager cdh3u5安装了Hadoop. hadoop fs -ls/ 我希望看到hdfs://localhost.localdomain:8020/的内容 但是,它已返回 file:/// 的内容 现在,不用说,我可以通过 访问我的 hdfs:// hadoop fs -ls hdfs://localhost.l ..
发布时间:2021-04-22 19:36:52 其他开发

Hadoop Capacity Scheduler和Spark

如果我按照此处的说明在纱线中定义CapacityScheduler队列 http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html 我该如何使用它? 我想运行spark作业...但是它们不应该占用所有群集,而应该在CapacityScheduler上执行,Cap ..
发布时间:2021-04-08 19:49:18 其他开发

Spark-HBase-GCP模板(1/3)-如何在本地打包Hortonworks连接器?

我正在尝试在GCP上下文中测试Spark-HBase连接器,并尝试遵循[1],它要求使用适用于Spark 2.4的Maven(我尝试过Maven 3.6.3)在本地打包连接器[2],并导致以下问题. 错误"branch-2.4": [错误]无法在项目shc-core上执行目标net.alchim31.maven:scala-maven-plugin:3.2.2:compile(scal ..

通过Python从Impala访问表

我需要在同一cloudera服务器上使用python通过CLI从Impala访问表 我尝试了以下代码来建立连接: def query_impala(sql): cursor = query_impala_cursor(sql) result = cursor.fetchall() field_names = [f[0] for f in cursor.descr ..
发布时间:2020-11-27 04:51:22 Python

Cloudera-未设置JAVA_HOME

关于Ubuntu,我是一个相当新手,但是我尝试遵循位于此处。 在步骤1,我遇到以下错误: brock @ brock-hpserver:〜$ sudo -u hdfs hdfs namenode -format 错误:未设置JAVA_HOME且找不到。 但是,尽管我可能错了,但我相信我已经正确设置了一切: brock @ brock-hpserver:〜 ..
发布时间:2020-10-03 00:26:45 Java开发

Hive中的转置数据集

我正在尝试在Hive中转置变量,例如: Id1 Id2事件 1 1 7 2 2 3 2 2 7 至 Id1 Id2 Event_7 Event_3 1 1 1 2 2 1 1 以下是我到目前为止的内容: 创建临时表event_trans作为 选择Id1,Id2,事件 kv ['3']作为Event_3, kv [' ..
发布时间:2020-10-03 00:26:40 其他开发