sqoop相关内容

sqoop创建impala实木复合地板表

我是一个相对较新的静悄悄的过程,所以请原谅任何无知.我一直在尝试从数据源中提取一张表作为木地板文件,并创建一个Impala表(也作为木地板),将经插入的数据插入其中.该代码运行没有问题,但是当我尝试选择几行进行测试时,出现错误: .../EWT_CALL_PROF_DIM_SQOOP/ec2fe2b0-c9fa-4ef9-91f8-46cf0e12e272.parquet' has an i ..
发布时间:2020-11-22 03:01:49 其他开发

使用Apache Sqoop从MySQL导入数据-错误:没有用于连接字符串的管理器

我正在尝试将Mahout与外部数据源集成.我正在关注 Apache Mahout Cookbook 这本书. 我已经配置了Hadoop 2.4,MySQL服务器,并且已经将一个虚拟数据库导入到mysql中. 我还按照本书中的步骤安装了Apache Sqoop,并在Sqoop库(sqoop/lib)中下载并部署了mysql-connector-java-5.1.30.jar 我已经 ..
发布时间:2020-11-22 02:55:26 Java开发

使用sqoop从CSV文件加载到Hive表?

是否可以借助Sqoop从CSV文件加载配置单元表? 解决方案 Sqoop 并不是为了这个目的,我认为它不能解决您的要求. Sqoop用于在Hadoop和RDBMS之间导入或导出数据. 对于您的情况,您不需要sqoop,无需从HDFS或本地到配置单元表中加载CSV文件.下面是它的语法. LOAD DATA INPATH 'hdfs_file_or_directory_path' ..
发布时间:2020-11-22 02:36:32 其他开发

如何使用排名功能获取Hive中的最新记录

我在蜂巢中有下表,其中包含列ID,名称和时间戳记: 根据以下时间戳记,应将输出作为最新记录: 解决方案 您不需要为此排名.您的输出描述如下: select t.* from t order by t.transaction_time desc limit 3; 编辑: 哦,您要rank()或dense_rank(): select t.* from (selec ..
发布时间:2020-11-22 02:32:13 其他开发

分区配置单元

我在蜂巢中使用静态分区以根据日期字段将数据隔离到子目录中,因为我每天需要向蜂巢中加载数据,所以每个表(总共14个表)每年需要365个分区. 在配置单元中可以创建的静态分区数量是否有限制? 如果"hive.exec.max.dynamic.partitions.pernode",动态分区给出错误 超过了sqoop导入的指定阈值(100) 我有5个节点HDP集群,其中3个是数据节点 ..
发布时间:2020-11-22 02:30:41 其他开发

使用sqoop从多个数据库导入数据

我想使用sqoop从多个SQLsever数据库(100+)导入某些表到HDFS.有人可以指导我怎么做吗?自动化脚本会很好. 解决方案 这可以通过Shell脚本来完成. 1)准备一个具有DBNAME.TABLENAME列表的输入文件 2)shell脚本将以该文件为输入,逐行迭代并为每行执行sqoop语句. while read line; do DBNAME=`echo ..
发布时间:2020-11-22 02:23:00 其他开发

如何通过Sqoop从多个源导入数据

“如何通过Sqoop从多个源导入数据". 我对此一无所知..请让我知道它的机制. 谢谢 解决方案 这可以通过Shell脚本来完成. 1)准备一个包含DBNAME.TABLENAME列表的输入文件.2)shell脚本会将这个文件作为输入,逐行迭代并为每行执行sqoop语句. while read line; do DBNAME=`echo $line | c ..
发布时间:2020-11-22 02:16:45 其他开发

在特定队列上运行队列作业

我正在尝试创建在特定队列中运行的 Sqoop作业,但是它不起作用. 我已经尝试了两件事: 第一个:声明作业创建中的队列 sqoop job \ --create myjob \ -- import \ --connect jdbc:teradata://RCT/DATABASE=MYDB \ -Dmapred ..
发布时间:2020-11-22 01:51:05 其他开发

Sqoop的权限异常

Stack:使用Ambari 2.1安装了HDP-2.3.2.0-2950 安装是自动的.因为这些机器(总共9个节点)具有Internet连接,并且是使用根凭据完成的. 一个ls命令输出以供参考(缺少qoop用户): [root@l1031lab ~]# hadoop fs -ls /user Found 7 items drwx------ - accumulo hdfs ..

Sqoop作业因Oracle导入的KiteSDK验证错误而失败

我正在尝试运行Sqoop作业以从Oracle数据库加载并以Parquet格式加载到Hadoop集群。作业是增量工作。 Sqoop版本为1.4.6。 Oracle版本是12c。 Hadoop版本是2.6.0(发行版是Cloudera 5.5.1)。 Sqoop命令是(创建作业并执行): $ sqoop job -fs hdfs://:// :8020 80 -创建myJob \ ..
发布时间:2020-10-03 00:24:42 数据库

sqoop支持通过蜂巢进行动态分区吗?

sqoop是否支持通过蜂巢进行动态分区? 我尝试使用以下提到的选项: --hive-partition-key和--hive = partition-vlaue仅用于静态分区 例如: sqoop导入 --connect"jdbc:mysql://quickstart.cloudera:3306/prac" --username root-密码cloudera --hive-import -- ..
发布时间:2020-09-20 20:02:39 其他开发