sqoop相关内容

如何将数据从一个HDFS复制到另一个HDFS?

我有两个HDFS设置,并且想要将某些表从HDFS1复制(而不是迁移或移动)到HDFS2.如何将数据从一个HDFS复制到另一个HDFS?是否可以通过Sqoop或其他命令行? 解决方案 DistCp(分布式副本)是用于在集群之间复制数据的工具.它使用MapReduce来实现其分发,错误处理和恢复以及报告.它将文件和目录的列表扩展为映射任务的输入,每个任务都会复制源列表中指定的文件分区. ..
发布时间:2020-09-20 19:34:58 其他开发

如何将Oracle Clob数据导入到HDFS上的Avro文件

当将数据从oracle DB压缩到HDFS时,出现一个奇怪的错误. Sqoop无法将Clob数据导入hadoop上的avro文件中. 这是sqoop导入错误: ERROR tool.ImportTool: Imported Failed: Cannot convert SQL type 2005 我们是否需要在sqoop import语句中添加任何其他参数,以使其将Clob数据正确 ..
发布时间:2020-09-15 05:17:58 数据库

Hadoop-3.0.0与旧版本的Hive,Pig,Sqoop和Spark的兼容性如何

我们当前在10个节点的群集上使用hadoop-2.8.0,并计划升级到最新的hadoop-3.0.0. 我想知道如果将hadoop-3.0.0与较旧版本的Spark和其他组件(如Hive,Pig和Sqoop)一起使用,是否会出现问题. 解决方案 最新的Hive版本不支持Hadoop3.0.看来Hive将来可能会在Spark或其他计算引擎上建立. ..
发布时间:2020-09-03 20:30:12 其他开发

sqoop合并密钥创建多个零件文件,而不是一个不使用合并密钥的文件

理想情况下,当我们在不使用merge-key的情况下运行增量时,它将创建具有附加数据集的新文件,但是如果使用merge-key,则它将创建仅在一个文件中包括先前数据集的新的整个数据集.但是当我在sqoop工作中使用incremental append时,我没有得到一个零件文件.以下是我的步骤: 1)初始数据: mysql> select * from departments_per; ..
发布时间:2020-08-11 02:55:00 数据库

哪个版本的Sqoop可与Hadoop 0.20.2一起使用?

Sqoop 2是否可以与Hadoop 0.20.2一起使用? 最好下载哪个版本的sqoop? 1.4.2或1.99.1吗? 谢谢!) 解决方案 Sqoop当前具有两个主要分支. Sqoop 1是支持Hadoop 0.20、1.x,0.23和2.0.x的较老的功能齐全且成熟的项目,您可以从第二个分支是Sqoop2,它是项目的重新设计. 1.99.3版提供了第一个版本.该分支 ..
发布时间:2020-07-13 20:36:12 其他开发

从vertica导入sqoop失败

我正在尝试使用sqoop2将数据集从Vertica导入HDFS. 我在sqoop计算机上运行以下查询,以将数据从Vertica v6.0.1-7导入hdfs sqoop import -m 1 --driver com.vertica.jdbc.Driver --connect "jdbc:vertica://10.10.10.10:5433/MYDB" --password dbpa ..
发布时间:2020-07-09 21:09:40 其他开发

Sqoop将postgres导入到S3失败

我当前正在将postgres数据导入到hdfs.我打算将存储从hdfs转移到S3.当我尝试提供S3位置时,sqoop作业失败.我正在EMR(emr-5.27.0)群集上运行它,并且已经从群集中的所有节点对该s3存储桶进行了读/写访问. sqoop import \ --connect "jdbc:postgresql://:/?sslf ..
发布时间:2020-07-09 21:09:33 其他开发

SQOOP增量导入:当从数据库中删除一行时,它如何处理数据?

假设我有一个雇员表,该表的列(emp_id,emp_name,emp_age,emp_update_ts),如果表上有更新,则updat_ts字段每次都会自动更新为当前时间戳.现在我的问题是: 当我更新/插入表中的行并使用lastmodified运行增量sqoop导入时,它将使我的数据库和hdfs保持同步,但是“如果从表中删除了数据,然后我使用lastmodified运行sqoop增量将如何 ..
发布时间:2020-07-09 21:09:31 其他开发

sqoop与hadoop抛出ClassNotFoundException的集成

我对hadoop和sqoop一词是陌生的.我安装了hadoop 2.7.3(伪模式),并且在我的系统上可以正常工作. 我想与sqoop集成.我正在使用sqoop sqoop-1.99.7-bin-hadoop200. 1)我解压缩tar文件并将解压缩的内容移到/usr/local/sqoop 2)将Sqoop路径设置为.bashrc文件. /usr/local/sqoop/ ..
发布时间:2020-07-09 21:09:23 Java开发

sqoop中的--direct模式是什么?

据我了解,sqoop用于将表/数据从数据库导入或导出到HDFS或Hive或HBASE. 我们可以直接导入单个表或表列表.内部mapreduce程序(我认为只有map任务)将运行. 我的疑问是什么是sqoop direct,什么时候使用sqoop direct选项? 解决方案 只需阅读Sqoop文档! 一般原则位于此处用于导入和有用于出口 某些数据库可以更高性能的方式 ..
发布时间:2020-07-09 21:09:19 其他开发

使用ojdbc6连接器导入Sqoop

我正在使用sqoop从oracle 11g导入数据,因为我没有权限将ojdbc jar放在群集的sqoop的lib中,我使用-libjars显式提供了jar,但它抛出了异常.我拥有的代码使用的是: sqoop eval -libjars /root/shared_folder/ojdbc6.jar --driver oracle.jdbc.OracleDriver --connect jdb ..
发布时间:2020-05-22 04:16:21 其他开发

sqoo导出失败,原因是oozie

我正在尝试从hdfs到sqoop将数据导出到mysq l.我可以通过外壳运行sqoop,并且工作正常.但是当我通过oozie调用时.它是由于以下错误而引起的,并且越来越失败.我还包括了罐子.没有描述性日志 sqoop脚本: export --connect jdbc:mysql://localhost/bigdata --username root --password cloude ..
发布时间:2020-05-20 18:32:25 其他开发