sqoop 第4页 - IT屋-程序员软件开发技术分享社区

sqoop创建impala实木复合地板表

我是一个相对较新的静悄悄的过程，所以请原谅任何无知.我一直在尝试从数据源中提取一张表作为木地板文件，并创建一个Impala表(也作为木地板)，将经插入的数据插入其中.该代码运行没有问题，但是当我尝试选择几行进行测试时，出现错误: .../EWT_CALL_PROF_DIM_SQOOP/ec2fe2b0-c9fa-4ef9-91f8-46cf0e12e272.parquet' has an i ..

发布时间：2020-11-22 03:01:49 bash hadoop sqoop impala parquet 其他开发

使用Apache Sqoop从MySQL导入数据-错误:没有用于连接字符串的管理器

我正在尝试将Mahout与外部数据源集成.我正在关注 Apache Mahout Cookbook 这本书. 我已经配置了Hadoop 2.4，MySQL服务器，并且已经将一个虚拟数据库导入到mysql中. 我还按照本书中的步骤安装了Apache Sqoop，并在Sqoop库(sqoop/lib)中下载并部署了mysql-connector-java-5.1.30.jar 我已经 ..

发布时间：2020-11-22 02:55:26 java mysql hadoop sqoop Java开发

Sqoop + S3 + Parquet导致错误的FS错误

当尝试使用Sqoop将数据以Parquet格式导入S3时，如下所示: bin/sqoop import --connect 'jdbc:[conn_string]' --table [table] --target-dir s3a://bucket-name/ --hive-drop-import-delims --as-parquetfile ...我收到以下错误: ERROR ..

发布时间：2020-11-22 02:45:05 hadoop amazon-s3 parquet sqoop 其他开发

使用sqoop从CSV文件加载到Hive表?

是否可以借助Sqoop从CSV文件加载配置单元表? 解决方案 Sqoop 并不是为了这个目的，我认为它不能解决您的要求. Sqoop用于在Hadoop和RDBMS之间导入或导出数据. 对于您的情况，您不需要sqoop，无需从HDFS或本地到配置单元表中加载CSV文件.下面是它的语法. LOAD DATA INPATH 'hdfs_file_or_directory_path' ..

发布时间：2020-11-22 02:36:32 hadoop sqoop 其他开发

从hdfs到SQL的sqoop导出失败，需要帮助以转义字符

我在hdfs中有一个文件，并将其导出到sqoop表.请在下面找到日志详细信息: Caused by: java.lang.RuntimeException: Can't parse input data: ' characters' at tags.__loadFromFields(tags.java:335) at tags.parse(tags.java:268) ..

发布时间：2020-11-22 02:34:53 hadoop sqoop 其他开发

如何使用排名功能获取Hive中的最新记录

我在蜂巢中有下表，其中包含列ID，名称和时间戳记: 根据以下时间戳记，应将输出作为最新记录: 解决方案您不需要为此排名.您的输出描述如下: select t.* from t order by t.transaction_time desc limit 3; 编辑: 哦，您要rank()或dense_rank(): select t.* from (selec ..

发布时间：2020-11-22 02:32:13 sql hadoop hive hiveql sqoop 其他开发

分区配置单元

我在蜂巢中使用静态分区以根据日期字段将数据隔离到子目录中，因为我每天需要向蜂巢中加载数据，所以每个表(总共14个表)每年需要365个分区. 在配置单元中可以创建的静态分区数量是否有限制? 如果"hive.exec.max.dynamic.partitions.pernode"，动态分区给出错误超过了sqoop导入的指定阈值(100) 我有5个节点HDP集群，其中3个是数据节点 ..

发布时间：2020-11-22 02:30:41 performance hadoop hive partitioning sqoop 其他开发

使用sqoop从多个数据库导入数据

我想使用sqoop从多个SQLsever数据库(100+)导入某些表到HDFS.有人可以指导我怎么做吗?自动化脚本会很好. 解决方案这可以通过Shell脚本来完成. 1)准备一个具有DBNAME.TABLENAME列表的输入文件 2)shell脚本将以该文件为输入，逐行迭代并为每行执行sqoop语句. while read line; do DBNAME=`echo ..

发布时间：2020-11-22 02:23:00 hadoop sqoop 其他开发

使用sqoop(1.4.5)将mysql数据导入到hdfs(hadoop 2.4.1)

我是Hadoop的初学者，尝试使用sqoop 1.4.5从本地数据库mysql导入表到hadoop 2.4.1的hdfs. mysql version : 5.5.38 hdfs version :hadoop 2.4.1 sqoop version :1.4.5 我尝试sqoop-list-databases，它给出正确的答案但随后给出以下cmd: sqoop im ..

发布时间：2020-11-22 02:20:35 mysql hadoop sqoop 数据库

--connection-manager在Sqoop中的意义

我已经编写了sqoop脚本，以将数据从Teradata导入到Hive. `sqoop import \ --connect $JDBC_URL \ --driver com.teradata.jdbc.TeraDriver \ --username $Username \ --password $Password \ --table $TD_Table \ --hive-import \ - ..

发布时间：2020-11-22 02:19:36 hadoop hive teradata sqoop 其他开发

如何通过Sqoop从多个源导入数据

“如何通过Sqoop从多个源导入数据". 我对此一无所知..请让我知道它的机制. 谢谢解决方案这可以通过Shell脚本来完成. 1)准备一个包含DBNAME.TABLENAME列表的输入文件.2)shell脚本会将这个文件作为输入，逐行迭代并为每行执行sqoop语句. while read line; do DBNAME=`echo $line | c ..

发布时间：2020-11-22 02:16:45 hadoop sqoop 其他开发

在运行Sqoop导入和导出时，如何找到最佳的映射器数量?

我正在使用Sqoop 1.4.2版和Oracle数据库. 运行Sqoop命令时.例如这样的 ./sqoop import \ --fs \ --jt \ --c ..

发布时间：2020-11-22 02:15:02 oracle hadoop mapreduce hdfs sqoop 数据库

在特定队列上运行队列作业

我正在尝试创建在特定队列中运行的 Sqoop作业，但是它不起作用. 我已经尝试了两件事: 第一个:声明作业创建中的队列 sqoop job \ --create myjob \ -- import \ --connect jdbc:teradata://RCT/DATABASE=MYDB \ -Dmapred ..

发布时间：2020-11-22 01:51:05 hadoop queue sqoop 其他开发

Hadoop上的Sqoop:NoSuchMethodError:com.google.common.base.Stopwatch.createStarted()

我正在Google Cloud DataProc的hadoop上运行sqoop，以通过Cloud SQL代理访问postgresql，但出现Java依赖错误: INFO: First Cloud SQL connection, generating RSA key pair. Exception in thread "main" java.lang.reflect.InvocationTar ..

发布时间：2020-11-18 02:08:40 postgresql hadoop sqoop google-cloud-dataproc 其他开发

Sqoop的权限异常

Stack:使用Ambari 2.1安装了HDP-2.3.2.0-2950 安装是自动的.因为这些机器(总共9个节点)具有Internet连接，并且是使用根凭据完成的. 一个ls命令输出以供参考(缺少qoop用户): [root@l1031lab ~]# hadoop fs -ls /user Found 7 items drwx------ - accumulo hdfs ..

发布时间：2020-11-06 03:14:08 hdfs file-permissions sqoop hortonworks-data-platform 其他开发

Sqoop导入失败，UnsupportedClassVersionError

我试图使用sqoop将表从MySQL导入到HDFS。使用的命令行是 sqoop import --connect jdbc：mysql：//192.168.10.452/qw_key_test- -username qw -P-由qw_id -m分割--10 --target-dir / user / perf / qwperf / sqoops --verbose --table q ..

发布时间：2020-10-03 00:24:55 hadoop import cloudera sqoop 其他开发

Sqoop作业因Oracle导入的KiteSDK验证错误而失败

我正在尝试运行Sqoop作业以从Oracle数据库加载并以Parquet格式加载到Hadoop集群。作业是增量工作。 Sqoop版本为1.4.6。 Oracle版本是12c。 Hadoop版本是2.6.0（发行版是Cloudera 5.5.1）。 Sqoop命令是（创建作业并执行）： $ sqoop job -fs hdfs：//：// ：8020 80 -创建myJob \ ..

发布时间：2020-10-03 00:24:42 oracle hadoop cloudera sqoop 数据库

错误hive.HiveConfig：无法加载org.apache.hadoop.hive.conf.HiveConf。确保正确设置HIVE_CONF _DIR

我正在尝试将数据从sqoop导入到配置单元中 MySQL 使用样本；创建表forhive（id int auto_increment，姓氏varchar（36），姓氏varchar（36），主键（id）） ; 插入forhive（firstname，lastname）values（“ sample”，“ singh”）; select * from for ..

发布时间：2020-10-03 00:21:54 hadoop hive sqoop cloudera 其他开发

Sqoop的语法导入数据库中存在的100个表中的5个-不使用exclude关键字吗?

我在数据库中有100张表. 我只想导入5张桌子. 我不能/不使用“-排除"命令解决方案 This can be done by shell script. 1)Prepare a input file which has list of 5 DBNAME.TABLENAME 2)The shell script will have this file as input, iterat ..

发布时间：2020-09-20 20:02:47 hadoop bigdata sqoop 其他开发

sqoop支持通过蜂巢进行动态分区吗?

sqoop是否支持通过蜂巢进行动态分区? 我尝试使用以下提到的选项: --hive-partition-key和--hive = partition-vlaue仅用于静态分区例如: sqoop导入 --connect"jdbc:mysql://quickstart.cloudera:3306/prac" --username root-密码cloudera --hive-import -- ..

发布时间：2020-09-20 20:02:39 hadoop hive sqoop bigdata 其他开发

sqoop相关内容