如何从Oracle Sqoop导入压缩分区Hive表 - 腾讯云开发者社区

1、问题1 [root@node1 sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin:@192.168.1.31:1521:users...Consider using -P instead. 18/05/23 16:16:47 INFO oracle.OraOopManagerFactory: Data Connector for Oracle...因为这个表没有主键，所以需要需要设置-m 1 2、修改参数，再次执行 [root@node1 sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin...-1.2.2.jar hive-exec-1.2.2.jar 成功执行 [root@node1 sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:...> 5、测试导入一张大表 [root@bigdata01-test sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin:@10.17.12.31

2.7K3 0

Sqoop导入MySQL所有表到Hive

1、导入到Hive默认数据库 [root@node1 sqoop-1.4.7]# bin/sqoop-import-all-tables --connect jdbc:mysql://node1:3306.../esdb --username root --password 123456 --hive-import --create-hive-table Warning: /opt/sqoop-1.4.7/bin...> 2、导入到指定Hive数据库默认是导入到default数据库中，如果想指定导入到某个数据库中，可以使用–hive-database参数 hive> create database test; OK...Time taken: 0.158 seconds hive> [root@node1 sqoop-1.4.7]# bin/sqoop-import-all-tables --connect jdbc...[root@node1 sqoop-1.4.7]# hive> use test; OK Time taken: 0.03 seconds hive> show tables; OK files logs

10.5K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

Sqoop从Oracle导入一个大表（3亿）到Hive失败

大约3亿条记录 SQL> SELECT count(*) FROM INFO; COUNT(*) ---------- 294239674 SQL> 导入Hive [root@node1 sqoop...-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin:@node1:1521:ORA --username test --password test...--table info --hive-import --target-dir temp_table --hive-table info --null-string '\\N' --null-non-string...'\\N' --fields-terminated-by '\001' --hive-drop-import-delims -m 1 --hive-overwrite --delete-target-dir...) at oracle.jdbc.driver.OracleResultSetImpl.next(OracleResultSetImpl.java:288) at org.apache.sqoop.mapreduce.db.DBRecordReader.nextKeyValue

8521 0

sqoop从mysql导入hive parquet表timestamp,decimal转换问题

注意两个地方： 1.时间转换问题：timestamp、date，time 以上时间类型会被sqoop转成int,long型，无法直接转成时间类型如果要转的有两个办法： 1）转成long型，再用from_unixtime...转回来，才能看时间（太麻烦）—–parquet表的类型对应为bigint select *, from_unixtime(cast(SOURCE_LOAD_DATE as BIGINT) DIV 1000000...) as SOURCE_LOAD_DATE from table_name; 2）直接转成string型（直观，可以直接看）——parquet表的数据类型对应为string 另外：处理datetime...zeroDateTimeBehavior=convertToNull 参考：https://avro.apache.org/docs/current/spec.html 2.浮点类型（float,double,decimal） sqoop...parquet中对应的数据类型为decimal(precision,scale),如decimal(19,3) 参考：https://archive.cloudera.com/cdh6/6.2.0/docs/sqoop

2.6K3 0

Sqoop导入Oracle数据表到HDFS

1、问题 [root@node1 sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin:@192.168.1.100:1521:TPADC...Consider using -P instead. 18/05/22 15:57:39 INFO oracle.OraOopManagerFactory: Data Connector for Oracle...Please ensure that your table name is correct. 2、解决办法，将表名改成大写 [root@node1 sqoop-1.4.7]# bin/sqoop import...Consider using -P instead. 18/05/22 16:00:59 INFO oracle.OraOopManagerFactory: Data Connector for Oracle...[root@node1 sqoop-1.4.7]# bin/sqoop import --connect jdbc:oracle:thin:@192.168.1.100:1521:TPADC --table

9021 0

hive 非分区表导入csv数据

非分区表 -- 示例1： use temp; drop table tmp_cuiwei_main_recommend; create table IF NOT EXISTS tmp_cuiwei_main_recommend

1.2K3 0

导入导出 Oracle 分区表数据

--**************************** -- 导入导出 Oracle 分区表数据 --**************************** 导入导入Oracle 分区表数据是...分区表的导入导出同样普通表的导入导出方式，只不过导入导出需要考虑到分区的特殊性，如分区索引，将分区迁移到普通表，或使用原始分区表导入到新的分区表。...下面将描述使用imp/exp，impdp/expdp导入导出分区表数据。...有关分区表的特性请参考： Oracle 分区表 SQL server 2005 切换分区表 SQL server 2005 基于已存在的表创建分区有关导入导出工具请参考：数据泵EXPDP...可以导入所有分区(即整个表)，一个或多个分区以及子分区。

2.1K5 0

Sqoop导入Oracle所有表，没有报错，但失败

1、导入到HDFS [root@node1 sqoop-1.4.7]# bin/sqoop-import-all-tables --connect jdbc:oracle:thin:@node1:1521...-1.4.7]# 3、导入到Hive [root@node1 sqoop-1.4.7]# bin/sqoop import-all-tables --connect jdbc:oracle:thin:@...-1.4.7]# 没有报错，当然没有导入到Hive。...3、问题分析 import-all-tables导入多表，必须同时满足三个条件：每个表必须都只有一个列作为主键；必须将每个表中所有的数据导入，而不是部分；必须使用默认分隔列，且WHERE子句无任何强加的条件...也许是因为某些数据表的主键是多字段联合主键。

1.5K2 0

使用Sqoop从Postgresql中导入数据到Hive中

下载安装从 http://mirror.bit.edu.cn/apache/sqoop/ 地址下载 sqoop 安装包，这里我使用的是1.4.7版本。...wget -c http://mirror.bit.edu.cn/apache/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 解压压缩包到一个目录下...postgresql 向 HDFS 导入数据 # 导入数据到默认目录 $ bin/sqoop import --connect jdbc:postgresql://localhost:5432/test...postgresql 向 Hive导入数据在使用Hive前，需要在 sqoop 的根目录下创建一个 hive-exec.jar 的软连接，如下： ln -s /apps/apache-hive-2.3.2...-bin/lib/hive-exec-2.3.2.jar 向 Hive 中导入数据 # 导入数据到 hive 中（也可以指定 Hive 中的数据库，表和使用增量导入方式） $ bin/sqoop import

3.4K4 0

Sqoop 数据导入导出实践

) hive_test为hive表名（hive中的这个表可以不用提前建，只用给表名即可，导成功后列名和Oracle表的列名相同） 4....--username xxx --password xxx 5.从数据库导出表的数据到HDFS文件(这个比较实用) sqoop import --connect jdbc:oracle:thin:@...导成功后可以用命令查看： hadoop fs -text /home/dpt/part-m-00000 6.分区表的导入通过sqoop将hive中的表导入到oracle中 sqoop export...--input-fields-terminated-by '\t' --input-lines-terminated-by '\n'; 导入分区表需要指定到具体分区目录，不然会找不到数据，在oracle...表中能指定分区这个字段！

1.9K3 0

sqoop命令参数参考说明及案例示例

目录一、概念二、特征三、常用命令示例四、实战案例示例 1.全量导入(将数据从mysql导入到HDFS指定目录） 2.全量导入(将数据从mysql导入到已有的hive表) 3.全量导入(将数据从...，主要用于在Hadoop(Hive)与传统数据库(mysql、postgresql...)间进行数据的传递，可以将关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到...sqoop import 从RDBMS导入到HDFS sqoop export 从HDFS导出到RDBMS --connect jdbc:mysql://ip:port/...'\\N' \ --null-non-string '\\N' \ --split-by id \ -m 1 2.全量导入(将数据从mysql导入到已有的hive表) # 全量导入(将数据从mysql...-split-by id \ -m 1 3.全量导入(将数据从mysql导入到hive,hive表不存在,导入时自动创建hive表) # 全量导入(将数据从mysql导入到hive,hive表不存在，

1.3K4 0

Sqoop工具模块之sqoop-import 原

--hive-partition-key：分配到分区的Hive字段的名称。 --hive-partition-value ：作为该任务导入到Hive中的分区键的字符串值。...也可以使用--hive-table选项控制输出表名称。 5．指定分区 Hive可以将数据放入分区以提高查询性能。...Sqoop可以通过指定--hive-partition-key和--hive-partition-value参数将数据导入Hive的特定分区。分区值必须是一个字符串。...有关分区的更多详细信息，请参阅Hive文档。 6．指定压缩 --compress和--compression-codec选项可以将数据压缩之后导入Hive中。 ...使用此压缩编解码器导入表格时，Sqoop将根据索引文件自动的对数据进行切分并创建正确的Hive表格式。此功能目前必须使用lzop编解码器对表的所有分区进行压缩。

5.9K2 0

【数据采集与预处理】数据传输工具Sqoop

：四、导入数据在Sqoop中，“导入”概念指：从非大数据集群（RDBMS）向大数据集群（HDFS，Hive，HBase）中传输数据，叫做：导入，即使用import关键字。...五、导出数据在Sqoop中，“导出”概念指：从大数据集群（HDFS，HIVE，HBASE）向非大数据集群（RDBMS）中传输数据，叫做：导出，即使用export关键字。...在导入数据到hive时，去掉数据中的\r\n\013\010这样的字符 3 –map-column-hive 生成hive表时，可以更改生成字段的数据类型 4 –hive-partition-key...创建分区，后面直接跟分区名，分区字段的默认类型为string 5 –hive-partition-value 导入数据时，指定某个分区的值 6 –hive-home hive的安装目录，可以通过该参数覆盖之前默认配置的目录...7 –hive-import 将数据从关系数据库中导入到hive表中 8 –hive-overwrite 覆盖掉在hive表中已经存在的数据 9 –create-hive-table 默认是false

1031 0

sqoop关系型数据迁移原理以及map端内存为何不会爆掉窥探

导入数据：MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统。导出数据：从Hadoop的文件系统中导出数据到关系数据库mysql等。 ?...Sqoop的数据导入　　从RDBMS导入单个表到HDFS。表中的每一行被视为HDFS的记录。...但是考虑这样一种情况：关系库中的某张表每天增量导入到hdfs上，然后使用hive对导入的数据加载进hive表时，我们不应该每次都情况hive表再进行全局导入hive,这样太耗费效率了。...当然可以根据文件的生成时间来确定每次把那个文件导入到hive中，但是不便于维护，可以直接根据目录名来导入该目录下的数据到hive中，且导入到hive中的数据可以按天设置分区，每次导入的数据进入一个新的分区...有些业务场景只需要对hive表中每天新增的那些数据进行etl即可，完全没有必要每次都是将整个hive表进行清理，那么可以结合hive的分区，按天进行分区，这样每次进行etl处理就处理那一个分区数据即可。

1.1K2 0

助力工业物联网，工业大数据项目之数据采集

:OraclePort:OracleSID 测试采集Oracle数据进入 docker exec -it sqoop bash 测试 sqoop import \ --connect jdbc:oracle...中建表查看数据条数 - 进入Hive容器 ``` docker exec -it hive bash ``` - 连接HiveServer ``` beeline -u jdbc...采集完成后导致HDFS数据与Oracle数据量不符原因 sqoop以文本格式导入数据时，默认的换行符是特殊字符 Oracle中的数据列中如果出现了\n、\r、\t等特殊字符，就会被划分为多行 Oracle...中建表进入Hive容器 docker exec -it hive bash 连接HiveServer beeline -u jdbc:hive2://hive.bigdata.cn:10000 -n...要求：必须有一列自增的值，按照自增的int值进行判断特点：只能导入增加的数据，无法导入更新的数据场景：数据只会发生新增，不会发生更新的场景代码 sqoop import \ --connect

5852 0

apache sgoop 导入数据到 oracle、导出数据到 oracle 实现

业务场景：是在oracle 数据库和 hive 数据库中，有多个相同结构的表，要求数据从2个库定时双向同步。...写一个文本文档，把要导入的表名和库名先编辑好，格式如 oracle_table_list_append.txt ： wate.BUSI_xxx wate.xxx_xxx_INFO wate.xxx_USER_xxx...# wate 是 oracle 数据库名， BUSI_xxx 是表名。 # 可写多行，脚本执行时读取每个一行，循环导入每个表的数据。...编写sgoop import 脚本并执行即可把数据从 oracle 数据库导入到 hive 数据库中。...编写sgoop export 脚本并执行，则可把数据从 hive 库导出到 oracle 数据库。

8872 0

数据库自动化采集与数据库层别的建立

目标：从Oracle抽取数据到HIVE中创建ODS层和DWD层数据库，并完成在当天的对应总共100张表的创建与数据载入 HQL语句预设 1:创建ODS层和DWD层 create database if...【Ⅳ. partition_info】由于是创建当天的表格，可以选用日期作为分桶依据【Ⅴ. delimitered | serde】/ 【Ⅵ. store_type】首先需要使用sqoop从Oracle...中采集数据到HIVE，完成ODS层的采集,再根据这层数据导入到DWD层。...表导入到HIVE时生成了*.avsc ，因此列的元数据信息可以通过tblproperties配置schema文件指定 HQL # ods层数据库的建表语句create_table.txt create...(cmd) cmd=tble_create_cmd replace_dict=dict() 修改分区信息 HQL # ods层表分区语句add_partition.txt alter table

1331 0

Sqoop数据迁移工具使用与优化技巧：面试经验与必备知识点解析

2.Sqoop命令行操作详细介绍Sqoop常用命令（如import、export、codegen、create-hive-table、eval、merge、job）的语法、参数含义、使用示例，以及如何通过这些命令实现关系型数据库到...3.Sqoop与Hadoop生态集成探讨Sqoop与Hadoop HDFS、MapReduce、YARN、Hive、HBase、Oozie等组件的集成方式，以及如何通过Sqoop将关系型数据库的数据高效地导入到...4.Sqoop连接器与驱动讲解Sqoop对不同关系型数据库（如MySQL、Oracle、PostgreSQL、SQL Server、DB2、Teradata）的支持，以及如何配置和使用对应的JDBC连接器与数据库驱动...二、Sqoop数据迁移优化技巧1.数据切分与并行迁移分享Sqoop通过split-by参数、自定义切分函数、动态分区等手段实现数据表的高效切分，以及如何根据数据分布、硬件资源、网络状况等因素合理设置并行度...、Avro、Parquet、ORC）等手段减少数据传输量、提高磁盘I/O效率，以及如何根据数据类型、数据量、查询需求选择合适的压缩算法、编码格式、序列化格式。

3721 0

Hive中parquet压缩格式分区表的跨集群迁移记录

环境与需求集群环境华为FushionInsight A 华为FushionInsight B 华为集群管理机 local Hive 3.1.0 HDFS 3.3.1 需求描述从华为A集群中将我们的数据迁移到华为...数据样例：分区表外部表 .parquet压缩操作步骤 STEP 1 记下表所在华为A集群的HDFS位置，使用命令desc formatted 'tablename';获取，如'hdfs://hacluster...此时如果表存储过大，我们根据要迁移的表的分区进行get操作也可以，将对应分区名跟在位置后，如'hdfs://hacluster/user/hive/warehouse/bigdata.db/tablename.../2023'，一般表示2023年的分区。...STEP 4 在华为B集群中创建迁移的表，STEP 1中我们已经拿到了建表语句，需要修改位置：'hdfs://hacluster/user/hive/warehouse/bigdata.db/tablename

971 0

致敬 Apache Sqoop

1、去官网（http://archive.apache.org/dist/sqoop/）下载压缩包： ?...Sqoop从MySQL导入到Hive中，分为两步: 创建一个临时目录存放从MySQL上导入的数据，默认目录为：/user/{mysqlTableName}/ 将临时目录的数据迁移到Hive表目录中，迁移完毕删除临时目录...的配置 ====== # --hive-import：把从MySQL导入到临时目录的数据迁移到Hive表目录 --hive-import \ --hive-overwrite \ --hive-table...表，Sqoop1.4.7可能与Hive1.2.2版本不兼容，不会自动创建Hive表，虽然已经把数据导入到指定创建的Hive表目录下，但是没有添加元数据，在Hive中查询不到该表。...MySQL --> HBase Sqoop可以直接从MySQL把数据导入到HBase中，不像Hive有个--hive-import需要分为两步执行。

9422 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Sqoop导入Oracle数据表到Hive

Sqoop导入MySQL所有表到Hive

Sqoop从Oracle导入一个大表（3亿）到Hive失败

sqoop从mysql导入hive parquet表timestamp,decimal转换问题

Sqoop导入Oracle数据表到HDFS

hive 非分区表导入csv数据

导入导出 Oracle 分区表数据

Sqoop导入Oracle所有表，没有报错，但失败

使用Sqoop从Postgresql中导入数据到Hive中

Sqoop 数据导入导出实践

sqoop命令参数参考说明及案例示例

Sqoop工具模块之sqoop-import 原

【数据采集与预处理】数据传输工具Sqoop

sqoop关系型数据迁移原理以及map端内存为何不会爆掉窥探

助力工业物联网，工业大数据项目之数据采集

apache sgoop 导入数据到 oracle、导出数据到 oracle 实现

数据库自动化采集与数据库层别的建立

Sqoop数据迁移工具使用与优化技巧：面试经验与必备知识点解析

Hive中parquet压缩格式分区表的跨集群迁移记录

致敬 Apache Sqoop

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐