apache sqoop - 腾讯云开发者社区

文章/答案/技术大牛

发布

致敬 Apache Sqoop

大家好，我是一哥，昨天看到了过往记忆大佬发了一篇文章，才发现Sqoop这个项目最近不咋好，心里很不是滋味，这个帮助过很多开发者的项目，竟然从Apache顶级项目中“下架”了，今天还是想给大家分享介绍一些这个很棒的项目...1、去官网（http://archive.apache.org/dist/sqoop/）下载压缩包： ?...05 Sqoop的遗憾 Apache Sqoop moved into the Attic in 2021-06....Apache Sqoop mission was the creation and maintenance of software related to Bulk Data Transfer for Apache...这里有之前写的一份如何参与Apache项目的指南《如何参与一个Apache开源项目》，一起加入开源！开源，让技术更美好！

1.2K2 0

Apache Sqoop 将mysql导入到Hadoop HDFS

第 21 章 Apache Sqoop 目录 21.1....sqoop-1.99.7-bin-hadoop200.sh | bash 启动 Sqoop /srv/apache-sqoop/bin/sqoop.sh server start 检查 Sqoop...: /srv/apache-sqoop/bin/.....-shell [hadoop@netkiller ~]$ sqoop2-shell Setting conf dir: /srv/apache-sqoop/bin/...../conf Sqoop home directory: /srv/apache-sqoop Sqoop Shell: Type 'help' or '\h' for help.

2.5K7 0

您找到你想要的搜索结果了吗？

是的

没有找到

Sqoop

1 Sqoop参数 /opt/module/sqoop/bin/sqoop import \ --connect \ --username \ --password \ --target-dir \...delete-target-dir \ --num-mappers \ --fields-terminated-by \ --query "$2" ' and $CONDITIONS;' 2 Sqoop...3 Sqoop数据导出一致性问题 Sqoop在导出到Mysql时，使用4个Map任务，过程中有2个任务失败，那此时MySQL中存储了另外两个Map任务导入的数据，此时业务正好看到了这个报表数据。...5 Sqoop在导入数据的时候数据倾斜 split-by：按照自增主键来切分表的工作单元； num-mappers：启动N个map来并行导入数据，默认4个； 6 Sqoop数据导出Parquet... Ads层数据用Sqoop往MySql中导入数据的时候，如果用了orc（Parquet）不能导入，需转化成text格式。

4162 0

Sqoop安装

这篇文章记录了配置sqoop的步骤。在实验过程中，遇到了一些ERROR，反复百度也没有找到解决方法。最后，把sqoop安装文件夹删除，wget原始文件，重头配置了一遍，一切都OK了。...一、下载sqoop 1.4.7 如图，下载地址很好找。本文还是用sqoop1。 ?...下载页面下有两个链接，使用sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz，包含hadoop支持。不要用sqoop-1.4.7.tar.gz。 ?...三、修改配置添加环境变量 export SQOOP_HOME="/opt/sqoop" export PATH=$SQOOP_HOME/bin:$PATH 主要配置文件sqoop/config/sqoop-env.sh...NoClassDefFoundError: org/apache/avro/LogicalType 这个问题出现了，没有解决，希望再遇到的同学和我一样，按官方jar下载重装解决。

2.2K4 0

Sqoop：容错

Sqoop本身的容错依赖于Hadoop，这里我们focus在Sqoop传输任务失败的处理，确切的说，focus在Sqoop如何解决传输任务失败引发的数据一致性问题对于一个传输任务，将数据从A传输到B，...Sqoop将一个传输作业生成一个mapreduce job，一个job有多个并行执行传输作业的mapreduce task在和外部数据库做数据传输，然后，有很多原因可以导致个别task fail，eg：...对于Sqoop Import任务，由于Hadoop CleanUp Task的存在，这个问题不存在 Sqoop Export任务则提供了一个“中间表”的解决办法先将数据写入到中间表，写入中间表成功，.../sqoop export --connect jdbc:mysql://127.0.0.1/test --table employee --staging-table employee_tmp --clear-staging-table

6621 0

sqoop原理

sqoop,各位看官基本上都了解或者听说过，小二就不进行废话了。...另外基于国内大部分用的为CDH，小二就想说一点：CDH中的sqoop2其实是apace版的sqoop1，聪明的看官不要被表面所迷惑了. 第一关：无图无真相 ?...root --password 123456 --table cae01_psnmrtginfo_chenx --target-dir /usr/input/db -m 1 mysql导入到hive sqoop...dwd_icc_clnt_bkinfo --hive-import --hive-overwrite --null-string '\\N' --null-non-string '\\N' -m 1 sqoop...--password 000000 --hive-table users --fields-terminated-by "\0001" --lines-terminated-by "\n"; sqoop

2.4K1 0

大数据技术之_12_Sqoop学习_Sqoop 简介+Sqoop 原理+Sqoop 安装+Sqoop 的简单使用案例+Sqoop 一些常用命令及参数

第1章 Sqoop 简介 Sqoop 是一款开源的工具，主要用于在 Hadoop(Hive) 与传统的数据库 (mysql,postgresql,...)...Sqoop 项目开始于 2009 年，最早是作为 Hadoop 的一个第三方模块存在，后来为了让使用者能够快速部署，也为了让开发人员能够更快速的迭代开发，Sqoop 独立成为一个 Apache 顶级项目...第3章 Sqoop 安装安装 Sqoop 的前提是已经具备 Java 和 Hadoop 的环境。...3.1 下载并解压 1) 下载地址：http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/ 2) 上传安装包 sqoop-1.4.6.bin__hadoop-2.0.4... sqoop 3.2 修改配置文件 Sqoop 的配置文件与大多数大数据框架类似，在 sqoop 根目录下的 conf 目录中。

3.1K3 0

Sqoop安装

---- 准备 sqoop安装包下载地址 https://mirrors.aliyun.com/apache/sqoop/ 我使用的版本为sqoop-1.4.6.bin__hadoop-2.0.4...-alpha.tar.gz 说明 sqoop和1和2两个大版本 sqoop-1.4.6为sqoop1的最后一个版本 sqoop2的版本从1.99.1开始 sqoop可以从hdfs、hive、hbase...# 在hadoop的cdh版本中，把4个组件(commom、hdfs、mapreduce、yarn)安装到4个不同的目录中 # 而apache-hadoop的4个组件都在一个目录下 # 根据自己的版本配置这里的环境变量...,我是apache-hadoop，所以都用HADOOP_HOME即可 export HADOOP_COMMON_HOME=/home/hadoop/apps/hadoop-2.6.5 export HADOOP_MAPRED_HOME...Sqoop 1.4.6 sqoop安装成功！

8894 0

sqoop概述

Sqoop的简介 sqoop，即SQL To Hadop，目的是完成关系型数据库导入导出到Hadoop Sqoop的原理是将命令翻译为mapreduce程序执行，MR没有Reduce阶段，只有Map阶段...Sqoop的安装配置环境可以在/etc/profile中配置，导出为全局变量或在sqoop-env.sh文件配置注：需提前配置HADOOP_HOME,HIVE_HOME,HBASE_HOME...,ZOOKEEPER_HOME 将连接mysql的驱动(参考Hive数据的存储以及在centos7下进行Mysql的安装)，拷贝到sqoop的lib目录测试，如果没有配置环境变量，则进入sqoop...自动替换为一些表达式 --query "SQL" 导入到Hive Sqoop导入到hive，也是先将数据导入到HDFS，再将HDFS的数据，load到hive表中，这个过程自动完成。...在执行导入时，sqoop是可以帮我们自动建表，在使用1.3.0hbase时，建表会失败！建议手动建表！

1.4K1 0

sqoop之旅5-sqoop实例

假设MySQL数据库中有一张表，库名是sqooptest，表名是digdata，表的字段包含： class_id class_name class_month teacher 导入HDFS中 sqoop...import \ --connect jdbc:mysql://ubuntu:3306/sqooptest \ # ubuntu 是主机名；sqoop 是数据库的名字 --username root...import \ --connect jdbc:mysql://ubuntu:3306/sqooptest \ # ubuntu 是主机名；sqoop 是数据库的名字 --username root...\ --password 123456 \ --table sqoop \ # 指定导入到hive中的表名 --hive-default \ --create-table \ # 创建表 -m...--options-file sqoop.im

3792 0

sqoop之旅7-sqoop job

sqoop job Purpose The job tool allows you to create and work with saved jobs....通过已经保存好的作业直接执行以前的任务，无需重复操作记录sqoop命令的配置信息 saved job保证只导入最新的数据 Syntax $ sqoop job (generic-args...) (job-args) [-- [subtool-name] (subtool-args)] $ sqoop-job (generic-args) (job-args) [-- [subtool-name...] (subtool-args)] 看一个demo # 创建 sqoop job --create myjob \ # 指定名字myjob -- import \ --connect jdbc:mysql...# 显示 sqoop job --list # 查看 sqoop job --show myjob

3801 0

Sqoop工具模块之sqoop-import-all-tables

2、语法 $ sqoop import-all-tables (generic-args) (import-args) $ sqoop-import-all-tables (generic-args)...这些参数的使用方式和sqoop-import工具的使用方式一样，但是--table、--split-by、--columns和--where参数不能用于sqoop-import-all-tables工具...--exclude-tables参数只能在sqoop-import-all-tables工具中使用。 3、输出格式参数 --enclosed-by ：设置必需的字段包围字符。...三、应用示例导出corp数据库中的所有表： $ sqoop import-all-tables --connect jdbc:mysql://db.foo.com/corp 验证结果：

1.8K3 0

Sqoop工具模块之sqoop-export 原

1、模式 sqoop-export有三种模式：默认模式：将它们转换为一组将INSERT语句注入数据库的语句。更新模式：Sqoop将生成UPDATE替换数据库中现有记录的语句。...调用模式：Sqoop将为每条记录创建一个存储过程调用。...2、语法和之前的导入工具一样，sqoop-export也有两种语法： sqoop export (generic-args) (export-args) sqoop-export (generic-args...Sqoop执行一组操作不考虑现有内容。如果Sqoop尝试在数据库中插入违反约束的行（例如，特定主键值已存在），则导出失败。...否则，数据库将拒绝导入的数据，从而导致Sqoop作业失败。

7.8K3 0

Sqoop导入数据

一、Sqoop的简介 SQL To Hadop，目的是完成关系型数据库导入导出到Hadoop! Sqoop的原理是讲命令翻译为MR执行，MR没有Reduce阶段，只有Map阶段！...二、 Sqoop的安装1.配置环境可以在/etc/profile中配置，导出为全局变量或sqoop-env.sh 配置 HADOOP_HOME,HIVE_HOME,HBASE_HOME,ZOOKEEPER_HOME2....将连接mysql的驱动，拷贝到sqoop的lib目录3.测试bin/sqoop list-databases --connect jdbc:mysql://hadoop102:3306/ --username...导入到HDFS// \代表在shell窗口中换行bin/sqoop import \// 连接的url--connect jdbc:mysql://hadoop102:3306/mydb \// 用户名...在执行导入时，sqoop是可以帮我们自动建表，在使用1.3.0hbase时，建表会失败！建议手动建表！

2511 0

SQOOP安装手册

1 下载并解压 1）下载地址：http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/ 2）上传安装包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz...到hadoop102的/opt/software路径中 3）解压sqoop安装包到指定目录，如： tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz...-C /opt/module/ 4）解压sqoop安装包到指定目录，如： mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ sqoop 2 修改配置文件 1) 进入到/...opt/module/sqoop/conf目录，重命名配置文件 mv sqoop-env-template.sh sqoop-env.sh 2) 修改配置文件 vim sqoop-env.sh 增加如下内容...的lib目录下 cp mysql-connector-java-5.1.48.jar /opt/module/sqoop/lib/ 4 验证Sqoop 我们可以通过某一个command来验证sqoop

6201 0

Sqoop笔记

Sqoop介绍百度： Sqoop(发音：skup)是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库...我认为： Sqoop就是将Hadoop、Hive、Habse中的数据导入到关系型数据库(MySQL)中或者MySQL到Hadoop、Hive、Habse中，避免手写MapReduce Sqoop安装注意...1） Sqoop的包：sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 支持 hadoop-2.x.x版本，不是只支持2.0.4 2）hadoop和hive安装成功...sqoop-env.sh 修改sqoop-env.sh #Set path to where bin/hadoop is available #export HADOOP_COMMON_HOME= export...help Sqoop使用导入数据在 Sqoop 中，“导入”概念指：从非大数据集群（RDBMS）向大数据集群（HDFS，HIVE， HBASE）中传输数据，叫做：导入，即使用 import 关键字

4751 0

Sqoop工具模块之sqoop-import 原

例如：要连接到SQLServer数据库，首先要下载驱动jar包并将其拷贝到Sqoop lib路径中。然后运行Sqoop。...除此之外，Sqoop配置参数org.apache.sqoop.credentials.loader.class应该设置为提供别名解析的类名：org.apache.sqoop.util.password.CredentialProviderPasswordLoader...在执行并行导入时，Sqoop需要一个可以分割工作负载的标准。Sqoop使用列来分割工作量。默认情况下，Sqoop将识别表中的主键列（如果存在）并将其用作拆分列。...4、控制分布式缓存相关参数每次启动Sqoop作业时，Sqoop都会将$ SQOOP_HOME / lib文件夹中的jar包复制到作业缓存中。...当由Oozie启动时则不用，因为Oozie使用它自己的Sqoop共享库，它将Sqoop依赖关系保留在分布式缓存中。

6.8K2 0

【Sqoop篇】----Sqoop从搭建到应用案例

Sqoop其实功能非常简单。...三、使用官方参考手册：http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_connecting_to_a_database_server...root --password 123 --as-textfile --columns id,name,msg --table psn --delete-target-dir --target-dir /sqoop.../data -m 1 可以将上述命令定义在一个脚本里面：使用如下命令： sqoop --options-file sqoop1 案例二（步骤是Mysql---Hive)的顺序）：实际上就是Mysql-HDFS-Hive...select id, name, msg from psn where id like "1%" and $CONDITIONS' --delete-target-dir --target-dir /sqoop

1.1K1 0

Sqoop 整体介绍

Sqoop 数据迁移 Sqoop 底层还是运行在MapReduce上，通过Yarn进行调度的，只是Sqoop在做数据迁移过程中，只用到了MapTask，没有用到ReduceTask。...Sqoop 是一个数据迁移工具，可以理解为客户端程序，提供HDFS/Hive/HBase 到 RDS(Oracle,Postgrel,MySql等) 数据的导入导出 Sqoop 需要配置到...Sqoop需要指定 Hadopp-Home.xml ，MapReduce-HOME.xml,JAVA-HOME 等系统环境变量类型类型包含 Export，Import ...Sqoop 在做数据迁移之前，最好测试下数据连接是否正常，如果运行不正常，方便进行问题定位。 ... 指定HDFS，需要指定路径，分割幅等信息，Hive类似 RDB需要指定驱动名，URL，User，Pwd,库及表执行脚本： bin/sqoop

3531 0

Sqoop 压缩

Sqoop 作业的输出可以直接压缩。Sqoop 作业是一个MapReduce作业, 因此通过设置MapReduce压缩编解码器, 可以得到 Sqoop 的输出压缩。...只需将参数放到 Sqoop 命令字符串中即可。...--compression-codec snappy压缩 --compression-codec org.apache.hadoop.io.compress.SnappyCodec...Gzip压缩 --compression-codec org.apache.hadoop.io.compress.GzipCodec Bzip压缩 --compression-codec org.apache.hadoop.io.compress.BZip2Codec

1.2K4 0

点击加载更多

致敬 Apache Sqoop

Apache Sqoop 将mysql导入到Hadoop HDFS

Sqoop

Sqoop安装

Sqoop：容错

sqoop原理

大数据技术之_12_Sqoop学习_Sqoop 简介+Sqoop 原理+Sqoop 安装+Sqoop 的简单使用案例+Sqoop 一些常用命令及参数

Sqoop安装

sqoop概述

sqoop之旅5-sqoop实例

sqoop之旅7-sqoop job

Sqoop工具模块之sqoop-import-all-tables

Sqoop工具模块之sqoop-export 原

Sqoop导入数据

SQOOP安装手册

Sqoop笔记

Sqoop工具模块之sqoop-import 原

【Sqoop篇】----Sqoop从搭建到应用案例

Sqoop 整体介绍

Sqoop 压缩

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐