首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DataX、sqoop抽取TDSQL数据库中数据报Timeout的问题

背景: 客户报障他们只要一连接到TDSQL抽取数据,差不多10分钟左右就会出现超时中断,反复几次都不成功。连到MySQL却没有任何问题。...首先和客户确认,他们用的什么工具做的数据抽取,反馈是DataX。先了解一下DataX是什么东东。...DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。...二、信息还是比较少,继续收集信息 客户声音: “我能够确定的是,不是框架限定了连接时间,因为同样的代码,连传统mysql没有问题(超过两个亿,半个多小时以上),一连TDSQL抽取10分钟后就报Timeout...经验证,sqoop抽取数据时也有同样的问题。

2.8K130
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Sqoop1.4.7实现将Mysql数据与Hadoop3.0数据互相抽取

    放弃不难,但坚持很酷~ 本文主要讲解 Sqoop 1.4.7 如何实现 Mysql 与 Hadoop 3.0 之间数据互相抽取的。 环境基于 Ambari 2.7 + HDP 3.0 部署。...之前写过一篇 Sqoop 1.4.6 如何实现 Mysql 与 Hadoop 2.x 之间数据互相抽取的,可参考:《Sqoop概述及shell操作》 一、Sqoop Shell操作 参数 描述 --connect...将Mysql数据导入到Hadoop中 1.1 数据导入到HDFS 参数 描述 table 抽取mysql数据库中的表 --target-dir 指定导入hdfs的具体位置...将Hadoop数据导出到MysqlSqoop export 工具将一组文件从 HDFS 导出回 Mysql 。目标表必须已存在于数据库中。根据用户指定的分隔符读取输入文件并将其解析为一组记录。...在执行过程中,sqoop shell 操作会转化为 MapReduce 任务来实现数据的抽取

    2.5K20

    【知识】ETL大数据集成工具Sqoop、dataX、Kettle、Canal、StreamSets大比拼

    主要用于在Hadoop与关系型数据库之间进行数据转移,可以将一个关系型数据库MySQL ,Oracle等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导出到关系型数据库中。...和Datax的区别 2.6.1 特点对比 1、sqoop采用map-reduce计算框架进行导入导出,而datax仅仅在运行datax的单台机器上进行数据的抽取和加载,速度比sqoop慢了许多; 2、sqoop...sqoop互相导入导出数据,同时在关系型数据库之间,比如mysql和oracle之间也无法通过sqoop导入导出数据。...; 2.6.2 性能对比 1、mysql->hdfs 在mysql中生成50,000,000条数据,将这些数据分别使用datax和sqoop导入到hdfs中,分别比较它们的性能参数: 在mysql中生成...支持增量,全量抽取 支持全量抽取

    10.8K20

    在TBDS部署sqoop组件及抽取数据至hive的使用方法

    导语:本身TBDS平台不提供sqoop组件,若用户想在TBDS平台上使用sqoop抽取外部数据导入至TBDS平台,需要单独部署sqoop组件。...,一般选择Portal机器 安装方式直接rpm -ivh sqoop-xxx.rpm 3.把/etc/sqoop/conf/下的sqoop-env-templete.sh复制一个sqoop-env.sh...sqoop命令,则按照相同步骤操作配置即可 二、sqoop抽取外部数据导入TBDS的hive表 因为访问TBDS的hive表必须要认证才能访问,所以与开源导入的方法稍有不同,需要先做认证配置才能使用。...import --connect jdbc:mysql://x.x.x.x:3306/easy_test --username xxx --password xxx --table DIM_PROJECT...则先删除掉 --direct 使用直接导入模式(优化导入速度) --direct-split-size 分割输入stream的字节大小(在直接导入模式下) --fetch-size 从数据库中批量读取记录数

    2K60

    Sqoop概述及shell操作

    它包括以下两个方面: 可以使用Sqoop将数据从关系型数据库管理系统(如MySQL)导入到Hadoop系统(如HDFS、Hive、HBase)中 将数据从Hadoop系统中抽取并导出到关系型数据库(如MySQL...将Mysql数据导入到Hadoop中 1.1 数据导入到HDFS 参数 描述 table 抽取mysql数据库中的表 --target-dir 指定导入hdfs的具体位置...将Hadoop数据导出到MysqlSqoop export工具将一组文件从HDFS导出回Mysql。目标表必须已存在于数据库中。根据用户指定的分隔符读取输入文件并将其解析为一组记录。...的test数据库的roles_hdfs表中,执行代码如下: sqoop export \ --connect jdbc:mysql://10.6.6.71:3309/test \ --username ...在执行过程中,sqoop shell操作,会转化为MapReduce任务来实现数据的抽取

    1.4K10

    Sqoop学习之路

    为了高效的实现关系数据库与hadoop之间的数据导入导出,hadoop生态圈提供了工具sqoop....把数据从 Hadoop 系统里抽取并导出到关系型数据库里. [9BE2EC62-CEAC-4D14-805C-B3A0DCA1E0E2.png] 版本介绍: Sqoop 2.0 主要解决 Sqoop 1...现有可视化工具与关系型数据库配合良好 数据增量导入 二、基本思想 采用插拔式 Connector 的架构,Connector 是与特定数据源相关的组件,主要负责抽取和加载数据....Sqoop1的整体架构图: [04222D63-C912-4F34-B1A4-3ED1F108ACE6.png] 工作流程简述: 客户端 shell 提交迁移作业 Sqoop 从关系型数据库中读取元信息...(4)加入 mysql 驱动包到 sqoop1.4.7/lib 目录下 # 下载 mysql connector cd /data/pkg wget --no-check-certificate http

    85620

    一篇文章搞懂数据仓库:常用ETL工具、方法

    抽取(Extract)主要是针对各个业务系统及不同服务器的分散数据,充分理解数据定义后,规划需要的数据源及数据定义,制定可操作的数据源,制定增量抽取和缓慢渐变的规则。...装载(Load)主要是将经过转换的数据装载到数据仓库里面,可以通过直连数据库的方式来进行数据装载,可以充分体现高效性。在应用的时候可以随时调整数据抽取工作的运行方式,可以灵活的集成到其他管理系统中。...3.1 sqoop 是Apache开源的一款在Hadoop和关系数据库服务器之间传输数据的工具。...可以将一个关系型数据库MySQL ,Oracle等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导出到关系型数据库中。 sqoop命令的本质是转化为MapReduce程序。...基于数据库增量日志解析,提供增量数据实时订阅和消费,目前主要支持了MySQL,也支持mariaDB。

    4.5K10

    Sqoop源码编译与分析(V1.4.6)

    用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统 ( 如 HBase 和 Hive) 中;同时也可以把数据从 Hadoop 系统里抽取并导出到关系型数据库里...除了这些主要的功能外,Sqoop 也提供了一些诸如查看数据库表等实用的小工具。...Sqoop 支持的数据库 理论上,Sqoop 支持任何一款支持 JDBC 规范的数据库,如 DB2、MySQL 等。...在使用 Sqoop 连接关系型数据库前,首先需要把相关的 JDBC 驱动拷贝到 $SQOOP_HOME/lib 文件夹下,然后在“connect”参数后指定好数据库连接的 url,如“--connect...对于 DB2 数据库来说,Sqoop 目前支持 DB2 的绝大多数数据类型,而且 Sqoop 的大多数工具也能在 DB2 上较好地运行。

    58830

    聊一聊 ETL 的设计

    ,熟练SQL优化,熟悉python/shell等一种脚本语言;掌握mysql,oracle,sqlserver等数据库; 有互联网大数据平台数据开发经验优先。...Mysql 的数据可以通过 Sqoop 抽取到 Hive 中,同样 Hive 的数据也可以通过 Sqoop 抽取Mysql 中。...数据抽取引擎 这里我们主要考虑两种方案: Sqoop 定时抽取 Mysql 数据到 HDFS 中,可以每天全量抽取一份,也可以隔段时间就抽取一份变更的数据。...Canal 监听 Mysql 的 binlog 日志,相当于是 Mysql 有一条数据久变动,我们就抽取一条数据过来。...优缺点的对比也很明显: Sqoop 相对比较通用一些,不管是 Mysql 还是 PostgreSql都可以用,而且很成熟。但是实时性较差,每次相当于是启动一个 MR 的任务。

    3.4K40
    领券