首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大数据技术之_12_Sqoop学习_Sqoop 简介+Sqoop 原理+Sqoop 安装+Sqoop 的简单使用案例+Sqoop 一些常用命令及参数

    Sqoop 是一款开源的工具,主要用于在 Hadoop(Hive) 与传统的数据库 (mysql,postgresql,...) 间进行数据的高校传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导入到 Hadoop 的 HDFS 中,也可以将 HDFS 的数据导进到关系型数据库中。   Sqoop 项目开始于 2009 年,最早是作为 Hadoop 的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop 独立成为一个 Apache 顶级项目。   Sqoop2 的最新版本是 1.99.7。请注意,2 与 1 不兼容,且特征不完整,它并不打算用于生产部署。

    03

    小米doris

    apache doris在小米演进架构中的应用,原来的方式是来自各平台的数据,都要有一个数据汇总的平台,但是由于数据量巨大,如果还用传统的mysql来做数据筛选,mysql的查询语句会变得越来越复杂,而且每天产生的都是pb级别的数据量,这种级别的数据,不搭建hadoop大数据平台的话,根本没有这样海量数据的处理能力。但是要维护一个大数据处理平台,运维成本是相当高的。而且每进行一次数据的汇总运算的话,可能服务集群的所有资源都要让度出来供该次运算得出结果,对整体集群的上其他一些服务的影响也特别大,所以引入了apache doris平台。支持了本地数据的上传,支持insert into select from的查询语句,也支持routing keys直接订阅kafka的broker(这好像是rabbitmq中的概念呀),这些数据导入之后,就可以在apache doris进行汇总了。现在apache doris已经在天星数科、新零食、用户画像、BI广告投放等业务上广泛被使用,大大提高的服务的运算性能。服务的演进过程也是宽查询,就是建立相应的表

    01
    领券