Hive(数据仓库)
实际上, Hive的本质相当于在 Mysql中对 HDFS中已经存储的文件进行映射,以方便使用HQL去管理查询。
用于数据分析、清洗
高延迟的 Hive适用于脱机数据分析和清洗
基于HDFS、MapReduce
Hive存储的数据仍然保存在 DataNode中,编写的 HQL语句最终将被转换成 MapReduce代码来执行。(不要在不需要 MapReduce代码的情况下钻牛角尖如:select * from tableName)
HBase(数据库)
它是一个非关系型、面向列存储的数据库。
用于存储结构化和非结构化的数据
适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作。
基于HDFS
数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进行管理。
延迟较低,接入在线业务使用
面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度。
总结:Hive与HBase
“Hive”和“Hbase”是基于 Hadoop的两种不同技术, Hive是类 SQL引擎,运行 MapReduce任务, Hbase是 NoSQL的 Key/vale数据库,位于 Hadoop之上。两者都是可同时使用的工具。正如使用 Google进行搜索、使用 FaceBook进行社交一样, Hive可用于统计查询、 HBase可用于实时查询、数据可从 Hive写入 HBase或从 HBase写入 Hive。
如果觉得对你有所帮助。记得收藏和关注呦!(每日更新各种大数据框架)
如需转载请注明出处(创作不易请见谅)
和巨婴程序猿一起成长。让自己变得更优秀
想了解更多精彩内容,快来关注跟着巨婴去逆袭
我最近一直在思考(大数据通俗讲解)的问题,你的看法是什么呢?关注我快说出来一起交流一下吧~
领取专属 10元无门槛券
私享最新 技术干货