本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。
类别 名称 (可重点关注加粗部分) 官网 备注 查询引擎 Phoenix https://phoenix.apache.org/ Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写 Presto http://prestodb.io/ Facebook开源的分布式SQL查询引擎,适用
今天为大家推荐一些翻译整理的大数据相关的学习资源,希望能给大家带来价值。
我们根据每一个数据库引擎的使用情况以及受欢迎的程度,对240个数据库引擎作了综合排名,但是以下排名也仅供参考,同时也希望本文可以拓展你的视野,这世界上的数据库并不是只有Oracle、MSSQ、MySQ
类别名称官网备注(可重点关注加粗部分)查询引擎Phoenixhttps://phoenix.apache.org/Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写Prestohttp://prestodb.io/Facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节Sharkhttp://shark.cs.berkeley.edu/Spark上的SQL执行引擎,已演化成Spark-SQL和Hive on SparkPigh
关系数据库管理系统(RDBMS) SQLServer:世界最有活力的数据库; MySQL:世界最流行的开源数据库; PostgreSQL:世界最先进的开源数据库; Oracle 数据库:对象-关系型数据库管理系统。 框架 Apache Hadoop:分布式处理架构,结合了 MapReduce(并行处理)、YARN(作业调度)和HDFS(分布式文件系统); Tigon:高吞吐量实时流处理框架。 分布式编程 AddThis Hydra :最初在AddThis上开发的分布式数据处理和存储系统;
本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。
领取专属 10元无门槛券
手把手带您无忧上云