一、大数据技术基础
1、linux操作基础
2、shell编程
3、内存数据库redis
4、布式协调服务zookeeper
5、java高级特性增强
6、轻量级RPC框架开发
二、离线计算系统 1、hadoop快速入门
2、HDFS增强
3、MAPREDUCE详解
4、MAPREDUCE增强
5、MAPREDUCE实战
6、federation介绍和hive使用
7、hive增强和flume介绍
三、流式计算 1、Storm从入门到精通
2、Storm上下游及架构集成
四、内存计算体系Spark 1、scala编程
2、AKKA与RPC
3、Spark快速入门
4、RDD详解
5、Spark-Sql应用
6、SparkStreaming应用实战
7、Spark核心源码解析
五、机器学习算法 1、python及numpy库
2、常用算法实现