最近好几个朋友都在问“大数据与数据科学课程体系”的东西,这里依自己的学习经验和相关的资料做个整理,供参考。
一、 大数据与数据科学专业
二、大数据与数据科学培养的主要人才
大数据与数据科学主要培养大数据应用分析师、大数据系统工程师、大数据算法研究员几大类,每个大类下又可以根据具体的岗位职责做一定的细分,大致可以分为如下这些:
1、大数据应用分析师:产品、行业应用、解决方案、数据分析、创新
2、大数据系统工程师:系统、架构、开发、维护、管理
3、大数据算法研究员:算法实现/调优、新理论、新结构/新算法、方向/趋势
三、大数据与数据科学的整体课程体系
数学/统计理论:微积分、线性代数、概率论、数理统计、统计学习
计算科学:计算机系统、编程语言、数据结构、信息系统架构(CS/BS等)
数据系统:分布式理论、Hadoop/Spark生态、数据库/数据仓库
模型分析:机器学习理论、优化建模、模式识别、知识表示/推理、可视化分析
行业应用:商务智能、智能金融、供应链分析、城市规划等
数据伦理:大数据管理与创新、大数据治理与政策
四、大数据与数据科学的主要课程内容
五、 大数据与数据科学的课程选课标准
针对不同的人才培养方向,给学生提供不同的选课标准和方法,大致建议可以按照如下的几个方向选课:
六、 培养方向与课程体系设置讨论
1、大数据:大数据的课程偏向系统工程师以及算法研究员,偏计算机的知识更多,如果结合非结构化数据的处理技术(自然语言、计算视觉、语音等),这块内容更有点偏向人工智能的课程,成果强调的是智能化的产品和设备;
2、数据科学:数据科学的课程更偏向统计、优化,更强调的是一种优化、实验、迭代、分析等建模的思维,同时结合行业应用的深度更强。所以单纯从数据科学这个角度来看,主要的核心主要包括:
数据科学导论(Introductionto Data Science)或数据科学原理(Principles of data science);
数据可视化(DataVisualization)或可视分析学(Visual analytics);
数据产品开发(DataProduct Development);
探索性数据分析(ExploratoryData Analysis,EDA);
大数据分析(BigData Analytics);
试验设计(ExperimentalDesign或Design of Experiment);
优化论(Optimization);
因果分析(Causality);
数据科学综合训练课程(DataScience Capstone)
七、附录
1、清华大数据研究院—数据科学课程体系
2、中国香港中文大学---数据科学课程体系
3、国外典型数据科学专业及其特色课程
领取专属 10元无门槛券
私享最新 技术干货