又到年底了,又到了大量的年终数据汇集的时刻,什么全年消费数据,全年娱乐数据等等。不得不承认,如今随着电子科学技术的不断完善,大量的数据充斥着我们的生活。而现在如何合理地运用这些数据来帮助我们提高生活质量也逐渐变成一门了技术——数据科学专业,而从事这些工作的人们,我们称之为数据科学家。
《哈佛商业评论》曾评价数据科学家是二十一世纪最“性感”的职业。性感?这个词是不是让很多人不理解了呢?数据科学为什么“性感”呢?它性感在哪呢?
数据科学简介
数据科学专业是当今最受学生欢迎的热门专业, 尤其是在美国。在互联网科技高速发展的今天,大数据时代已经正式来临,分析大数据可以帮助企业更好的进行产品制定与推广规划,从而最大程度帮助企业盈利,所以各大公司对于数据科学专业人才可谓是求贤若渴。而说到这一行业的领军国家,美国自然成了很多同学的求学之地。
数据科学顾名思义,是指和数据相关的科学研究。具体点说的话,数据科学是指通过挖掘数据,处理数据,分析数据从而得到有用信息的技术和研究。随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,这就需要通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据科学的作用就体现于此。
数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
与商业分析的区别
这里很多同学会问,之前谈到的BA(Business Analytics)商业分析不就已经是利用数据分析来进行商业决策的科学了吗?它们二者不一样吗?又有什么区别呢?
讯哥这里要说,其实二者性质上其实相差不大,数据科学是商业分析的整合,所以数据科学家做的部分不仅仅只有商业分析。如果说区别的话,你可以认为数据科学家是商业分析的plus版本。
专业课程
数据科学的学习主要分为下面三个模块:数据模型、数据处理、数据可视化。很容易看出来,这些相关的知识和CS,统计学,数学都有密切联系。因为数据科学属于交叉类学科,所以学习数据科学就要学习很多其他方向的课程。
数学统计课程
数学和统计是必要的基础,课程包括概率理论、算法、统计干涉和模型、科学计算、随机过程、计算建模等。
计算机类课程
主要是学习如何用数据建立计算机模型,包括计算机系统、机器学习、数据分析和可视化。
其他方向课程
因为数据科学可用于各个行业,因此方向类课程也是每个学校的特色,例如哥伦比亚大学的MSDS有开金融量化大数据分析、可持续发展智慧城市大数据分析、生物信息大数据;斯坦福大学开设数据驱动医疗课程,视觉识别神经网络、地理统计信息等。
当然,如果说要想申请DS方向的美国研究生,先修课是每个申请者必须要经历的,一般美国学校要求的DS方向先修课包括:数学中的微积分,线性代数,概率论,统计学,数学建模等;计算机背景知识(计算机导论, SQL, Database, Programming);除此以外,美国学校还希望申请者可以具备一定解决问题和与人沟通的能力。
未来方向
全球最顶尖管理咨询公司麦肯锡(McKinsey)就出具过一份详细的分析报告。报告中预测大数据或者数据工作者的岗位需求将会激增,其中大数据科学家的缺口在14万到19万之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将会达到15万。
对大数据处理需求最旺盛的行业包括:计算机软件、互联网、科研、IT技术服务、生物技术、制药业等。事实上,大数据工作者可以施展拳脚的领域还不仅如此,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。
同样,数据分析或数据处理的岗位报酬也非常丰厚。在硅谷,入门级的数据科学家的收入已经是6位数了(单位是美元)。
数据科学的三类职业方向:机器学习、数据分析和数据科学家
1. 机器学习工程师 Machine Learning Engineer
机器学习工程师代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
2. 数据分析员 Data Analyst
工作内容俗称analytics,从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL语言、用R/Python做简单的分析、用Tableau/Excel作图比较常见。
3. 数据科学家 Data Scientist
此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection等这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深层次的知识。
学校推荐
纽约大学
纽约大学(New York University)简称“NYU”,是一所位于纽约的世界著名私立综合性研究型大学。纽约大学由18个学院和研究所组成,已经成为全美国境内规模最大的私立非营利高等教育机构之一,同时也是美国唯一一座位于纽约心脏地带的私立名校。
数据科学硕士MS in Data Science属于数据科学中心Center for Data Science,学制为2年。申请人数最多,竞争激烈。学校培养方向主要有深度学习、自然语言处理和数据库。
罗切斯特大学
罗切斯特大学(University of Rochester,U of R)是一所美国著名的私立研究型大学,“新常春藤”联盟之一,北美大学协会(AAU)成员、世界大学联盟成员。
罗切斯特大学商业和科学硕士-发现信息学和数据科学 MBS-Discovery Informatics and Data Sciences学制为1.5-2年,综合了数据管理、统计、机器学习与计算等诸多领域的内容,培养学生成为各行各业的预测建模专家、数据挖掘工程师、分析师等。核心课程包括8门分析类课程和6门商学院课程,大致如下两类:统计学、分析学与数据挖掘、数据库系统与编程等。
罗切斯特大学要求申请者本科毕业,拥有科学、工程学、数学或商学等专业背景,但没有统计学或数据分析等先修课程要求。
哥伦比亚大学
哥伦比亚大学有一个世界顶尖的大数据科学与工程研究室(Institute for Data Sciences and Engineering),学生在此参与实验与科研项目。下设的数据科学硕士(MS in Data Science)学制两年。
哥大的申请条件是申请人需要有理工科的背景,托福最低要求99,雅思最低6.5。GRE要求310,其中数学要求159+。
康奈尔大学
康奈尔大学的运筹学与信息工程学院下设运筹与信息工程硕士(M.Eng. in Operations Research and Information Engineering),学制1-1.5年。要求要完成一个课程设计。该项目需要申请者在本科阶段修过案例分析,运筹学或统计学等课程。康奈尔大学数据科学专业对申请者托福成绩有单项的要求,写作20,听力15,阅读20,口语22,在托福总分上要求100。
领取专属 10元无门槛券
私享最新 技术干货