【新智元导读】今天我们要介绍的主人公叫 David Venturi。一年前他还没有编程背景,凭着对数学的爱好开始上网自学。后来他被加拿大一所大学的计算机科学专业录取,但仅过了两个礼拜就退学了,因为他发现想学的东西都能在网上找到。于是,Venturi 综合 edX、Coursera、Udacity 等网站,自己设计课程组合,在家完成了数据科学家“硕士学位”。下面就让新智元来带你看看他的私人课表——他能做到,你同样也可以!
温馨提示:这些课程可不是看看视频就能应付了事的,它们都是带有一定的互动性,而且有的课程的总长度都在100个小时以上。有些课程是有开课日期的,有些是能根据自己的进度来安排的,最好提前作了解,以免错过开学的日期。祝学习愉快!
预科模块
如果你在大学没有接触过计算机科学专业,那么下面就是美国大一大二学生的专业课内容,分别是编程入门、计算机科学入门、数学。
【Udacity】Intro to Programming
地址:https://www.udacity.com/course/intro-to-programming-nanodegree--nd000
课程总设计长度4个月,评分4.5颗星。(编者按:有的人可以在2.5个月完成。每个人进度不同。)这门课程会教学生怎样使用 HTML 和 CSS 去编写自己的网站;Python基础语言;后端编程,数据库;一点点 JavaScript,APIs,recursion 和 parallel computing。Udacity 把它的课程分割成很多迷你短课,很多视频还不到5分钟,课后还会有一些习题。大作业,也就是projects,会得到老师的评分。
【Harvard/edX】CS50: Introduction to Computer Science
地址:https://www.edx.org/course/introduction-computer-science-harvardx-cs50x
总设计长度为一个学期,评分4.5颗星。你将会学到算法、抽象、数据结构等知识,会接触C,Python,SQL,JavaScript,CSS 等语言。这门课是完全免费的,但是可以花90美元得到一个结业证书。
【MIT】Mathematics for Computer Science
地址:http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-042j-mathematics-for-computer-science-fall-2010/
总长度为25堂课,无评分。这门课包含了逻辑,证明方法、数集、排列组合、离散概率等一系列数理基本知识。
数据核心模块
以下的课程全部来自 Udacity 的 Data Analyst Nanodegree系列。全部课程+作业总时长是378小时。之所以强烈推荐这一系列是因为,第一,它好评如潮;第二,这些课程有一些是由 Facebook、Google 等公司设计的。这个系列,不论是宽度、深度、连贯度,都能给学生带来很好的教育体验。
【Udacity】Intro to Inferential Statistics
地址:https://www.udacity.com/course/intro-to-inferential-statistics--ud201
【Udacity】Intro to Descriptive Statistics
地址:https://www.udacity.com/course/intro-to-descriptive-statistics--ud827
【Udacity】Intro to Data Analysis (Using NumPy and Pandas)
地址:https://www.udacity.com/course/intro-to-data-analysis--ud170
【Udacity】Data Wrangling
地址:https://www.udacity.com/course/data-wrangling-with-mongodb--ud032
【Udacity】SQL for Data Analysis
地址:https://www.udacity.com/course/sql-for-data-analysis--ud198
【Udacity】MongoDB for Data Analysis
地址:https://www.udacity.com/course/data-wrangling-with-mongodb--ud032
【Udacity】Data Analysis with R
地址:https://www.udacity.com/course/data-analysis-with-r--ud651
【Udacity】Intro to Machine Learning
地址:https://www.udacity.com/course/intro-to-machine-learning--ud120
【Udacity】Data Visualization and D3.js
地址:https://www.udacity.com/course/data-visualization-and-d3js--ud507
【Udacity】A/B Testing
地址:https://www.udacity.com/course/ab-testing--ud257
机器学习模块
【Standford/Coursera】Machine Learning
地址:https://www.class-central.com/mooc/835/coursera-machine-learning
这门课曾被评为最佳50免费在线课程,评价为5星,所以绝对不会让学生失望。课程的内容包括:有监督学习,参数算法,神经网络;无监督学习;还有一些案例学习和现在业内的常用方法。
【Kadenze】Creative Applications of Deep Learning with TensorFlow
地址:https://www.class-central.com/mooc/6679/kadenze-creative-applications-of-deep-learning-with-tensorflow
TensorFlow 是 Google的一个开源框架,也是现在在人工智能领域被应用最广的。学完这门课,你将对现在最前沿的算法有所了解,比如什么是 convolutional networks,什么是generative adverarial networks,什么是 recurrent neural networks,如果你还不知道这些最热的名词是什么意思,就赶紧学吧。
【University of California, Berkeley/edX】Distributed Machine Learning with Apache Spark
地址:https://www.class-central.com/mooc/2965/edx-cs190-1x-scalable-machine-learning
这节课包含了机器学习背后的一些统计和算法模型,也会教你去解决一些交叉学科的问题,比如网络广告和认知神经学。
软件工程模块
数据科学的很大一部分工作其实都是不停地编程,编程能力强的人肯定就会快速测试很多设计方案。
【Udacity】Software Testing
地址:https://www.udacity.com/course/software-testing--cs258
【Udacity】Software Debugging
地址:https://www.udacity.com/course/software-debugging--cs259
【Coursera】Mastering Software Development in R Specialization
地址:https://www.coursera.org/specializations/r
R和Python都是数据科学最重要的编程语言。这一围绕R编程的系列课程由约翰霍普金斯大学提供,共分为4门课程:R编程环境,进阶R编程,建立R packages,数据可视化。
后端开发模块
这一模块包含了很多的内容,网站后端、APP后端、一些Linux的基本内容、还包括了数据库的基本操作,如何你从没接触过这些内容,这个模块能帮你逐渐熟悉起来。
【Udacity】 Intro to Backend
地址:https://www.udacity.com/courses/intro-to-backend--ud171
【Udacity】 Developing Scalable Apps in Python
地址:https://www.udacity.com/courses/developing-scalable-apps-in-python--ud858
【Udacity】 Configuring Linux Web Servers
地址:https://www.udacity.com/courses/configuring-linux-web-servers--ud299
【Udacity】 Linux Command Line Basics
地址:https://www.udacity.com/courses/linux-command-line-basics--ud595
【Standford U】 Introduction to Databases
地址:https://www.class-central.com/mooc/1580/stanford-openedx-db-introduction-to-databases
其他资源
学完上面这些,其实你已经可以硕士毕业了,但是再多学一些也无妨……
【Udacity】Intro to Hadoop and MapReduce
地址:https://www.udacity.com/course/intro-to-hadoop-and-mapreduce--ud617
【Coursera】Using Python to Access Web Data
地址:https://www.class-central.com/mooc/4343/coursera-using-python-to-access-web-data
【Coursera】 Building a Data Science Team
地址:https://www.coursera.org/learn/build-data-science-team
【Udacity】 How to Use Git & GitHub: Version Control for Code
地址:https://www.udacity.com/course/how-to-use-git-and-github--ud775
你是不是已经还是点开其中的某些链接开始摩拳擦掌要学习了呢?这些课程很多都是免费的,而且可以自己控制节奏,再不学习,就真的老了!
编译来源:http://davidventuri.com/data-science-masters