加州理工学院·从数据中学习(Caltech·Learning from Data):可通过edX观看,该课程由Yaser Abu-Mostafa授课。所有讲义和相关材料都可以在CalTech网站上找到。这门课程和斯坦福大学的课程一样,可以按照自己的节奏来完成作业和任务点。它涵盖了类似的主题,并进行了更加细致的学习,有更多有关数学的知识。该课程的作业对于初学者来说,可能具有一定的挑战性。
VideoLectures.Net上的机器学习分类(Machine Learning Category on VideoLectures.Net):这是一个在内容过载中淹没的容易的地方。找一些自己感兴趣的视频,看看是不是适合自己。如果发现选的课程太难了就换一个,找到自己喜欢的、适合自己的。
“为数据科学的运动而变形” - 杰里米·霍华德(“Getting In Shape For The Sport Of Data Science” – Talk by Jeremy Howard):与用户小组讨论如何在竞争激烈的机器学习中学习的更好。很少有人讨论解决问题的实际方法以及如何去做,所以这是很有效的学习方法。
机器学习(The Discipline of Machine Learning):由Tom Mitchell撰写,这是定义机器学习的白皮书。这是Mitchell用来说服CMU总裁创建一个独立的机器学习部门的一个论点(Tom Mitchell的简短的采访)。
关于机器学习的一些有用的知识(A Few Useful Things to Know about Machine Learning):这是一篇很好的论文,因为它从特定的算法中出发,并激起了一些重要的问题,如特征选择泛化(feature selection generalizability)和简单模型(model simplicity)。从一开始就从正确的角度思考,这是一件好事。
最值得推荐的是 编程集体智能(Programming Collective Intelligence),黑客机器学习(Machine Learning for Hackers)和 数据挖掘(Data Mining):分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请阅读这三本书中的任意一本!
机器学习初学者的书籍
编程集体智能:构建智能Web 2.0应用程序(Programming Collective Intelligence: Building Smart Web 2.0 Applications):本书是为程序员编写的。这本书不侧重于理论,重在代码示例和实际的网络问题、解决方案。买它、读它、做练习。
黑客机器学习(Machine Learning for Hackers):我推荐在阅读 编程集体智慧(上文)之后,再学习这本书。它也提供了实用的实例,但它更多关于数据分析,以及使用R。我真的很喜欢这本书!
机器学习:一个算法的角度(Machine Learning: An Algorithmic Perspective):这本书就像编程集体智慧的更高级版本。它有类似的内容(让机器学习开始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果对这本书有兴趣,我建议学习编程集体智慧(Programming Collective Intelligence)后阅读。
数据挖掘:实用机器学习工具和技术,第三版(Data Mining: Practical Machine Learning Tools and Techniques, Third Edition):我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这条路。