新智元报道
来源:Reddit
编辑:大明
MIT出版社出版的《机器学习基础》(第二版)PDF和HTML资源均已免费开放下载。距离第一版出版已有6年之久。
本书内容是对机器学习的一般性介绍,可以作为研究人员的参考书和学生的教科书。本书涵盖了机器学习中的基本主题,同时提供了算法讨论和论证所需的理论基础和概念工具。并描述了这些算法应用的几个关键方面。
本书的目标是提供最新的理论工具和概念,同时对相对先进的结果给出精确的证明。一般来说,只要在有可能的情况下,我们都会优先选择简洁性。同时,本书同样讨论了机器学习中呈现的一些重要、复杂的主题,并重点关注几个开放的研究问题。其中某些问题经常与其他主题合在一起探讨,可能没有得到足够的重视。
本书作者之一、纽约大学计算机科学与数学系教授Mehryar Mohri
本书将对这类问题进行单独讨论,并进一步强调其重要性:比如针对多类分类,排名和回归对几个章节进行了重写。
虽然机器学习领域涵盖了各种各样的重要主题,但为了简洁起见,同时也是由于目前某些方法缺乏足够坚实的理论保证,本书略去了一些重要主题,其中包括图形模型和神经网络。
本书主要面向机器学习、统计学和其他相关领域的学生和研究人员,也可以作为机器学习专业的研究生和高年级本科课程的教科书,也可以供学术会议参考。本书的前三至四章为后续内容奠定了理论基础,而其他章节大多自成一体。(第6章和第13章除外,第6章介绍了后来广泛使用的一些概念,第13章与第12章密切相关。)每章最后都给出一系列练习题,并提供完整的解决方案。
本书假设读者熟悉线性代数,概率论和算法分析的基本概念。为了进一步为读者提供帮助,书中提供一个内容广泛的附录,简要介绍了线性代数、凸优化、概率评估,以及对本书中算法讨论有帮助的集合不等式的介绍和信息理论简介。
本书力图对机器学习的多个主题和领域实现统一风格的呈现,这一点不同于其他同类书籍采用的更专业的特定视角呈现。比如贝叶斯视图或内核方法等。本书的另外一个不同于同类书籍的特色,是突出了理论基础及分析过程。
第二版新变化:叙述更简明、章节内容增删、习题更丰富
与2012年的第一版相比,第二版对整本书的内容进行了更新。主要内容变化包括在多数章节中采用了与第一版不同的写作风格,使用了新的插图,许多地方的内容表述更加简明。
第二版还对已有章节的做出了一些补充,尤其是第6章和第17章。并新增了几个新章节。本书新加入第4章(模型选择),这是目前机器学习领域内重要主题,但在第一版中只进行了简要讨论。
此外,第二版还增加了关于最大熵模型(第12章)和条件最大熵模型的新章节(第13章),这些内容都是机器学习中的重要主题。
第二版还对附录进行了大幅度修订。尤其是在附录B中加入了关于Fenchel对偶性的完整章节,并对附录D进行了一些修订和补充,在附录E中加入了信息理论,并对大部分材料进行了更新。此外,第二版还为现有章节和新章节增补了新的练习题和答案。
参考链接:
https://cs.nyu.edu/~mohri/mlbook/
PDF下载:
https://www.dropbox.com/s/7voitv0vt24c88s/10290.pdf?dl=1