现在关于Python机器学习的书籍很多,选择貌似变得越来越困难。
当你准备买书自学时,挑一本适合自己的书是非常有必要的。那么如何挑选一本好书呢?(个人意见,仅供参考)
前提条件
关注序言或简介和自己的需求:
序言与简介主要描述了目标读者,看看适不适合那个阶段的自己。
(大多数机器学习书籍需要对数据科学和Python有基本的了解。)
Python技巧:
有些书使用简单的代码片段来证明一个概念,
而另一些书则使用了高级Python功能,例如列表理解,切片,带语句,参数解包等等。
Python库:
Python机器学习书籍通常使用ScikitLearn(有时还包括SciPy)来实现算法。
深度学习书籍涵盖TensorFlow,Keras和PyTorch。
但是这些书还利用了Numpy,Pandas和Matplotlib等科学图书馆来加载和处理数据。
Python工具:
大多数Python机器学习开发人员更喜欢Jupyter Notebook,
这是一个基于Web的界面,可以进行编码和测试算法,并将结果保存为HTML格式。
如果一本书是关于如何使用Jupyter的话,书中要提到能否完成安装和设置。
数学技能:机器学习在本质上涉及大量线性代数,微积分和统计量。
通过概念性描述和绘图来描述机器学习算法的机制,这类书应该明确告诉你学习本书需要多少数学知识。
目录(在序言部分没有明确提及)
购买书之前先查看目录的内容:
基础知识:
每本有关机器学习的书都是从基础知识开始的。
高级书籍会将基础知识在一个章节中进行总结。
初学者通常需要花几章来讨论机器学习的基础知识,数学,数据预处理和数据类型以及机器学习管道的书籍。
算法:
初学者通常根据算法的类别(回归,分类,聚类)和高级概念(监督学习与无监督学习,整体学习,超参数调整,降维)来讨论算法。
高级书籍通常会针对特定类型的算法(支持向量机,决策树,主成分分析,不同的聚类方法等)提供更详尽的章节。
Python库:
高级和中级书籍不讨论NumPy和Matplotlib等Python库。
初学者的书籍中的各节介绍了如何使用NumPy和Matplotlib等Python库来加载,处理和可视化数据。
领取专属 10元无门槛券
私享最新 技术干货