最近因为工作需要正在学习《模式识别》(清华大学.张学工.第三版),大概翻了全书,发现,与人工智能所提到的很多知识背景实则师出同门,本文将对这本书及其与人工智能的关系进行简单介绍。
《模式识别》这本书的构思为总分总思路,先通过前面的章节介绍各类模式识别(人工智能)方法,后续通过两章总结介绍,如何使用模式识别方法(确定特征、提出特征)、如何评价模式识别方法应用的好坏(错误率估计、有效率估计)。与现在主流的机器学习,人工智能书籍不同的是,本书主要内容在阐述基于统计数据的学习方法,即统计机器学习,本书主要内容如下:
第一章,概论部分,通过大背景大概念介绍基于数据的模式识别;
第二章,统计决策方法(主要即贝叶斯决策方法),介绍最小错误率贝叶斯决策、最小风险贝叶斯决策以及ROC等模式识别相关的重要概念;
第三章,概率估计方法,介绍概率估计方法与贝叶斯估计方法的异同,以及非参数估计方法;
第四章,线性分类器,介绍了线性分类器的基本概念,常见的线性分类器如Fisher分类器、感知器、SVM、以及多分类线性分类器;
第五章,非线性分类器,基于第四章的基础介绍了NN、SVM、核函数等业界常见的非线性分类方法;
第六章补充介绍了近邻法、DT、随机森林、逻辑回归、boosting方法。
第七和第八章则从方法应用的角度介绍了分类特征的选择以及分类特征提取的方法,对方法的应用进行了补充说明。
从第二道第八章,主要集中在监督识别(即监督学习)的方法层面
第九章重点阐述了部分非监督识别(无监督学习)的方法,如多种聚类方法、自组织映射神经网路等。
最后第十章给出了模式识别方法应用性能的判定,帮助学习者确定自己搭建的模型和方法是否合适合理。
回过头来,人工智能毋庸置疑是目前最火的技术,没有之一,各行各业已经的热度已经从互联网+,云计算,大数据等前沿概念成功切换到人工智能之上了。虽然人工智能很火,但是人工智能从本质上并不能算一个全新的东西,早在上世纪五十年代,图灵发表图灵机开始,其实就代表人工智能的原型。人工智能经过几十年的发展,经历波折起伏,最终达到今天的热度,也是历史发展的必然规律。
人工智能也许对很多人是一个全新的概念,但对于理工科学子来讲,其实并不陌生,不知道大家是否还记得本科、研究生阶段所接触到的很多课程,例如《统计理论》《线性代数》《系统辨识》《模式识别》《神经网络》等等,这些课程中都包含了人工智能的基础知识。而经过前文介绍,可以看到模式识别其实质是基于统计方法的人工智能分支,属于被包含关系。各位新接触到的看官因此也不用因为专业名词而为难。
总体来讲,本书内容丰富,覆盖面广,这也意味着本书没有过多的篇幅对每一类识别方法进行深入探讨,多数情况,本书注重将每类方法的原理及框架进行仔细推导,提纲挈领的搭建了模式识别领域的知识框架。本书与《统计学习方法》(李航,北京航空航天大学)有些异曲同工,对这方面感兴趣的同学可以一并阅读。
关注微信:机器学习集结号,
回复:模式识别,获取《模式识别》电子书。
回复:统计学习方法,获取《统计学习方法》电子书。
领取专属 10元无门槛券
私享最新 技术干货