微信公众号:人工智能拾贝,关注了解更多的关于人工智能领域下机器学习相关技术文章。
原来机器可以学习
想我也是从大三的时候开始接触了“机器学习”这种神奇的东西,发现电脑程序竟然可以给电影评论做分类,输入一条评论,电脑蹦出来:“砰,差评”。唉哟,神奇耶,那时候,知道个叫做KNN(K近邻算法)和Naive Bayes(朴素贝叶斯)的算法都觉得天哪我好牛,然后花了一个学期用了Java和Matlab混合着写了电影评论的分类算法,沉浸其中,妙不可言。自那之后,果不其然地,我又继续在这个路上前行,慢慢才发现,“路漫漫其修远兮”,以前以为到达的山尖尖,不过是另一个高峰视角下的小矬子,而且,机器学习领域,永远找不到最高峰。
没办法,只好“上下而求索”了,但是!我发现,求上不足,求下有余,手动允悲。
什么是求上不足呢?就是最开始的时候,根本看不懂满纸的数学公式;那什么是求下有余呢,就是我发现直接调用第三方的工具包,比如Matlab下的机器学习包或者Python下的Sklearn,真的很方便!吼吼,真香~
但是,作为一个从小打破沙锅问到底的孩纸,我不想吃Matlab和Python大牛做的饭,我想重复造轮子!
“教练,我想学机器学习!”“你什么都想学!”
前辈是这么说的,机器学习,无非就是给“函数拟合”换了个好听的名字,那么,什么叫函数拟合呢?为什么刚才还说“机器学习”,马上就开始“函数拟合”这种很数学的话了,可怕!
莫怕!所谓函数拟合,其实就是:
你竟然能用雨伞去描述……天上的那几颗星星。
电影《美丽心灵》,笔者最喜欢的电影,没有之一
所以呐,机器学习还是离不开数学的,但是我们不应该畏惧数学,毕竟它只是我们认识世界的一种工具而已。怕数学,好多时候应该是因为不知道它做什么用吧,本系列里面,笔者将一切从简入繁,尽可能通俗介绍算法原理,并给出尽可能容易理解的生动的数学描述,不仅如此,笔者还告诉你如何写这个描述的代码,太到位了有没有~
综上,所谓“机器学习”,就是让计算机去学习这拟合曲线,但也不单单是这个曲线,它会去学习数据中存在的模式,并试图用这个模式去预测将来可能会发生的事情。那为了学到数据中的模式,我们需要掌握什么知识呢?这里,不得不把数学家们再请出来,感谢他们创造了一门学科,叫做“统计学”,而现在大家用的基本的机器学习算法,大多都是基于统计学的方法来描述的,而且基于统计学的算法大多都有个特点,数据越多,学习到的模式就越好,所以,机器学习,实际上还是一门数据驱动科学,有数据,有算法,就可以有学习。
最爱“小蓝本”—《统计学习方法》
机器学习有很多入门教材,但是对于笔者而言,感觉“小蓝书”——《统计学习方法》,是最中规中矩的一本好书:原理透彻,思路连贯。但是《统计学习方法》这本书也有其局限性,作为教材用书,乍一开始读,肯定觉得难啃,而且好多东西如果只是单纯地看公式的话,是很难理解其本质的,动手才是王道!
所以呢,笔者将会在每一个算法讲解中,使用代码编写书中出现的概念和定义,而且,假如你熟悉Python的话,我建议你使用Anaconda的Jupyter去本人的Github(链接地址在文章底部)下载代码,都是.ipynb格式的,每个文件中包含了代码和讲解,都是可以直接运行的,是不是很爽?哈哈哈,有没有很开森~
本系列的教程和代码实现按照如下列表安排,基本按照《统计学习方法》目录走,将来也可能会在其中穿插一些有趣的技术科普文,所以咯,快关注“人工智能拾贝”公众号,不要错过每一次学习的机会。
联系作者:
值此中秋节发布本系列第一篇文章,祝各位机器学习爱好者中秋团圆,学习愉快,画个圆圈祝大家月饼节快乐~
领取专属 10元无门槛券
私享最新 技术干货