机器学习现在很火。火到什么程度呢,火到嚷嚷着“人工智能”要来了的文章几乎遍地都是。
要评论一个东西,得先学习它。我也花了不少时间了解学习了一下。
机器学习基本的假设是,给足够多的训练数据,机器(程序)可以“学习”出来一个相当不错的结果。比如人脸识别,现在已经广泛应用了。
这个人脸识别的训练过程,大致就是你给程序输入很多组照片,每组两张,再告诉程序这两张是来自同一个人还是不同的人,如此重复很多次之后,机器就能自己学会辨别两张照片是否是同一个人。
听起来挺神奇的,是吧。然后,我就又要胡思乱想了。
据说有不少人是患有“脸盲症”的。这些脸盲症患者不能有效率地区分人脸的同不同。可是说起来,这些脸盲者,有着更加复杂的神经网络,训练的数据按说也不少,从小到大,看过的“训练数据”也不少啊。
要是在承认基于神经网络的学习方法是有效的这个基础上排查的话,那么
脸盲症患者的神经网络拓扑结构有问题。
脸盲症患者的训练样本数据还是太小。换句话说,认识的人太少。
数据标注其实错误不少。
要是第一点的话,那悲剧了,先天因素。而且你还别说,似乎真的有研究表明,是因为“部分脑子可能有问题”。
要是第二点的话,似乎也悲剧了,它残酷地表明了你不想承认的事实。
要是第三点的话,你最好祈祷别人没有发现,原来你一直都是把张三当成李四,王五当成赵六的。
作为轻度脸盲症患者,这样看来,要午饭吃不香了。
不过给人绝望的同时,一定是要给人希望的。
脸盲症患者比较适合练习佛祖的“白骨观大法”。不管是俊男美女,风流才俊,还是精英权贵,反正都分不清楚,看成白骨练习起来就容易多了。
另外“部分脑子可能有问题”,并没有说“脑子全部有问题”,也没否认“其他部分脑子因此得到加强”的可能性。所以啊,也许咱在别的方面是天才呢。
咱们再回头看看人脸识别的机器学习,根据其实现原理,你的脸最终被编码成了可能一组比特位信息。就算是4096比特位吧,这不少了,因为理论上有2的4096次方个不同的值呢。而目前全地球的人口总数也就在2的33次方左右。所以呢,不管是怎样的脸,其信息含量,作为文件存在磁盘上的话,也就512个字节,作为一个文件的话,你大概都不屑于打开看一眼的。
是,非,非是,非非,非是非
领取专属 10元无门槛券
私享最新 技术干货