从人工智能的目的来看,我们认为什么样的算法是一个好的人工智能算法?对于一个具体问题,是用高度定制的算法解决符合人工智能思想,还是用高针对性数据加通用算法符合人工智能思想?任何一个从业者都应该清晰的知道是数据驱动的算法才是真正的人工智能算法吧!那么我要多问一句,为什么?为什么我们应避免用定制算法来提升性能?(诚然,这其实是多数要发论文的朋友最常干的事情,通过针对某一问题精调算法和参数来得到一流的实验结果)因为,任何形式的定制算法,本质上说,都是在增加算法的先验假设,而这一过程其实就是我们使用传统算法时所做的,用设计者的猜想来建立系统模型解决问题的经典流程,区别只不过是我们建立模型时使用了一些更新的算法罢了。这样做的问题非常典型,就是算法〔人为的〕过拟合,虽然在数据集上测试效果好,但实用性会大度降低 -- 懂过拟合的朋友一定明白我在说什么,不理解的朋友看结论就好了。但显然,在这样一个弱人工智能的时代,我们不可能全靠数据解决问题,必须还是要考虑算法的设计,而我的建议是,如果你的研究方向不是算法本身而是在某一背景下的应用,那理想的工程实践还应该是〔数据驱动优先,参数为辅配合,避免订制算法〕。
领取专属 10元无门槛券
私享最新 技术干货