一、数据挖掘边界
数据挖掘的定义和边界不够明确,一般通过与其他概念对比进行理解。
目前流行的是AI、机器学习、深度学习,它们之间的包含关系参考下图。可以看到深度学习是机器学习的一个方向,机器学习又是AI的一个方向。
图1 AI、ML、DL
数据挖掘更多是从实际的数据出发,利用机器学习中频繁模式、分类和聚类的技术来分析、挖掘、预测一些对实际有用的结果。数据挖掘与其他领域的边界关系参考下图。
图2 Border of DM
下图进一步展示了这些领域之间的相互作用。事实上,界限仍然不明显。然而界定这些名词或者领域的边界不是最重要的,从一个比较高的维度来看,这些领域综合起来都是利用数据实现人工智能的目的。
图3 Relation between DM and AI、ML etc.
人工智能的研究领域至少可以按照如下分类:一种是类人的,用来实现人类的功能,如行动、图像识别、自然语言处理、语音处理等;一种是超人的,用来扩展人类的功能,如记忆、搜索、翻译、自动驾驶、决策等;一种是非人的,用来补充人类的功能。
二、数据挖掘思维导图
学术上的数据挖掘研究方向比较传统,主要是处理数据,挖掘数据,评估模型。随着互联网和大数据的发展,数据挖掘的应用领域却越来越广。我们大可不必拘泥于数据挖掘、数据分析、机器学习的边界和区别,或许这些边界和区别都是人为设置的。毕竟不管哪种技术,能解决实际问题的都是好技术。
图4 数据挖掘思维导图
领取专属 10元无门槛券
私享最新 技术干货