1.3机器学习的主要任务
机器学习任务粗略分成四类:
必须知道预测什么的,即需要知道目标变量的,是监督学习,监督学习主要解决两类问题:
(1)分类,比如上面对鸟儿的分类;
(2)预测,多用回归模型;
不必知道预测什么的,即不需要知道目标变量,是无监督学习,无监督学习主要解决两类问题:
(3)聚类,将数据集合分成由类似对象组成的多个类的过程;
(4)密度估计,寻找描述数据统计值的过程。
1.4如何选择合适的算法
选择什么算法的标准有两点:
(1)本次机器学习的任务是什么?
(2)需要分析和搜集的数据是什么?
先考虑机器学习的目的:
(1)如果是预测目标变量的值,选择监督学习算法。
目标变量是离散型,选择分类器算法;目标变量是连续型数值,选择回归算法。
(2)如果不用预测目标变量的值,选择无监督学习算法。
如果仅需要将数据划分为离散的组,使用聚类算法;如果还需要估计数据和每个分组的相似程度,使用密度估计算法。
领取专属 10元无门槛券
私享最新 技术干货