介绍监督学习。 其基本思想是,监督学习中,对于数据集中的每个数据, 都有相应的正确答案,(训练集) 算法就是基于这些来做出预测。
受监督的学习问题分为“回归”和“分类”问题。
示例2:
(a)回归 - 鉴于一个人的照片,我们必须根据给定的图片来预测他们的年龄
(b)分类 - 鉴于肿瘤患者,我们必须预测肿瘤是恶性还是良性(非黑即白//0|1)。
无监督学习使我们能够很少或不知道我们的结果应该如何处理问题。 我们可以从数据导出结构,我们不一定知道变量的影响。
在上一节中 我们已经讲过了监督学习 回想起上次的数据集 每个样本 都已经被标明为 正样本或者负样本 即良性或恶性肿瘤 。因此 对于监督学习中的每一个样本 我们已经被清楚地告知了 什么是所谓的正确答案 即它们是良性还是恶性 。 在无监督学习中 我们用的数据会和监督学习里的看起来有些不一样在无监督学习中没有“属性或标签这一概念” 也就是说所有的数据 都是一样的 没有区别
我们可以通过基于数据中的变量之间的关系对数据进行聚类来导出该结构。
无监督学习算法 ,针对数据集,自动的找出数据中的结构,会把这些数据分成两个不同的簇,所以叫做聚类算法
无监督学习或聚类算法在其他领域也有着大量的应用 ,例如谷歌新闻每天手机非常多的新闻内容,然后把同一主题的放在一起
例: 聚类:收集100万个不同的基因,并找到一种自动将这些基因组合成不同变量(如寿命,位置,作用等)相似或相关的组。
其实聚类只是无监督学习的一种,还有一种非聚类算法
非聚类:“鸡尾酒会算法”,让您在混乱的环境中找到结构。 (即从鸡尾酒会的声音网格中识别个人的声音和音乐)。
课程代码:https://github.com/HuangCongQing/MachineLearning_Ng 本文参考自-黄海广博士 斯坦福大学 2014机器学习教程中文 笔记 链接:http://pan.baidu.com/s/1dF2asvf 密码:1ewf
分享吴恩达机器学习视频 下载 链接: