前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习(二):有监督学习、无监督学习和半监督学习

机器学习(二):有监督学习、无监督学习和半监督学习

作者头像
海天一树
发布于 2018-04-17 04:43:49
发布于 2018-04-17 04:43:49
1.8K0
举报
文章被收录于专栏:海天一树海天一树

一、基本概念

1 特征(feature)

数据的特征。

*举例:书的内容*

2 标签(label)

数据的标签。

*举例:书属于的类别,例如“计算机”“图形学”“英文书”“教材”等。*

3 学习(learning)

将很多数据丢给计算机分析,以此来训练该计算机,培养计算机给数据分类的能力。换句话说,学习指的就是找到特征与标签的映射(mapping)关系。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签。

*举例:把很多书交给一个学生,培养他给书本分类的能力。*

4 分类(classification)

定性输出称为分类,或者说是离散变量预测。

*举例:预测明天是阴、晴还是雨,就是一个分类任务。*

5 回归(regression)

定量输出称为回归,或者说是连续变量预测;

*举例:预测明天的气温是多少度,这是一个回归任务;*

6 聚类(clustering)

无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼此相似,与其他集合中的对象相异。

*举例:没有标准参考的学生给书本分的类别,表示自己认为这些书可能是同一类别的(具体什么类别不知道)。*

二、有监督学习(supervised learning)

不仅把训练数据丢给计算机,而且还把分类的结果(数据具有的标签)也一并丢给计算机分析。

计算机进行学习之后,再丢给它新的未知的数据,它也能计算出该数据导致各种结果的概率,给你一个最接近正确的结果。

由于计算机在学习的过程中不仅有训练数据,而且有训练结果(标签),因此训练的效果通常不错。

*举例:不仅把书给学生进行训练给书本分类的能力,而且把分类的结果(哪本书属于哪些类别)也给了学生做标准参考。*

有监督学习的结果可分为两类:分类或回归。

三、无监督学习(unsupervised learning)

只给计算机训练数据,不给结果(标签),因此计算机无法准确地知道哪些数据具有哪些标签,只能凭借强大的计算能力分析数据的特征,从而得到一定的成果,通常是得到一些集合,集合内的数据在某些特征上相同或相似。

*举例:只给学生进行未分类的书本进行训练,不给标准参考,学生只能自己分析哪些书比较像,根据相同与相似点列出清单,说明哪些书比较可能是同一类别的。*

四、半监督学习(semi-supervised learning)

有监督学习和无监督学习的中间带就是半监督学习(semi-supervised learning)。对于半监督学习,其训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常远远大于有标签数据数量(这也是符合现实情况的)。

隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。

*举例:给学生很多未分类的书本与少量的清单,清单上说明哪些书属于同一类别。*

从不同的学习场景看,SSL可分为四大类:

1 半监督分类

半监督分类(Semi-Supervised Classification):是在无类标签的样例的帮助下训练有类标签的样本,获得比只用有类标签的样本训练得到的分类器性能更优的分类器,弥补有类标签的样本不足的缺陷,其中类标签 取有限离散值。

2 半监督回归

半监督回归(Semi-Supervised Regression):在无输出的输入的帮助下训练有输出的输入,获得比只用有输出的输入训练得到的回归器性能更好的回归器,其中输出取连续值。

3 半监督聚类

半监督聚类(Semi-Supervised Clustering):在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇,提高聚类方法的精度。

4 半监督降维

半监督降维(Semi-Supervised Dimensionality Reduction):在有类标签的样本的信息帮助下找到高维输入数据的低维结构,同时保持原始高维数据和成对约束(Pair-Wise Constraints)的结构不变,即在高维空间中满足正约束(Must-Link Constraints)的样例在低维空间中相距很近,在高维空间中满足负约束(Cannot-Link Constraints)的样例在低维空间中距离很远。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 海天一树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
推开图形学大门、进入模拟的世界,超火的太极图形课程开课了
得益于计算机仿真技术的不断发展,我们能够在电脑中重建越来越逼真的现实世界,制作出《冰雪奇缘》这类优秀的动画特效电影。然而,逼真的场景以及丰富的细节离不开超高精度的物理模拟。 两年多前,MIT人工智能实验室博士生胡渊鸣创建了一个名为「太极」的开源计算机图像库,展示了多种场景的酷炫模拟效果,也让读者更深入地了解到什么是计算机图形学。 今年 3 月,胡渊鸣博士毕业并回国创立了太极图形(Taichi Graphics)公司,致力于开发开源基础设施太极编程语言,并专注于图形学、编译器、高性能计算以及人工智能相关技
机器之心
2023/03/29
5890
推开图形学大门、进入模拟的世界,超火的太极图形课程开课了
胡渊鸣的「太极图形」又融了5000万美元,接下来推出3D内容创作平台
杨净 发自 凹非寺 量子位 | 公众号 QbitAI 开工第一天,胡渊鸣大神这边传来新进展。 他创办的太极图形,官宣完成A轮融资—— 5000万美元,由源码资本、GGV纪源资本、BAI 资本联合领投,以及天使轮投资者红杉中国种子基金加码。 与此同时,太极图形还公布了自己下一阶段目标—— 除了继续开发优化太极编程语言外,还将推出直接面向3D数字内容创作者的工具。 成立不到1年,太极图形屡受资本青睐,完成两轮融资。 在业务板块上,也完成了从底层基础设施到上层应用的延伸。 现在的太极图形是家什么公司? 两大业
量子位
2022/03/04
6540
Xue Bin Peng获SIGGRAPH 2022最佳博士论文,太极胡渊鸣获提名
机器之心报道 机器之心编辑部 今年,SIGGRAPH 2022 首次设置了最佳论文奖,共有五篇。此外,备受瞩目的最佳博士论文也于近日揭晓。 近日,SIGGRAPH 公布了今年大会的一系列奖项。 ACM SIGGRAPH 是计算机图形学顶级国际学术会议,创立于 1974 年,已经发展成为由对计算机图形学和交互技术感兴趣的研究人员、艺术家、开发人员、电影制作人、科学家和商业人士组成的国际社区。 今年的 SIGGRAPH 将于 8 月 8 日至 11 日在温哥华举行,同时也可线上参会。 最引人注目的是,SIG
机器之心
2022/07/07
6960
Xue Bin Peng获SIGGRAPH 2022最佳博士论文,太极胡渊鸣获提名
姚班大神胡渊鸣回国创业!超一半员工为清华校友,团队人均竞赛金牌数≥2
他是“太极”(TaiChi)编程语言发明者,这种语言可以快速实现物理特效渲染,大大降低了计算机图形学的编程门槛。
量子位
2021/04/23
1K0
姚班大神胡渊鸣回国创业!超一半员工为清华校友,团队人均竞赛金牌数≥2
多材料耦合俄罗斯方块?胡渊鸣给「太极图形课」交作业了!
这是一份太极图形 CEO 胡渊鸣与 CTO 匡冶忙里偷闲交出的「太极图形课」小作业—基于 Taichi 的软体俄罗斯方块游戏 demo,以下简称他们二人为“原野”组合。
机器之心
2021/10/26
6170
多材料耦合俄罗斯方块?胡渊鸣给「太极图形课」交作业了!
多项核心技术进展发布!胡渊鸣创业后首现身,讲述「太极图形」的前世今生
最近一年,计算机图形学正在迎来产业新浪潮,各路计算机图形学大神纷纷创业成立新的公司。
AI科技评论
2021/09/16
8970
清华毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐「建议收藏」
或许你不知道,电影和动画中特效有时仅仅短短的一秒,却可能需要高性能计算机演算一周,花费惊人。
全栈程序员站长
2022/08/25
3.3K0
清华毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐「建议收藏」
支持异构图、集成GraphGym,超好用的图神经网络库PyG更新2.0版本
机器之心报道 编辑:陈萍、杜伟 当前最流行和广泛使用的 GNN 库 PyG(PyTorch Geometric)现在出 2.0 版本了,新版本提供了全面的异构图支持、GraphGam 以及很多其他特性,这一系列改进,为使用者带来了更好的用户体验。 PyTorch Geometric(PyG)是一个构建于 PyTorch 之上的库,用来为一系列与结构化数据相关的应用编写和训练图神经网络(GNN)。PyG 对机器学习研究者以及机器学习工具包的首次使用者都很友好。 就其特征和功能而言,PyG 具有易用和统一的
机器之心
2023/03/29
7780
支持异构图、集成GraphGym,超好用的图神经网络库PyG更新2.0版本
计算机图形也能自动可微:MIT学神的微分太极框架开源,论文已被ICLR 2020接收
目前,一作胡渊鸣已在 GitHub 上开源了基于这一框架完成的 10个 物理模拟器,项目登上了 GitHub 热榜。而微分太极论文也已被 ICLR2020 接收。
机器之心
2020/02/12
8470
计算机图形也能自动可微:MIT学神的微分太极框架开源,论文已被ICLR 2020接收
太極:MIT华人学神开源的计算机图形库
太極(Taichi)是一个开源的计算机图形库,它旨在提供易于使用的计算机图形学基础架构,并提供了 40 多份计算机图形学重要研究的实现。出于效率的考虑,太極本身是由 C++ 构建的,但用 Python 包装了接口。
机器之心
2019/05/17
9630
MIT博士毕业,「太极」作者胡渊鸣回国创业,专注图形编程
机器之心报道 作者:杜伟 从学术界到产业界,MIT 博士、太极作者胡渊鸣完成了无缝衔接。今年 3 月完成博士学业后,胡渊鸣选择回国创业,成立了太极图形 (Taichi Graphics)公司,自己担任联合创始人兼 CEO。 2019 年 5 月,MIT 人工智能实验室(CSAIL)博士二年级学生胡渊鸣构建了一个名为「太极」的开源计算机图像库,展示了多种场景的酷炫模拟效果,也让读者更深入地了解到什么是计算机图形学。目前,该库在 GitHub 上已有 13.2k 的 star 量。  之后,胡渊鸣又联合其他研究
机器之心
2023/03/29
1.6K0
MIT博士毕业,「太极」作者胡渊鸣回国创业,专注图形编程
AI公司创始人冒充中科大少年班校友:学历是假的,合伙人也是假的
机器之心报道 机器之心编辑部 一家 AI 初创公司的 CEO,竟以假学历混迹多年? 昨天,公众号「中国科大新创校友基金会」(USTCIF)发布声明:经多方查实,莫比嗨客 CEO 刘端阳冒充少年班校友多年,并涉嫌假冒清华大学硕士、斯坦福大学博士(或博士生),通过莫比嗨客公司欺诈深圳、苏州、青岛、山西吕梁等多个城市与高新科技园区。 在此之前,刘端阳自称「12 岁考入中国科学技术大学少年班」。以往多篇提及刘端阳的网络报道中,均出现了「清华大学硕士、斯坦福大学博士(或博士候选人)」、「12 岁就考到中国科学技术大
机器之心
2023/03/29
3710
AI公司创始人冒充中科大少年班校友:学历是假的,合伙人也是假的
CMU出品,计算机图形学秋季课程已上线,B站同步字幕视频
计算机图形学(Computer Graphics)是研究计算机在硬件和软件帮助下创建计算机图形的学科,近年来受到了学界和业界的广泛关注。该领域的研究者也越来越多,如计算机图形学大神 & 太极(Taichi)作者胡渊鸣、「为可微计算机图形学奠定基础」荣获 SIGGRAPH 最佳博士论文奖的太极二作李子懋等等。
3D视觉工坊
2020/11/11
1K0
CMU出品,计算机图形学秋季课程已上线,B站同步字幕视频
他2年拿下博士学位,发表11篇顶会论文!浙大校友李旻辰斩获SIGGRAPH最佳博士论文奖
金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 连续四年,SIGGRAPH最佳博士论文奖,被华人学者拿下。 今年,浙大校友、UCLA数学系博士后李旻辰斩获殊荣。 然而随之浮出的,可不单单是这份荣耀,还有他那开挂般的学术生涯。 来,感受一下一组数据: 仅仅2年时间,便取得博士学位。 博士期间发表了11篇SIGGRAPH。 这般经历,不禁引得网友直呼: 大家感受到了什么叫降维打击了吗? 超短的读博经历 2018年9月入学宾夕法尼亚大学(UPenn)攻读博士,2020年12月毕业。 两年多
量子位
2023/03/10
4710
他2年拿下博士学位,发表11篇顶会论文!浙大校友李旻辰斩获SIGGRAPH最佳博士论文奖
计算机图形学入门总结!
Computer Graphics is Awesome!下面我来梳理一下适合图形学入门的课程或者资料。
Datawhale
2021/04/20
2.6K0
大神碉堡!99 行代码实现的神奇效果
或许你不知道,电影和动画中特效有时仅仅短短的一秒,却可能需要高性能计算机演算一周,花费惊人。
逆锋起笔
2020/02/21
1K0
大神碉堡!99 行代码实现的神奇效果
“荡气回肠”!UCLA蒋陈凡夫万字长文回顾:从转系生到图形学终身教授的十二年
金磊 转载整理自 知乎 量子位 | 公众号 QbitAI 这是一篇由UCLA应用数学副教授蒋陈凡夫所撰写的万字长文,回顾了他在图形学物理模拟领域里十二年来的点点滴滴。 于人,于事,于学术,字里行间无不在透露着蒋陈凡夫对图形学的热爱与浪漫,感动了无数的网友。 在文中被他称为“少年英雄”的胡渊鸣,在看完后甚至直呼“荡气回肠”。 目前已经揽获近3000的赞。 (注:本文经授权转载,以下为原文) 最近评上tenure(终身教授),有人来祝贺:”Now you can freely decline review r
量子位
2022/09/22
7860
“荡气回肠”!UCLA蒋陈凡夫万字长文回顾:从转系生到图形学终身教授的十二年
搞科研,从好好读论文开始:沈向洋带你读论文了
「或许你永远不知道你以前读过的书能在什么时候派上用场,但请保持阅读,因为阅读的过程也是在你大脑中建立认知的过程。」 对于科研人员来说,读论文是一种必修技能。去年,沈向洋博士曾在线上公开课《You are how you read》中分享了他对于论文阅读与撰写的经验,引起领域内的高度关注。 在沈向洋看来,读论文分为几个阶段:最简单的是所谓的「消极阅读」(passive reading),即大概知道文章讲了什么;然后是「积极阅读」( active reading),主动思考这些知识有什么用;然后是「批判性阅读」
机器之心
2023/03/29
6270
搞科研,从好好读论文开始:沈向洋带你读论文了
Taichi 的开源与创业故事
作者 | 胡渊鸣 策划 | 褚杏娟 “太极”跟“冰雪奇缘”这两个看似毫不相干的词汇是如何同框的?让我们跟随胡渊鸣博士的讲述来了解 Taichi 从诞生到走向大众面前再到“成人礼”再到茁壮成长的故事。希望 Taichi 的开源创业之路给大家的生产实践带来共鸣与帮助。 本文整理自太极图形联合创始人、首席执行官胡渊鸣在 DIVE 全球基础软件创新大会 2022(创业与投资专场)的演讲分享,主题为“Taichi 的开源与创业故事”。 分享主要分三个部分展开:第一部分 Taichi 及其演化历史,第二部分 Ta
深度学习与Python
2023/03/29
5960
Taichi 的开源与创业故事
Why Taichi (1): 为什么设计新的编程语言?
(发私信还担心被无视,没想到很快就收到同意的回复)。近日大佬成立公司专门做图形学方面的开源工作,小编作为图形学爱好者甚是激动
ACM算法日常
2021/05/11
1.6K0
推荐阅读
推开图形学大门、进入模拟的世界,超火的太极图形课程开课了
5890
胡渊鸣的「太极图形」又融了5000万美元,接下来推出3D内容创作平台
6540
Xue Bin Peng获SIGGRAPH 2022最佳博士论文,太极胡渊鸣获提名
6960
姚班大神胡渊鸣回国创业!超一半员工为清华校友,团队人均竞赛金牌数≥2
1K0
多材料耦合俄罗斯方块?胡渊鸣给「太极图形课」交作业了!
6170
多项核心技术进展发布!胡渊鸣创业后首现身,讲述「太极图形」的前世今生
8970
清华毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐「建议收藏」
3.3K0
支持异构图、集成GraphGym,超好用的图神经网络库PyG更新2.0版本
7780
计算机图形也能自动可微:MIT学神的微分太极框架开源,论文已被ICLR 2020接收
8470
太極:MIT华人学神开源的计算机图形库
9630
MIT博士毕业,「太极」作者胡渊鸣回国创业,专注图形编程
1.6K0
AI公司创始人冒充中科大少年班校友:学历是假的,合伙人也是假的
3710
CMU出品,计算机图形学秋季课程已上线,B站同步字幕视频
1K0
他2年拿下博士学位,发表11篇顶会论文!浙大校友李旻辰斩获SIGGRAPH最佳博士论文奖
4710
计算机图形学入门总结!
2.6K0
大神碉堡!99 行代码实现的神奇效果
1K0
“荡气回肠”!UCLA蒋陈凡夫万字长文回顾:从转系生到图形学终身教授的十二年
7860
搞科研,从好好读论文开始:沈向洋带你读论文了
6270
Taichi 的开源与创业故事
5960
Why Taichi (1): 为什么设计新的编程语言?
1.6K0
相关推荐
推开图形学大门、进入模拟的世界,超火的太极图形课程开课了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档