Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【机器学习入门系列】简介

【机器学习入门系列】简介

原创
作者头像
张耀琦
修改于 2017-06-19 11:09:30
修改于 2017-06-19 11:09:30
2.3K0
举报
文章被收录于专栏:张耀琦的专栏张耀琦的专栏

导语

简要介绍机器学习研究的内容,机器学习的三大步骤;不同的 Model 类型举例

引用课程:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html

先看这里,可能由于你正在查看这个平台行间公式不支持很多的渲染,所以最好在我的 CSDN 上 查看,传送门:(无奈脸)

CSDN 博客文章地址:http://blog.csdn.net/zyq522376829/article/details/66478149

我们将要学习什么东东?

什么是机器学习?

有右边这样非常大的音频数据集,写程序来进行学习,然后可以输出音频“Hello”

<!--more-->

有右边这样非常大的图片数据集,写程序来进行学习,然后可以识别左边这样图,识别为正确的物种。

机器学习 $\approx$ 寻找一个函数
Framework 框架
  • Image Recognition 图像识别

函数集($f{1},f{2},\ldots $),通常将一个函数称为 Model(模型)

为了找到最好的函数 $f$ ,将训练集图像放入函数集的输入中,函数集输出识别结果。

下面来看具体步骤

Step1.确定一组函数(Model),函数集怎么找后面会再介绍。

Step2.将训练集对函数集进行训练。

Step3.挑选出“最好”的函数 $f^{}$

然后就可以使用 $f^{}$ 来对新的测试集进行检测。

整体都学习哪些知识(Learning Map)

Regression(回归)是什么?

Regression 意思是,我们要找到这样一个函数 f,使得输出为 scalar(标量,数值)

这里说法当然是比较不严谨,数学上简单的线性,一元或多元回归的知识可以在概率论与数理统计课本中进行学习。《概率论与数理统计》,浙江大学,第九章,P244。

举个例子,比如预测PM2.5.

输入就是之前每一天的PM2.5数值,输出是明天的PM2.5,是个标量。 具体做法:

Classification(分类)

分类比较容易理解,比如二元分类或者多元分类。

Binary Classification(二元分类)

比如垃圾邮件过滤,就是要找到一个Function,输入为一封邮件,输出是二元的,是或者不是垃圾邮件。训练集就是很多封邮件,每一封邮件知道它是否是垃圾邮件,让Function进行学习。

Multi-class Classification(多元分类)

多元分类;例如下面的新闻分类系统,找一个Function,输入就是新闻的内容,输出则是新闻的类型(政治,经济,体育等等)

Deep Learning(深度学习)

上面讲过,机器学习的第一个步骤就是确定一个函数集,可以选择Linear Model(线性模型),但是 Linear Model 比较有限。更多的则是 Non-lilnear Model(非线性模型)。比如深度学习就是 Non-lilnear Model 。

举个例子,比如图像识别:

这里举例深度学习中的一种,Convolutional Neural Network(CNN,卷积神经网络),输入就是很多的图像,输出为图像的类型,这里将每个对象都当作一个类别。训练集就是很多张图片,并告诉机器每张图片对应的是什么类型。深度学习的Function非常复杂。

再举一个例子,下围棋:

输入就是黑白子在1919棋盘上的位置,输出就是下一步应该下在哪里。这也就是一个选择题,可能的选项有1919个。

训练集就是一堆棋谱,每一步是怎么走的。

Supervised Learning(有监督学习)

Non-lilnear Model 不只 Deep Learning,后面还会接触到 SVM,decision tree 等。 上面提到这些我们都叫做Supervised Learning(有监督学习),所谓 Supervised Learning 就是说训练集的输入和输出对于目标函数是成对的,目标函数看到一个输入,就应该对应有一个输出。也把这样的输出叫做 label。 见到说需要 Labelled data 的情况,就是指我们要告诉机器看到一个输入,要有一个输出。

其他的比如还有Semi-supervised Learning(半监督学习)

Semi-supervised Learning(半监督学习)

比如图像识别一些猫和狗,Labelled data 就是训练集中每个图片知道它对应的是什么类型。而Unlabelled data 就是不知道图片对应的类型。这种其实也是可以让机器学习的比较好的,后面也会介绍。

Transfer Learning(迁移学习)

举例说一下迁移学习:

比如有 Labelled data ,但我们还有一些labelled 或者 unlabelled 数据,这些数据和 Labelled data 中识别猫和狗都没有关系,但它也是怎么帮助Labelled data 更好的识别。这就是 Transfer Learning 要做的事情。

Unsupervised Learning(无监督学习)

举一个Unsupervised Learning 的例子:让机器阅读非常多的文章,然后机器就可以学习单词的含义。

这个Unsupervised Learning 的例子中,训练集只有输入(很多的文章),没有输出。假设通过Neural Network(神经网络)学习之后,给一个单词,就可以输出一个向量。

再举一个例子:比如想要让机器绘制一下自己的内心世界。

具体说就是给机器一堆数字,他就能自己绘制一张图片,此时训练集只有输出(很多的图片),没有输入。

Structured Learning(结构化学习)

比如看下面例子:第一个是语音识别,假设我们想要找的function是输入一段语音,然后输出语音的文字。如果把世界上不同的句子当作一个类别,这样是没有办法穷举所有类型的,所以这种超越分类的问题,就需要另外一套完整的思想来解决。 还有例子就是机器翻译,将中文翻译成英文,也是没有办法穷举所有的句子。再或者人脸识别,没有办法穷举所有人脸框。

Reinforcement Learning(增强学习)

举个Reinforcement Learning 的例子:AlphaGo。 举例来比较 Supervised 和 Reinforcement:比如学习对话,Supervised 训练集每句话,都有对应的输出;但是Reinforcement就只是不断的对话,机器只能知道它做的好或者不好,没有其他更多的信息。

再举一个围棋的例子,比如 Supervised 情况就是机器看到一个棋局,告诉它下一步应该走什么。Reinforcement 的情况就是走了很多步,输了或者赢了,就是知道一个结果。AlphaGo 就是两个都用到了,先看棋谱学习,但是棋谱的数量是有限的,然后再进行增强型学习。所以 AlphaGo 第一轮和世界高手对局时还捉襟见肘,第二轮就基本横扫了。

理解Learning Map颜色的意义

蓝色的都是代表Scenario(方案),红色部分指的是你要找的function的样子,可以在Semi-supervised Learning 的情况下做红色的task,也可以在 Transfer Learning下做红色task,就是右上角的4个虽然是小方块,但是 Supervised Learning 里面的 task 都可以在其他蓝色 scenario 中做。绿色的部分就是方法或者说模型,绿色的内容虽然写在 Classification 里面,但是可以放在 Regression 或者 Structured Learning 中。

相关推荐 人人都可以做深度学习应用:入门篇(上) 人人都可以做深度学习应用:入门篇(下) 机智机器学习TML

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【陆勤践行】机器学习算法概览
想入门机器学习的同学,经常会去看一些入门书,比如《集体智慧编程》、《机器学习实战》、《数据挖掘》、《推荐系统实践》等。看书的过程中,经常性的会看到如下样例: 垃圾邮件识别 信用卡交易异常检测 手写数字识别 语音识别 人脸检测 商品推荐 疾病检测(根据以往病例记录,确定病人是否患病) 股票预测 用户分类(根据用户行为判断该用户是否会转化为付费用户) 形状检测(根据用户在手写板上上画得形状,确定用户画的到底是什么形状) 因此,当再有人问ML是什么的时候,就可以说这个是ML可以handle的,这个问题ML也可以h
陆勤_数据人网
2018/02/26
5480
李宏毅《机器学习》丨1. Introduction of this course(机器学习介绍)
所谓Machine Learning的方向,就是你就写段程序,然后让机器人变得了很聪明,它就能够有学习的能力。
AXYZdong
2022/06/14
6490
李宏毅《机器学习》丨1. Introduction of this course(机器学习介绍)
机器学习介绍
Hand-crafted rules,叫做人设定的规则。那假设今天要设计一个机器人,可以帮忙打开或关掉音乐,那做法可能是这样:
用户3578099
2023/09/11
2520
机器学习介绍
译文:最全的机器学习算法基础知识
在我们了解了需要解决的机器学习问题的类型之后,我们可以开始考虑搜集来的数据的类型以及我们可以尝试的机器学习算法。在这个帖子里,我们会介绍一遍最流行的机器学习算法。通过浏览主要的算法来大致了解可以利用的方法是很有帮助的。 可利用的算法非常之多。困难之处在于既有不同种类的方法,也有对这些方法的扩展。这导致很快就难以区分到底什么才是正统的算法。在这个帖子里,我希望给你两种方式来思考和区分在这个领域中你将会遇到的算法。 第一种划分算法的方式是根据学习的方式,第二种则是基于形式和功能的相似性(就像把相似的动物归为
小莹莹
2018/04/20
7500
译文:最全的机器学习算法基础知识
春节充电系列:李宏毅2017机器学习课程学习笔记19之迁移学习(Transfer Learning)
【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的deep generative model (part 2),这一节将主要针对讨论transfer learning。本文讨论机器学习中transfer learning的若干主要问题:model fine-tuning, multitask learning, domain-adversarial training 以及 zero-shot learning。话不多说,让我们一起学习这些内容吧。 春节充电系列:李宏毅2017机器学习
WZEARW
2018/04/13
1.2K0
春节充电系列:李宏毅2017机器学习课程学习笔记19之迁移学习(Transfer Learning)
1,机器学习简介
人工智能指由人类制造出的机器表现出的智能。这是一个非常大的范围,长远目标是让机器实现类人智能。不过目前我们还在非常非常初级的阶段,甚至都不能称为智能。
lyhue1991
2020/07/20
4880
1,机器学习简介
春节充电系列:李宏毅2017机器学习课程学习笔记12之半监督学习(Semi-supervised Learning)
【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的深度学习要求深的原因,这一节将主要针对讨论半监督学习。本文内容涉及机器学习中半监督学习的若干主要问题:semi-supervised learning for generative model, low-density separation assumption, smoothness assumption以及better representation。话不多说,让我们一起学习这些内容吧 。 春节充电系列:李宏毅2017机器学习课程学
WZEARW
2018/04/13
1.2K0
春节充电系列:李宏毅2017机器学习课程学习笔记12之半监督学习(Semi-supervised Learning)
春节充电系列:李宏毅2017机器学习课程学习笔记01之简介
【导读】春节将近,在亲友相聚之余也不忘给自己充充电。为此,专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲,机器学习可以分为三部分:函数集(也就是model)、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括:有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术,并在后续的更新中跟大家一一介绍。 课件网址: http://speech.ee.ntu.edu.tw/~
WZEARW
2018/04/13
8350
春节充电系列:李宏毅2017机器学习课程学习笔记01之简介
机器学习|卷积神经网络(CNN) 手写体识别 (MNIST)入门
这篇文档可能还是会非常长,因为机器学习并不是纯软件开发,简单地调用库函数 API,需要有一定的理论支撑,如果完全不介绍理论部分,可能就不知道为什么模型要这样设计,模型出了问题应该怎样改善。
用户1737318
2019/10/14
1.4K0
机器学习|卷积神经网络(CNN) 手写体识别 (MNIST)入门
人工智能的奥秘:机器学习的各大门派
图灵奖得主,Meta人工智能负责人杨立昆(Yann LeCun)在2016年曾提出一个有名的蛋糕比喻:“如果智能是一块蛋糕,主体是自监督学习,表面的一糖霜是监督学习,点缀的樱桃是强化学习”
不去幼儿园
2024/12/03
1560
人工智能的奥秘:机器学习的各大门派
算法入门(一) -- 机器学习基础大纲
我们常说的算法到底是什么?机器学习又是什么?模型起到了什么作用?相信很多小伙伴在刚开始学习的时候都有过这样的疑问,接下来我们就以这三个问题开头,开启我们的算法修仙之路。
万事可爱^
2025/01/23
2040
算法入门(一) -- 机器学习基础大纲
亚马逊AI主任科学家李沐:机器学习简介
本书作者跟广大程序员一样,在开始写作前需要来一杯咖啡。我们跳进车准备出发,Alex掏出他的安卓喊一声“OK Google”唤醒语言助手,Mu操着他的中式英语命令到“去蓝瓶咖啡店”。手机快速识别并显示出命令,同时判断我们需要导航,并调出地图应用,给出数条路线方案,每条方案均有预估的到达时间并自动选择最快的线路。好吧,这是一个虚构的例子,因为我们一般在办公室喝自己的手磨咖啡。但这个例子展示了在短短几秒钟里,我们跟数个机器学习模型进行了交互。 如果你从来没有使用过机器学习,你会想,“这不就是编程吗?”或者,“机
IT派
2018/03/28
1.7K0
亚马逊AI主任科学家李沐:机器学习简介
机器学习的基本概念
我发现,查阅和掌握机器学习基本概念的最佳方法是,回顾机器学习教科书的介绍章节,并观看典型的在线课程视频。
花落花飞去
2018/02/09
2K0
机器学习的基本概念
七月在线-机器学习集训营 第九期
机器学习(Machine Learning, ML)是人工智能(AI)领域的一个重要分支,它使计算机能够在不进行明确编程的情况下从数据中学习并改进其性能。以下是关于机器学习的详细介绍,包括其基本概念、主要类型、应用场景以及如何入门学习。
瘦瘦itazs和fun
2025/02/09
970
机器学习入门:从零开始理解监督学习与无监督学习
翻译过来就是:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。
小宇-xiaoyu
2024/12/27
3860
机器学习入门:从零开始理解监督学习与无监督学习
什么是机器学习
利用计算机的运算能力,从大量的数据中发现一个 “函数”或“模型” ,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。建模的过程就是机器“学习”过程。
闻说社
2022/09/27
5560
全干货!机器学习通识篇知识分享
来源:海豚数据科学实验室本文约2500字,建议阅读5分钟本文介绍了机器学习的常见知识。 机器学习定义 机器学习(Machine Learning)本质上就是让计算机自己在数据中学习规律,并根据所得到的规律对未来数据进行预测。 机器学习包括如聚类、分类、决策树、贝叶斯、神经网络、深度学习(Deep Learning)等算法。 机器学习的基本思路是模仿人类学习行为的过程,如我们在现实中的新问题一般是通过经验归纳,总结规律,从而预测未来的过程。机器学习的基本过程如下: 机器学习基本过程 机器学习发展历程 从机器
数据派THU
2022/07/04
7700
全干货!机器学习通识篇知识分享
小白入门机器学习概述
机器学习(Machine Learning, ML)是人工智能(AI)的一个重要分支,它通过算法让计算机能够从数据中自动学习并做出预测或决策。随着数据量的爆炸式增长和计算能力的显著提升,机器学习在各个领域得到了广泛应用,如医疗、金融、交通、教育等。本文将从基础概念入手,逐步深入,帮助你全面了解机器学习的基本原理和入门方法。
码事漫谈
2025/03/31
2130
小白入门机器学习概述
机器学习(四)机器学习分类及场景应用
监督学习(supervised learning)从训练数据(training data)集合中学习模型,对测试数据(test data)进行预测。
Maynor
2023/10/28
1.6K0
机器学习(四)机器学习分类及场景应用
TensorFlow系列专题(一):机器学习基础
1956年的8月,美国达特茅斯学院(Dartmouth College)举行了一次研讨会,这次会议由约翰麦卡锡等人发起,会议上约翰麦卡锡首次提出了“人工智能”这个概念,这次会议也被公认为是人工智能诞生的标志。在这六十多年的时间里,人工智能的发展起起伏伏、忽“冷”忽“热”。而2016年AlphaGo与李世石的那场“世纪大战”则彻底点燃了大众的热情。当前人工智能成了一个“香饽饽”,很多国家都在积极争夺人工智能领域的话语权,各大公司也都不断加大在人工智能领域的投入。对于想要转行人工智能领域或者正在从事人工智能领域的从业者来说,当前是一个不折不扣的黄金时代。
磐创AI
2018/11/30
4380
TensorFlow系列专题(一):机器学习基础
相关推荐
【陆勤践行】机器学习算法概览
更多 >
交个朋友
加入AICoding云开发技术交流群
智能编码实践分享 聚焦AI+云开发
加入[腾讯云] DeepSeek开发者交流群
前沿技术深度讨论 发展开发者人脉圈
加入[CodeBuddy] 官方交流站
分享AI写代码技巧 共解产品技术难题
换一批
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档