首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >精华 | 12个关键词告诉你告诉你什么是机器学习(基础篇)

精华 | 12个关键词告诉你告诉你什么是机器学习(基础篇)

作者头像
昱良
发布于 2018-04-08 10:21:20
发布于 2018-04-08 10:21:20
9170
举报

键字全网搜索最新排名

机器学习算法】:排名第一

【机器学习】:排名第一

【Python】:排名第三

【算法】:排名第四

源 | 小象

随着人工智能(AI)技术对各行各业有越来越深入的影响,我们也更多地在新闻或报告中听到“机器学习”、“深度学习”、“增强学习”、“神经网络”等词汇,对于非专业人士来说略为玄幻。这篇文章为读者梳理了包括这些在内的12个关键词,希望帮助读者更清晰地理解,这项人工智能技术的内涵和潜能。

1、 机器学习

汤姆·米歇尔教授任职于卡内基梅陇大学计算机学院-机器学习系,根据他在《机器学习》一书中的定义,机器学习是“研究如何打造可以根据经验自动改善的计算机程序”。机器学习在本质上来说是跨学科的,使用了计算机科学、统计学和人工智能以及其他学科的知识。机器学习研究的主要产物是算法,可以帮助基于经验的自动改善。这些算法可以在各个行业有广泛应用,包括计算机视觉、人工智能和数据挖掘

2、 分类

分类的含义是通过模型将数据分类进入不同的类别。这些模型的构造方式是输入一个训练数据库,其中有预先标记好的类别,供算法进行学习。然后,在模型中输入类别未经标记的数据库,让模型基于它从训练数据库中所学到的知识,来预测新数据的类别。因为这类的算法需要明确的类别标记,因此,分类算是“监督学习”的一种形式。

3、 回归

回归是与分类紧密联系在一起的。分类是预测离散的类别,而回归则适用的情况,是当预测“类别”由连续的数字组成。线性回归就是回归技术的一个例子。

4、 聚集

聚集是用来分析不含有预先标记过的类别的数据,甚至连类别特性都没有标记过。数据个体的分组原则是这样的一个概念:最大化组内相似度、最小化组与组之间的相似度。这就出现了聚集算法,识别非常相似的数据并将其放在一组,而未分组的数据之间则没那么相似。K-means聚集也许是聚集算法中最著名的例子。由于聚集不需要预先将类别进行标记,它算是“无监督学习”的一种形式,意味着算法通过观察进行学习,而不是通过案例进行学习。

5、 关联

要解释关联,最简单的办法是引入“购物篮分析”,这是一个比较著名的典型例子。购物篮分析是假设一个购物者在购物篮中放入了各种各样的物品(实体或者虚拟),而目标是识别各种物品之间的关联,并为比较分配支持和置信度测量(编者注:置信度是一个统计学概念,意味着某个样本在总体参数的区间估计)。这其中的价值在于交叉营销和消费者行为分析。关联是购物篮分析的一种概括归纳,与分类相似,除了任何特性都可以在关联中被预测到。 Apriori 算法被称为最知名的关联算法。关联也属于“无监督学习”的一种形式。

决策树的例子,分步解决并分类的方式带来了树形结构。图片来源: SlideShare 。

6、 决策树

决策树是一种自上而下、分步解决的递归分类器。决策树通常来说由两种任务组成:归纳和修剪。归纳是用一组预先分类的数据作为输入,判断最好用哪些特性来分类,然后将数据库分类,基于其产生的分类数据库再进行递归,直到所有的训练数据都完成分类。打造树的时候,我们的目标是找到特性来分类,从而创造出最纯粹的子节,这样,要将数据库中所有数据分类,只需要最少的分类次数。这种纯度是以信息的概念来衡量。一个完整的决策树模型可能过于复杂,包含不必要的结构,而且很难解读。因而还需要“修剪”这个环节,将不需要的结构从决策树中去除,让决策树更加高效、简单易读并且更加精确。

右上箭头:最大间隔超平面。左下箭头:支持向量。图片来源: KDNuggets 。

7、 支持向量机(SVM)

SVM可以分类线性与非线性数据。SVM的原理是将训练数据转化进入更高的维度,再检查这个维度中的最优间隔距离,或者不同分类中的边界。在SVM中,这些边界被称为“超平面”,通过定位支持向量来划分,或者通过最能够定义类型的个例及其边界。边界是与超平面平行的线条,定义为超平面及其支持向量之间的最短距离。SVM的宏伟概念概括起来就是:如果有足够多的维度,就一定能发现将两个类别分开的超平面,从而将数据库成员的类别进行非线性化。当重复足够多的次数,就可以生成足够多的超平面,在N个空间维度中,分离所有的类别。

8、 神经网络

神经网络是以人类大脑为灵感的算法,虽然这些算法对真实人脑功能的模拟程度有多少,还存在很多的争议。神经网络是由无数个相互连接的概念化人工神经元组成,这些神经元在互相之间传送数据,有不同的相关权重,这些权重是基于神经网络的“经验”而定的。“神经元”有激活阈值,如果各个神经元权重的结合达到阈值,神经元就会“激发”。神经元激发的结合就带来了“学习”。

9、 深度学习

深度学习相对来说还是个比较新的词汇,虽然在网络搜索大热之前就已经有了这个词汇。这个词汇在研究和业界都名声大噪,主要是因为其他一系列不同领域的巨大成功。深度学习是应用深度神经网络技术——具有多个隐藏神经元层的神经网络架构——来解决问题。深度学习是一个过程,正如使用了深度神经网络架构的数据挖掘,这是一种独特的机器学习算法

10、增强学习

对于“增强学习”最好的描述来自剑桥大学教授、微软研究科学家Christopher Bishop,他用一句话精确概括:“增强学习是在某一情景中寻找最适合的行为,从而最大化奖励。”增强学习中,并没有给出明确的目标;机器必须通过不断试错的方式进行学习。我们来用经典的马里奥游戏举个例子。通过不断试错,增强学习算法可以判断某些行为、也就是某些游戏按键可以提升玩家的游戏表现,在这里,试错的目标是最优化的游戏表现。

K层交叉检验的例子,在每一轮使用不同的数据进行测试(蓝色为训练数据、黄色为测试数据),方框下为每一轮的验证精度。最终的验证精度是10轮测试的平均数。图片来源: GitHub

11、K层交叉检验

交叉检验是一种打造模型的方法,通过去除数据库中K层中的一层,训练所有K减1层中的数据,然后用剩下的第K层来进行测验。然后,再将这个过程重复K次,每一次使用不同层中的数据测试,将错误结果在一个整合模型中结合和平均起来。这样做的目的是生成最精确的预测模型。

12、贝叶斯

当我们讨论概率的时候,有两个最主流的学派:经典学派概率论看重随机事件发生的频率。与之对比,贝叶斯学派认为概率的目标是将未确定性进行量化,并随着额外数据的出现而更新概率。如果这些概率都延伸到真值,我们就有了不同确定程度的“学习”。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-12-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习算法与Python学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
科普 | 12个关键词,告诉你到底什么是机器学习
GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在四处拜访人工智能
AI科技评论
2018/03/06
8180
科普 | 12个关键词,告诉你到底什么是机器学习
十大机器学习算法,看完即入门
机器学习算法分为三类:有监督学习、无监督学习、增强学习。有监督学习需要标识数据(用于训练,即有正例又有负例),无监督学习不需要标识数据,增强学习介于两者之间(有部分标识数据)。下面将向大家具体介绍机器
IT派
2018/03/27
6680
十大机器学习算法,看完即入门
机器学习入门:概念、算法与应用
机器学习(Machine Learning)是人工智能的一个子领域,指的是通过数据进行模型的训练,使得计算机系统能够在没有明确编程指令的情况下,自动从经验中学习并作出预测或决策。机器学习的核心思想是通过算法从数据中发现模式或规律,以便在未来对新的数据做出合理的判断。
用户11295429
2024/10/20
3670
机器学习入门:概念、算法与应用
十大必须掌握的机器学习算法,你都知道了吗?
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 来源:AI研习社 通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。 今天的算法如下: 决策树 随机森林算法 逻辑回归 SVM 朴素贝叶斯 K最近邻算法 K均值算法 Adaboost算
昱良
2018/04/08
6020
十大必须掌握的机器学习算法,你都知道了吗?
快速选择合适的机器学习算法
本文主要适用于初学者到中级数据科学家或分析师,他们有兴趣识别和应用机器学习算法来解决他们感兴趣的问题。
小莹莹
2018/07/24
7260
快速选择合适的机器学习算法
干货 | 数据挖掘中的十大实用方法,可能你并不一定都熟悉!
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 目录 基于历史的MBR分析 购物篮分析 决策树 遗传算法 聚类分析 连接分析 OLAP分析 神经网络 判别分析 逻辑回归分析 1.基于历史的MBR分析 基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。 MBR中有两个主要的要素
昱良
2018/04/08
9130
选择困难症?一文通解如何选择最合适的机器学习算法
大数据文摘作品,转载要求见文末 编译 | 姜范波,寒小阳,钱天培 如果你是一个初学/中等程度的数据科学家/分析师,并且想要将机器学习的算法运用到解决你关心的问题的上,那么这篇文章正是为你写的! 初学者面对各种机器学习算法,一个典型的问题是:我应该使用哪种算法?问题的答案取决于许多因素,包括: 数据的大小,质量和性质。 可接受的计算时间。 任务的紧迫性。 你想用数据做什么。 即使是经验丰富的数据科学家也无法在尝试不同的算法之前,就断定哪种算法会是最好的。在此我们并非倡导一蹴而就的方法,但是我们希望根据一些明确
大数据文摘
2018/05/25
6800
长文 | 一文读懂什么是机器学习
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 在进入正题前,我想大家心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅
昱良
2018/04/08
6230
长文 | 一文读懂什么是机器学习
学界 | 机器学习十大算法都是何方神圣?看完你就懂了
AI科技评论按:机器学习与人工智能变得越来越热。大数据原本在工业界中就已经炙手可热,而基于大数据的机器学习则更加流行,因为其通过对数据的计算,可以实现数据预测、为公司提供决策依据。跟我们生活息息相关的最常见机器学习算法包括电影推荐算法、图书推荐算法。这些算法都是基于你的电影观看记录或图书购买记录来给你做推荐的。 James Le 在 KDnuggets 上发布了一篇文章,介绍了他是如何入门机器学习的。此外,他在其中摸索出十大常用的机器学习算法,并逐一进行介绍。AI科技评论编译如下,未经许可不得转载。 如果你
AI科技评论
2018/03/09
6740
学界 | 机器学习十大算法都是何方神圣?看完你就懂了
1,机器学习简介
人工智能指由人类制造出的机器表现出的智能。这是一个非常大的范围,长远目标是让机器实现类人智能。不过目前我们还在非常非常初级的阶段,甚至都不能称为智能。
lyhue1991
2020/07/20
4850
1,机器学习简介
【机器学习】机器学习分类算法总结
目前看到的比较全面的分类算法,总结的还不错. 主要分类方法介绍解决分类问题的方法很多,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。 (1)决策树 决策树是用于分类和预测的主要技术之一,决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。构造决策树的目的是找出属性和类别间的关系,用它来预测将来未知类别的记录的类别。它
陆勤_数据人网
2018/02/26
1.2K0
机器学习简史和常用算法的梳理
原文:https://maoli.blog.csdn.net/article/details/115803729
润森
2022/08/18
8970
机器学习简史和常用算法的梳理
机器学习简史
深度学习已经得到了人工智能历史上前所未有的公众关注度和产业投资,但这并不是机器学习的第一次成功。可以这样说,当前工业界所使用的绝大部分机器学习算法都不是深度学习算法。深度学习不一定总是解决问题的正确工具:有时没有足够的数据,深度学习不适用;有时用其他算法可以更好地解决问题。我们简要回顾机器学习方法,并介绍这些方法的历史背景。这样我们可以将深度学习放入机器学习的大背景中,并更好地理解深度学习的起源以及它为什么如此重要。
HuangWeiAI
2020/02/24
6280
如何选择Microsoft Azure机器学习算法
编者按:机器学习的算法很多,如何选择一直是初学者的一个痛点。本文给出了机器学习算法选择的方法和实例,不仅适用于Microsoft Azure框架,同样可以应用于其他场合。 本文目录 机器学习算法速查卡 机器学习的类别 选择算法的注意事项 算法注释 更多的算法帮助 关于问题“我应该使用什么机器学习算法”?我们总是回答“这取决于“。这取决于数据的大小,质量和性质。这取决于你想要解决什么问题。这取决于算法上的数学知识如何转换为您正在使用的计算机的指令。这取决于你有多少时间。在尝试之前,即使是最有经验的数据科学
小莹莹
2018/04/24
1.2K0
如何选择Microsoft Azure机器学习算法
【综述】机器学习中的12类算法
最近在研究一些机器学习方面的论文,翻到了一篇较早的机器学习综述(2017年),虽然不是最新的研究现状,但考虑到经典机器学习算法其实发展并不像深度学习那么迅猛,所以其论述还是很有参考性。本文就其中关于机器学习算法分类的一段进行选摘翻译,以供参考。原文链接可通过阅读原文查阅。
luanhz
2021/07/23
1.2K0
【综述】机器学习中的12类算法
高效理解机器学习
对于初学者来说,机器学习相当复杂,可能很容易迷失在细节的海洋里。本文通过将机器学习算法分为三个类别,梳理出一条相对清晰的路线,帮助初学者理解机器学习算法的基本原理,从而更高效地学习机器学习。
一点人工一点智能
2023/08/25
3290
高效理解机器学习
初识机器学习
机器学习解决的问题无非两类:预测、分类 预测:预测所属分类、预测预测数值,区别:预测目标Y是连续的还是离散的
ZONGLYN
2019/08/08
7580
拥抱人工智能,从机器学习开始
自“阿尔法狗”(AlphaGo)完胜人类围棋顶尖高手后,有关人工智能(AI)的讨论就从未停歇。工业4.0方兴未艾,人工智能引领的工业5.0时代却已悄然苏醒。人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展,而深度学习的进步却是当今人工智能大爆炸的核心驱动。
yuanyi928
2018/07/26
5690
拥抱人工智能,从机器学习开始
AI: 机器学习算法总结
机器学习(Machine Learning)是人工智能(Artificial Intelligence, AI)的一个重要分支,通过从数据中自动学习和改进,来实现复杂任务的自动化。机器学习的算法主要分为两大类:传统算法和神经网络。本文将对这两类算法进行详细介绍,分析其原理、特点以及应用场景。
运维开发王义杰
2024/06/25
3970
AI: 机器学习算法总结
机器学习(36)之协同过滤典型算法概述【精华】
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 前言 推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型的协同过滤推荐算法做原理总结。 推荐算法概述 推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种: 1)基于内容的推荐:这一类一般依赖于自然
昱良
2018/04/04
2K0
相关推荐
科普 | 12个关键词,告诉你到底什么是机器学习
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档