Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【机器学习】参数和非参数机器学习算法

【机器学习】参数和非参数机器学习算法

作者头像
陆勤_数据人网
发布于 2018-02-28 02:21:57
发布于 2018-02-28 02:21:57
1.5K0
举报

什么是参数机器学习算法并且它与非参数机器学习算法有什么不同?

本文中你将了解到参数和非参数机器学习算法的区别。

让我们开始吧。

学习函数

机器学习可以总结为学习一个函数(f)(f),其将输入变量(X)(X)映射为输出变量(Y)(Y)。

Y=f(x)Y=f(x)

算法从训练数据中学习这个映射函数。

函数的形式未知,于是我们机器学习从业者的任务是评估不同的机器学习算法,然后选择好的能拟合潜在的目标函数的算法。

不同的算法对目标函数的形式和学习的方式有不同的估计和偏差。

参数机器学习算法

假设可以极大地简化学习过程,但是同样可以限制学习的内容。简化目标函数为已知形式的算法就称为参数机器学习算法。

通过固定大小的参数集(与训练样本数独立)概况数据的学习模型称为参数模型。不管你给与一个参数模型多少数据,对于其需要的参数数量都没有影响。 — Artificial Intelligence: A Modern Approach,737页

参数算法包括两部分:

选择目标函数的形式。 从训练数据中学习目标函数的系数。

对于理解目标函数来讲,最简单的就是直线了,这就是线性回归里面采用的形式:

b_0+b_1<em>x_1+b_2</em>x_2=0b0+b1<em>x1+b2</em>x2=0

其中b_0b0、b_1b1和b_2b2是直线的系数,其影响直线的斜度和截距,x_1x1和x_2x2是两个输入变量。

把目标函数的形式假设为直线极大地简化了学习过程。那么现在,我们需要做的是估计直线的系数并且对于这个问题预测模型。

通常来说,目标函数的形式假设是对于输入变量的线性联合,于是参数机器学习算法通常被称为“线性机器学习算法”。

那么问题是,实际的未知的目标函数可能不是线性函数。它可能接近于直线而需要一些微小的调节。或者目标函数也可能完全和直线没有关联,那么我们做的假设是错误的,我们所做的近似就会导致差劲的预测结果。

参数机器学习算法包括:

  • 逻辑回归
  • 线性成分分析
  • 感知机

参数机器学习算法有如下优点:

  • 简洁:理论容易理解和解释结果
  • 快速:参数模型学习和训练的速度都很快
  • 数据更少:通常不需要大量的数据,在对数据的拟合不很好时表现也不错

参数机器学习算法的局限性:

  • 约束:以选定函数形式的方式来学习本身就限制了模型
  • 有限的复杂度:通常只能应对简单的问题
  • 拟合度小:实际中通常无法和潜在的目标函数吻合

非参数机器学习算法

对于目标函数形式不作过多的假设的算法称为非参数机器学习算法。通过不做假设,算法可以自由的从训练数据中学习任意形式的函数。

当你拥有许多数据而先验知识很少时,非参数学习通常很有用,此时你不需要关注于参数的选取。 — Artificial Intelligence: A Modern Approach,757页

非参数理论寻求在构造目标函数的过程中对训练数据作最好的拟合,同时维持一些泛化到未知数据的能力。同样的,它们可以拟合各自形式的函数。

对于理解非参数模型的一个好例子是k近邻算法,其目标是基于k个最相近的模式对新的数据做预测。这种理论对于目标函数的形式,除了相似模式的数目以外不作任何假设。

一些非参数机器学习算法的例子包括:

  • 决策树,例如CART和C4.5
  • 朴素贝叶斯
  • 支持向量机
  • 神经网络

非参数机器学习算法的优势:

  • 可变性:可以拟合许多不同的函数形式。
  • 模型强大:对于目标函数不作假设或者作微小的假设
  • 表现良好:对于预测表现可以非常好。

非参数机器学习算法局限性:

  • 需要更多数据:对于拟合目标函数需要更多的训练数据
  • 速度慢:因为需要训练更多的参数,训练过程通常比较慢。
  • 过拟合:有更高的风险发生过拟合,对于预测也比较难以解释。

延伸阅读

对于参数和非参数机器学习算法的不同以下是一些资源。

书籍

An Introduction to Statistical Learning: with Applications in R,章节2 Artificial Intelligence: A Modern Approach,章节18

网页

机器学习中使用非参数理论的好处是什么? Quora 机器学习中使用非参数理论的缺点是什么? Quora 非参数统计 维基百科 参数统计维基百科 参数vs非参数 StackExchange

总结

本文中你了解到了参数和非参数机器学习算法的不同之处。

你学习到,参数理论对于映射函数做很多的假设,这使得模型易于训练,需要的数据量少,同时也使得模型能力有限。

非参数理论对于目标函数的形式不作过多的假设,这使得模型需要更多的数据来训练,并且模型拥有高复杂度,同时也使得模型能力很强。

关于参数和非参数机器学习算法,你有什么问题吗?欢迎留下评论,我将竭力解答。

关于偏差、方差和偏差-方差的权衡,你有什么问题吗?欢迎留下评论,我将竭力解答。

原文链接:[Parametric and Nonparametric Machine Learning Algorithms(http://machinelearningmastery.com/parametric-and-nonparametric-machine-learning-algorithms/ “Parametric and Nonparametric Machine Learning Algorithms”)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【技术必备】解读 2016 年十大机器学习算法及其应用
【新智元导读】 机器学习领域都有哪些常用算法?本文带来盘点。 毫无疑问,过去两年中,机器学习和人工智能的普及度得到了大幅提升。 如果你想学习机器算法,要从何下手呢?以我为例,我是在哥本哈根留学期间,学习AI课程入门的。我们用的教科书是一本AI经典:《Peter Norvig’s Artificial Intelligence — A Modern Approach》。最近我在继续学习这些,包括在旧金山听了几个关于深度学习的技术演讲,参加机器学习大会上。六月份,我注册了Udacity的Intro to Mac
新智元
2018/03/26
6720
【技术必备】解读 2016 年十大机器学习算法及其应用
机器学习算法梳理
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,国内大点的公司里百度,阿里,腾讯,网易,搜狐,华为(华为的岗位基本都是随机分配,机器学习等岗位基本面向的是博士)等会有相关职位
IT派
2018/03/29
9710
机器学习算法梳理
机器学习工程师必知的十大算法
作者 James Le ,译者 尚剑 毫无疑问,机器学习/人工智能的子领域在过去几年越来越受欢迎。目前大数据在科技行业已经炙手可热,而基于大量数据来进行预测或者得出建议的机器学习无疑是非常强大的。一些最常见的机器学习例子,比如Netflix的算法可以根据你以前看过的电影来进行电影推荐,而Amazon的算法则可以根据你以前买过的书来推荐书籍。 所以如果你想了解更多有关机器学习的内容,那么你该如何入门?对于我来说,我的入门课程是我在哥本哈根出国留学时参加的人工智能课。当时我的讲师是丹麦技术大学(Technica
刀刀老高
2018/04/10
7690
机器学习工程师必知的十大算法
机器学习算法一览
引言 提起笔来写这篇博客,突然有点愧疚和尴尬。愧疚的是,工作杂事多,加之懒癌严重,导致这个系列一直没有更新,向关注该系列的同学们道个歉。尴尬的是,按理说,机器学习介绍与算法一览应该放在最前面写,详细的应用建议应该在讲完机器学习常用算法之后写,突然莫名奇妙在中间插播这么一篇,好像有点打乱主线。 老话说『亡羊补牢,为时未晚』,前面开头忘讲的东西,咱在这块儿补上。我们先带着大家过一遍传统机器学习算法,基本思想和用途。把问题解决思路和方法应用建议提前到这里的想法也很简单,希望能提前给大家一些小建议,对于某些容易出错
CDA数据分析师
2018/02/05
8790
机器学习算法一览
机器学习算法总结(面试用到)
找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。   纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,国内大点的公司里百度,阿里,腾讯,网易,搜狐,华为(华为的岗位基本都是随机分配,机器学习等岗位基本面向的是博士)等会有相关职位,另
陆勤_数据人网
2018/02/26
2.8K0
机器学习算法总结(面试用到)
机器学习算法总结(面试用到)
找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。   下面是在找机器学习岗位工作时,总结的常见机器学习算法(主要是一些常规分类器)大概流程和主要思想,希望对大家找机器学习岗位时有点帮助。 实际上在面试过程中,懂这些算法的基本思
机器学习AI算法工程
2018/03/14
1.1K0
机器学习算法总结(面试用到)
常见面试之机器学习算法思想简单梳理
导语:今天小编从别的地方推送一篇更广泛的文章供你们学习参考,总结的常见机器学习算法(主要是一些常规分类器)大概流程和主要思想,希望对大家找机器学习岗位时有点帮助。 前言 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招
IT派
2018/03/29
6510
常见面试之机器学习算法思想简单梳理
【干货】机器学习工程师必须知道的十个算法
【新智元导读】机器学习算法可以分为三个大类:监督学习、无监督学习、强化学习。监督学习对于有属性(标记)的特定数据集(训练集)是非常有效的。无监督学习对于在给定未标记的数据集(目标没有提前指定)上发现潜在关系是非常有用的。强化学习介于这两者之间——它针对每次预测步骤(或行动)会有某种形式的反馈,但是没有明确的标记或者错误信息。本文主要介绍有关监督学习和无监督学习的10种算法。 机器学习作为人工智能的一个子领域,在过去几年里无疑越来越受欢迎。大数据目前在科技行业是最热门的潮流,而机器学习在基于大量数据之上做出预
新智元
2018/03/23
6460
机器学习系列 | 十种机器学习算法的要点(含代码)
上个月瞅了眼之前写的这个系列的两篇文章,感觉自己写的东西有点烂,于是打算重新来过,无奈时间精力有限,因此打算寒假期间再重新开始写这个系列。然后这里想分享一篇机器学习相关的好文,原文链接如下:
1480
2019/08/05
9390
机器学习系列 | 十种机器学习算法的要点(含代码)
机器学习算法再比较
原文地址:http://www.csuldw.com/2016/02/26/2016-02-26-choosing-a-machine-learning-classifier/ 本文主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如
IT派
2018/03/29
6290
机器学习算法再比较
干货 | 从零开始入门机器学习算法实践
人工智能热潮下,“大数据”、“机器学习”、“深度学习”热词屡见不鲜,但是想要真正掌握核心技术,势必要对机器学习算法有全面理解,这也是深入机器学习的必经之路。 为了让大家深入理解机器学习原理,11月22号,AI研习社邀请了日本名古屋大学陈安宁博士为大家奉上《从零开始入门机器学习算法实践》公开课,帮助大家对模型选择以及对数据分析有更全面理解,以提高在实际工作中选择算法的能力。 今天小编就带大家一起来回顾本节课程中陈博士分享的精彩内容。 浅谈机器学习 首先跟大家谈一下最近非常火热的几个名词:人工智能、机器学习
AI科技评论
2018/03/14
1.1K0
干货 | 从零开始入门机器学习算法实践
学界 | 机器学习十大算法都是何方神圣?看完你就懂了
AI科技评论按:机器学习与人工智能变得越来越热。大数据原本在工业界中就已经炙手可热,而基于大数据的机器学习则更加流行,因为其通过对数据的计算,可以实现数据预测、为公司提供决策依据。跟我们生活息息相关的最常见机器学习算法包括电影推荐算法、图书推荐算法。这些算法都是基于你的电影观看记录或图书购买记录来给你做推荐的。 James Le 在 KDnuggets 上发布了一篇文章,介绍了他是如何入门机器学习的。此外,他在其中摸索出十大常用的机器学习算法,并逐一进行介绍。AI科技评论编译如下,未经许可不得转载。 如果你
AI科技评论
2018/03/09
6630
学界 | 机器学习十大算法都是何方神圣?看完你就懂了
【陆勤践行】面试之机器学习算法思想简单梳理
找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,国内大点的公司里百度,阿里,腾讯,网易,搜狐,华为(华为的岗位基本都是随机分配,机器学习等岗位基本面向的是博士)等会有相关职位,另外一
陆勤_数据人网
2018/02/26
8610
【陆勤践行】面试之机器学习算法思想简单梳理
常见面试之机器学习算法思想简单梳理
前言:   找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。   纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,国内大点的公司里百度,阿里,腾讯,网易,搜狐,华为(华为的岗位基本都是随机分配,机器学习等岗位基本面向的是博士)等会有
小莹莹
2018/04/20
7010
常见面试之机器学习算法思想简单梳理
机器学习算法集锦
摘要: 机器学习 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 机器学习 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改
用户1332428
2018/03/07
7290
机器学习算法集锦
入门 | 从概念到案例:初学者须知的十大机器学习算法
选自kdnuggets 作者:Reena Shaw、KDnuggets 机器之心编译 参与:Nurhachu Null、黄小天 本文先为初学者介绍了必知的十大机器学习(ML)算法,并且我们通过一些图解和实例生动地解释这些基本机器学习的概念。我们希望本文能为理解机器学习基本算法提供简单易读的入门概念。 机器学习模型 在《哈佛商业评论》发表「数据科学家是 21 世纪最性感的职业」之后,机器学习的研究广受关注。所以,对于初入机器学习领域的学习者,我们放出来一篇颇受欢迎的博文——《初学者必知的十大机器学习算法》,尽
机器之心
2018/05/10
6270
机器学习算法优缺点对比及选择(汇总篇)
本文的目的,是务实、简洁地盘点一番当前机器学习算法。文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将对此模型优缺点及选择详加讨论。
Ai学习的老章
2019/07/15
1.3K0
机器学习算法优缺点对比及选择(汇总篇)
机器学习算法之旅
在这篇文章中, 我们将介绍最流行的机器学习算法.
花落花飞去
2018/02/23
1.5K0
机器学习算法之旅
【算法面经】:机器学习面试算法梳理
机器学习算法面试一直是大家比较苦恼的事情,各种算法经常弄混,或者无法透彻理解。分享一篇非常好的机器学习算法面试干货总结,梳理算法原理,优缺点。
Python数据科学
2018/12/14
4830
机器学习十大热门算法
机器学习是该行业的一个创新且重要的领域。我们为机器学习程序选择的算法类型,取决于我们想要实现的目标。
算法进阶
2022/06/02
5700
机器学习十大热门算法
相关推荐
【技术必备】解读 2016 年十大机器学习算法及其应用
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档