Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习中的参数与非参数方法

机器学习中的参数与非参数方法

作者头像
deephub
发布于 2021-10-09 08:32:56
发布于 2021-10-09 08:32:56
2.1K0
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

介绍

在我们的以前文章中介绍过统计学习中预测和推理之间的区别。尽管这两种方法的主要区别在于最终目标,但我们都需要估计一个未知函数f。

换句话说,我们需要学习一个将输入(即自变量X的集合)映射到输出(即目标变量Y)的函数,如下图所示。

Y = f(X) + ε

为了估计未知函数,我们需要在数据上拟合一个模型。我们试图估计的函数的形式通常是未知的,因此我们可能不得不应用不同的模型来得到它,或者对函数f的形式做出一些假设。一般来说,这个过程可以是参数化的,也可以是非参数化的。

在今天的文章中,我们将讨论机器学习背景下的参数和非参数方法。此外,我们将探讨它们的主要差异以及它们的主要优点和缺点。

参数化方法

在参数化方法中,我们通常对函数f的形式做一个假设。例如,你可以假设未知函数f是线性的。换句话说,我们假设函数是这样的。

f(X) = β₀ + β₁ X₁ + … + βₚ Xₚ

其中f(X)为待估计的未知函数,β为待学习的系数,p为自变量个数,X为相应的输入。

既然我们已经对要估计的函数的形式做出了假设,并选择了符合这个假设的模型,那么我们需要一个学习过程,这个学习过程最终将帮助我们训练模型并估计系数。

机器学习中的参数化方法通常采用基于模型的方法,我们对要估计的函数的形式做出假设,然后根据这个假设选择合适的模型来估计参数集。

参数化方法最大的缺点是,我们所做的假设可能并不总是正确的。例如,你可以假设函数的形式是线性的,但实际上它并不是。因此这些方法涉及较不灵活的算法,通常用于解决一些不复杂的问题。

参数化方法速度非常快,而且它们需要的数据也少得多(更多相关内容将在下一节中介绍)。此外,由于参数化方法虽然不太灵活但是因为基于我们做出的假设,所以它们更容易解释。

机器学习中的参数化方法包括线性判别分析、朴素贝叶斯和感知器。

非参数方法

一般来说非参数方法指的是对于要估计的函数的形式不做任何潜在的假设的一组算法。由于没有做任何假设,这种方法可以估计未知函数f的任何形式。

非参数方法往往更精确,因为它们寻求最佳拟合数据点。但是这是以需要进行大量的观测为代价的(这些观测是精确估计未知函数f所必需的)。并且这些方法在训练模型时往往效率较低。另外的一个问题是,非参数方法有时可能会引入过拟合,因为由于这些算法更灵活,它们有时可能会以无法很好地泛化到新的、看不见的数据点的方式学习错误和噪声。

非参数方法非常灵活,因为没有对底层函数做出任何假设,所以可以带来更好的模型性能。

机器学习中一些非参数方法的例子包括支持向量机和kNN。

总结

在今天的文章中,我们讨论了机器学习背景下的参数化和非参数化方法以及它们的优点和缺点。

参数方法往往不太灵活和准确,但更具可解释性,而非参数方法往往更灵活(因此适用于更复杂的问题)和准确但可解释性较差。

尽管参数方法不太灵活并且有时不太准确,但它们在许多用例中仍然有用,因为在更简单的问题中使用非常灵活的非参数方法可能会导致过度拟合。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
《机器学习核心算法》四、逻辑回归:对数几率解释与极大似然估计推导
大家好!今天我们一起来学习逻辑回归:对数几率与极大似然估计,这是机器学习中一个非常重要且实用的算法。虽然名字里有“回归”,但它实际上是用来解决分类问题的,特别是二元分类问题。想象一下,你需要判断一封邮件是不是垃圾邮件,或者预测一个客户是否会流失,逻辑回归就能派上大用场。它简单、高效,而且结果容易解释,所以在各个领域都很受欢迎。
javpower
2025/05/30
1720
《机器学习核心算法》四、逻辑回归:对数几率解释与极大似然估计推导
写给人类的机器学习 2.1 监督学习
通过在数字广告上花费更多的钱,我们能挣多少钱?这个贷款的申请人是否能偿还贷款?股市明天会发生什么?
ApacheCN_飞龙
2022/12/01
3240
写给人类的机器学习 2.1 监督学习
ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策
今天为大家介绍的是来自卡内基·梅隆大学的Eric P. Xing团队的一篇论文。可解释策略学习旨在从观察到的行为中估计可理解的决策策略;然而,现有模型在准确性和可解释性之间存在权衡,这限制了基于数据的人类决策过程的解释。从根本上说,现有方法之所以受到这一权衡的困扰,是因为它们将底层决策过程表示为一个通用策略,而实际上人类决策是动态的,可以在不同情境下发生显著变化。因此,作者开发了情境化策略恢复(CPR),将复杂决策过程的建模问题重新定义为一个多任务学习问题,每个情境代表一个独特的任务,可以通过多个简单的情境特定策略逐步构建复杂的决策策略。CPR将每个情境特定策略建模为一个线性映射,并随着新的观测数据的加入生成新的策略模型。作者提供了两种CPR框架的实现方式:一种侧重于精确的局部可解释性,另一种保留了完整的全局可解释性。作者通过模拟数据和实际数据进行了评估,在预测重症监护病房中的抗生素处方和预测阿尔茨海默症患者的MRI处方方面,达到了最先进的性能。通过这一改进,CPR弥合了可解释方法和黑箱方法之间的准确性差距,允许对情境特定决策模型进行高分辨率的探索和分析。
DrugAI
2024/07/16
1630
ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策
【机器学习】参数和非参数机器学习算法
什么是参数机器学习算法并且它与非参数机器学习算法有什么不同? 本文中你将了解到参数和非参数机器学习算法的区别。 让我们开始吧。 学习函数 机器学习可以总结为学习一个函数(f)(f),其将输入变量(X
陆勤_数据人网
2018/02/28
1.5K0
【机器学习】参数和非参数机器学习算法
系统总结!机器学习的模型!
大家好,我是花哥,前面的文章我们介绍了人工智能、机器学习、深度学习的区别与联系,指出了如今的人工智能技术基本上就是指机器学习。
算法进阶
2024/02/18
1.4K0
系统总结!机器学习的模型!
拯救数据科学的“半贝叶斯人”
一位科学家在他的论文中写道:"人类知识的大部分是围绕因果关系而不是概率关系组织的,而概率微积分的语法并不足以描述这些关系......正因如此,我认为自己只是半个贝叶斯人"。
大数据文摘
2019/08/08
5030
拯救数据科学的“半贝叶斯人”
深入解析机器学习算法
机器学习已经成为当今技术进步的核心推动力量,推动了众多行业的创新。其背后依赖的是各种各样的算法,帮助计算机通过从数据中学习来完成任务。这篇文章将对常见的几类机器学习算法进行深入探讨,帮助你理解其工作原理、应用场景以及各自的优势和局限。
用户11295429
2024/10/31
2160
机器学习各类算法比较
导语:机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(accuracy)的话,最好的方法就是通过交叉验证(cross-validation)对各个算法一个个地进行测试,进行比较,然后调整参数确保每个算法达到最优解,最后选择最好的一个。但是如果你只是在寻找一个“足够
IT派
2018/03/29
8390
机器学习各类算法比较
回归算法全解析!一文读懂机器学习中的回归模型
回归问题是机器学习领域中最古老、最基础,同时也是最广泛应用的问题之一。无论是在金融、医疗、零售还是自然科学中,回归模型都扮演着至关重要的角色。简单地说,回归分析旨在建立一个模型,通过这个模型我们可以用一组特征(自变量)来预测一个连续的结果(因变量)。例如,用房间面积、位置等特征来预测房价。
TechLead
2023/10/21
3.4K0
回归算法全解析!一文读懂机器学习中的回归模型
机器学习算法中的概率方法
AI 科技评论按,本文作者张皓,目前为南京大学计算机系机器学习与数据挖掘所(LAMDA)硕士生,研究方向为计算机视觉和机器学习,特别是视觉识别和深度学习。
AI科技评论
2019/10/31
1.4K0
机器学习算法中的概率方法
写给人类的机器学习 2.3 监督学习 III
我们目前为止涉及的方法,线性回归,对率回归和 SVM ,它们的模型形式是预定义的。与之相反,非参数学习器事先没有特定的模型结构。在训练模型之前,我们不会推测我们尝试习得的函数f的形式,就像之前的线性回归那样。反之,模型结构纯粹由数据定义。
ApacheCN_飞龙
2022/12/01
3770
写给人类的机器学习 2.3 监督学习 III
常见机器学习算法背后的数学
机器学习算法是这样设计的,它们从经验中学习,当它们获取越来越多的数据时,性能就会提高。每种算法都有自己学习和预测数据的方法。在本文中,我们将介绍一些机器学习算法的功能,以及在这些算法中实现的有助于学习过程的一些数学方程。
deephub
2020/08/11
7480
常见机器学习算法背后的数学
AGU专著|云和气候的机器学习
本文是AGU专著《Clouds and Climate》其中的一章:《Machine Learning for Clouds and Climate》。文章详细的介绍了机器学习在云和气候方面的应用、当前所面临的问题及未来的发展前景。对于了解机器学习在云和气候方面的应用研究而言是一篇很好的概述类文章。
bugsuse
2022/08/24
7200
AGU专著|云和气候的机器学习
当今最火10大统计算法,你用过几个?
为什么学习统计学习?理解不同技术背后的理念非常重要,它可以帮助你了解如何使用以及什么时候使用。同时,准确评估一种方法的性能也非常重要,因为它能告诉我们某种方法在特定问题上的表现。此外,统计学习也是一个
企鹅号小编
2017/12/27
6.4K0
当今最火10大统计算法,你用过几个?
数据科学家必会10个统计分析方法(附学习资源)
无论你在数据科学中是何种立场,你都无法忽视数据的重要性,数据科学家的职责就是分析、组织和应用这些数据。
IT阅读排行榜
2018/08/16
7370
推荐算法背后的机器学习技术
机器学习是一种利用统计和其他数学理论给予计算机学习能力的方法。机器学习和统计其实都有相同的目标:从数据中学习知识。但是具体的手段和理念有所不同。机器学习是计算机科学的一个分支,侧重的是从数据中建立有机的系统,而不是用目的很明显的规则去编程。而统计学是数学的一个分支,侧重的是用数学公式建立变量之间的联系。近年来,随着计算机硬件成本的不断降低和数据量的极大增加,数据科学家得以充分利用机器学习手段来分析和挖掘数据。另一方面,统计建模技术则早在计算机问世前就已经存在。
张小磊
2022/10/31
5710
【干货】机器学习中的五种回归模型及其优缺点
【导读】近日,机器学习工程师 George Seif 撰写了一篇探讨回归模型的不同方法以及其优缺点。回归是用于建模和分析变量之间关系的一种技术,常用来处理预测问题。博文介绍了常见的五种回归算法和各自的特点,其中不仅包括常见的线性回归和多项式回归,而且还介绍了能用于高维度和多重共线性的情况的Ridge回归、Lasso回归、ElasticNet回归,了解它们各自的优缺点能帮助我们在实际应用中选择合适的方法。 编译 | 专知 参与 | Yingying 五种回归模型及其优缺点 线性和逻辑斯蒂(Logistic)回
WZEARW
2018/04/08
9.5K0
【干货】机器学习中的五种回归模型及其优缺点
【技术分享】机器学习模型可解释性
模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总survey。
腾讯云TI平台
2019/10/18
3.8K0
机器学习中的正则化
训练机器学习模型的主要方面之一是避免过度拟合。如果模型过于拟合,则模型的准确性会较低。发生这种情况是因为您的模型过于努力地捕获训练数据集中的噪声。噪声是指数据点并不能真正代表数据的真实属性,而是随机的机会。学习此类数据点,会使您的模型更加灵活,存在过度拟合的风险。
计算机与AI
2020/12/14
7930
机器学习中的正则化
机器学习回归模型的最全总结!
回归分析为许多机器学习算法提供了坚实的基础。在这篇文章中,我们将介绍回归分析概念、7种重要的回归模型、10 个重要的回归问题和5个评价指标。
算法进阶
2023/09/21
2K0
机器学习回归模型的最全总结!
相关推荐
《机器学习核心算法》四、逻辑回归:对数几率解释与极大似然估计推导
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档