前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >经验风险、结构风险、正则项

经验风险、结构风险、正则项

作者头像
张凝可
发布于 2019-08-21 14:55:12
发布于 2019-08-21 14:55:12
1.1K0
举报
文章被收录于专栏:技术圈技术圈

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/qq_27717921/article/details/78163514

我们所学习到的所有的学习模型都会有一个共同的优化目标:

其中,

称为“结构风险”描述的是模型f的某些性质。

是经验风险,描述的是模型与训练数据的契合程度,C用于对二者进行折中。

经验风险

经验风险针对不同的学习模型有不同的计算方法。 平方损失–线性回归

0-1逻辑损失–逻辑回归

hinge损失–支持向量机

指数损失–AdaBoost

结构风险

又被称为正则化项,C被称为正则化常数,Lp范数是常用正则化项。 正则化项主要是在降低经验风险的同时能够降低最小化训练误差的过拟合风险。过拟合问题主要是提高模型的泛化能力,模型越复杂的时候,对于训练集的偏差会很小,但是在测试集时会导致偏差很大,从而整个模型不能适应新的样本,模型越复杂,模型的方差越大,过拟合现象越严重。 为什么会出现模型不能适应新的样本呢? 特征有成千上万,如果都去拟合的话,就会出现过拟合。

L1范数–LASSO: L1范数表示向量中每个元素绝对值的和:

L1范数的解通常是稀疏性的,倾向于选择数目较少的一些非常大的值或者数目较多的insignificant的小值。 采用L1 regularizer,它的优良性质是能产生稀疏性,导致 W 中许多项变成零。 L2 范数–ridge regression: L2范数即欧氏距离

采用L2 regularizer,使得模型的解偏向于 norm 较小的 W,通过限制 W 的 norm 的大小实现了对模型空间的限制,从而在一定程度上避免了 overfitting 。不过 ridge regression 并不具有产生稀疏解的能力,得到的系数 仍然需要数据中的所有特征才能计算预测结果,从计算量上来说并没有得到改观.

总结

L2范数倾向与w的分量取值尽量均衡,即非零分量个数尽量稠密。而L0范数和L1范数则倾向于w的分量尽量稀疏,即非零分量个数尽量少。 L1范数和L2范数正则化都有助于降低过拟合风险,L1范数比L2范数更容易获得稀疏解,求得的解w会有更少的非零分量。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年10月05日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【linux命令讲解大全】112.Linux 系统管理工具:dpkg-statoverride 和 dstat 的使用介绍
dpkg-statoverride 命令用于在 Debian Linux 中覆盖文件的所有权和模式,使得在安装软件包时文件的所有权和模式失效。
全栈若城
2024/03/02
1560
每天学一个 Linux 命令(103):dstat
dstat 命令是一个用来替换 vmstat、iostat、netstat、nfsstat 和 ifstat 这些命令的工具,通用的系统资源统计工具,是一个全能系统信息统计工具。
民工哥
2021/04/21
5570
dstat
官方对dstat的定义为:多功能系统资源统计生成工具( versatile tool for generating system resource statistics)。在获取的信息上有点类似于top、free、iostat、vmstat等多个工具的合集,官方解释为vmstat、iostat、ifstat等工具的多功能替代品,且添加了许多额外的功能(Dstat is a versatile replacement for vmstat, iostat and ifstat. Dstat overcomes some of the limitations and adds some extra features.);其结果可以保持到csv文件,使用脚本或第三方工具对性能进行分析利用(如通过监控平台监控,也可以保持到数据库)。
胡齐
2019/09/23
1.3K0
dstat使用[通俗易懂]
http://dag.wieers.com/rpm/packages/dstat
全栈程序员站长
2022/07/02
4280
dstat用法
监控CPU\MEN: dstat --top-mem --top-io --top-cpu 常用常规监控:dstat -cmsdnl -D sda1 -N lo,ens33 100 5
用户5760343
2022/05/23
5210
dstat用法
Python 监控linux之dstat
根据官方文档的介绍,dstat是一个用Python语言实现的多功能系统资源统计工具,用来取代Linux下的vmstat、iostat、netstat和ifstat等命令。并且,dstat克服了这些命令的限制,增加了额外的功能,以及更多的计数器与更好的灵活性。dstat可以在一个界面上展示非常全面的监控信息,因此,在系统监控、基准测试和故障排查等应用场景下特别有用。
全栈程序员站长
2022/09/07
8500
Python 监控linux之dstat
dstat命令详解
直接使用 dstat命令可以实时的监控 cpu、磁盘、网络、IO、内存等使用情况。
逍遥子大表哥
2021/12/19
3.2K0
dstat命令详解
一天一个 Linux 命令(39):dstat 命令
本文为joshua317原创文章,转载请注明:转载自joshua317博客 https://www.joshua317.com/article/194
joshua317
2021/11/15
4050
Linux系统监控常用命令
Monitorix 是一个尽可能多的在 Linux/Unix 上一个轻量级监控工具,主要设计是监控正在运行的系统和网络资源。它有一个内置的 HTTP web 服务去定期收集系统和网络信息并显示成图片。它可以监视系统的平均负载使用、内存的分配、磁盘驱动器、系统服务、网络端口、邮件统计(Sendmail、Postfix、Dovecot 等等)、MYSQL 数据库等等更多的服务。它的主要目的是监控整个系统的性能,并且有助于监测故障、瓶颈、异常活动等状况。
十毛
2019/03/27
1.5K0
Linux系统监控常用命令
linux下流量分析工具
在日常的运维工作中,我们经常需要去关注网卡流量的使用情况,看是否处于正常的使用范围内,如果入网或者出网有异常升高或者降低,我们都要及早的去发现,来进行评估是否处于异常状态,而去发现这个异常,就需要我们熟悉常用的流量分析查看工具,例如我们这里要讲的六大工具(不分排名先后)
dogfei
2020/07/31
4.5K0
linux下流量分析工具
Linux 常用命令(二)
Linux是一套免费使用和自由传播的类Unix操作系统(主要用在服务器上),接下来详细的介绍一下linux的一些知识。
小徐
2018/09/21
2.3K0
Linux 常用命令(二)
CentOS 7上的性能监控工具 原
Linux中基于命令行的性能监控工具:dstat、top、netstat、vmstat、htop、ss、glances
拓荒者
2019/03/11
4.3K0
CentOS 7上的性能监控工具
                                                                            原
运维工程师必备的18个网络带宽监控常用命令
本文介绍了一些可以用来监控网络使用情况的Linux命令行工具。这些工具可以监控通过网络接口传输的数据,并测量目前哪些数据所传输的速度。入站流量和出站流量分开来显示。 一些命令可以显示单个进程所使用的带宽。这样一来,用户很容易发现过度使用网络带宽的某个进程。 这些工具使用不同的机制来制作流量报告。nload等一些工具可以读取"proc/net/dev"文件,以获得流量统计信息;而一些工具使用pcap库来捕获所有数据包,然后计算总数据量,从而估计流量负载。 下面是按功能划分的命令名称。 监控总体带宽使用―
小小科
2018/05/02
2K0
运维工程师必备的18个网络带宽监控常用命令
Linux磁盘监控工具说明
一、系统自带 1.1 iostat 系统systat包里的工具,以kB/s为单位统计,2表示以2秒为频率统计一次: iostat –x –k 2 10000 rrqm/s:每秒这个设备相关的读取请求
小小科
2018/06/20
4.6K0
25-性能分析命令
memory:「swpd」 显示多少块被换出磁盘,「free」显示剩下的空闲块,「buff」正在被作用缓冲区的块,「cache」正在被用作操作系统的缓存
zx钟
2021/07/06
7550
Linux服务器dstat系统监控工具
dstat 是一个可以取代vmstat,iostat,netstat和ifstat这些命令的多功能产品。dstat克服了这些命令的局限并增加了一些另外的功能,增加了监控项,也变得更灵活了。dstat可以很方便监控系统运行状况并用于基准测试和排除故障。
子润先生
2021/07/09
1.6K0
LINUX下查看CPU使用率的命令
今天就来好好学习下Linux下如何查看CUP的使用率: 监控CPU的性能一般包括以下3点:运行队列、CPU使用率和上下文切换。 对于每一个CPU来说运行队列最好不要超过3,例如,如果是双核CPU就不要超过6。如果队列长期保持在3以上,说明任何一个进程运行时都不能马上得到cpu的响应,这时可能需要考虑升级cpu。另外满负荷运行cpu的使用率最好是user空间保持在65%~70%,system空间保持在30%,空闲保持在0%~5% 。
软测小生
2019/07/05
50.5K0
LINUX下查看CPU使用率的命令
技能篇:开发必备linux命令大全-稳赚不亏
我们的服务一般都是在linux系统运行,因此了解一些关于linux命令是必须。接下来将一一详细介绍一些常用的linux的命令
潜行前行
2021/08/20
4.5K0
技能篇:开发必备linux命令大全-稳赚不亏
用 SQL查 Linux日志
它将普通文件或者结果集当作数据库表,几乎支持所有的SQL结构,如WHERE、GROUP BY、JOINS等,支持自动列名和列类型检测,支持跨文件连接查询,这两个后边详细介绍,支持多种编码。
用户7639835
2021/09/01
2K0
Linux终端下 dstat 监控工具
dstat 是一个可以取代vmstat,iostat,netstat和ifstat这些命令的多功能产品。dstat克服了这些命令的局限并增加了一些另外的功能,增加了监控项,也变得更灵活了。dstat可以很方便监控系统运行状况并用于基准测试和排除故障。
小小工匠
2021/08/16
8600
相关推荐
【linux命令讲解大全】112.Linux 系统管理工具:dpkg-statoverride 和 dstat 的使用介绍
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档