前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >为什么刷题想得越多,考得反而越差?---过拟合现象带来的思考和启迪

为什么刷题想得越多,考得反而越差?---过拟合现象带来的思考和启迪

作者头像
阑梦清川
发布2025-02-24 23:29:52
发布2025-02-24 23:29:52
590
举报
文章被收录于专栏:学习成长指南学习成长指南

1.声明

这个系列的文章用来记录学习这个漫士沉思录(b站知名up主)的相关的科普视频,后续可能会有这个领域的其他的博主,例如乐天垂星之类的,这个是本专栏视频的来源,若有侵权,请联系删除;

下面的文章里面的引用的内容来自于这个视频里面的截取,非本人的原创~~;

今天是我正式认识了这个漫士沉思录up,之前学习的那个manim视频里面是有这个up联合创作的,但是当时并没有在意他,但是今天的这个视频我觉得做得很好,让我受益颇多,很有启发意义;

2.开篇

下面的这个既是开篇,也是这个视频的启迪意义所在,看完整个视频,我对于这句话才有了更加深刻的理解;我强烈建议大家前去观看原版视频,必看文章的效果更好;

image-20250119164413952
image-20250119164413952

3.问题的引入

其实这个题目就是数学建模里面的回归分析,如何进行拟合,这个优度怎么样:

下面的这个是使用的一次函数多项式进行拟合的这个情况;

image-20250119195138965
image-20250119195138965

下面的是使用的抛物线进行拟合的情况:

image-20250119195332722
image-20250119195332722

下面的是使用三次多项式进行拟合:

image-20250119195224353
image-20250119195224353

下面的是使用的11次的多项式进行拟合的效果,可以看到在 这个情况下,我们的这个曲线是经过了所有的点的;

image-20250119195404020
image-20250119195404020

4.总结

1)我们可以看到这个欠拟合和过拟合,欠拟合的时候,这个得到的规律并不是很好,因为有些点的这个偏离的程度比较远,但是这个过拟合同样不好,因为我们的这个数据是存在波动的;

2)噪声:就是我们的数据集是12个月份对应的温度,并不是每一年的这个对应的月份都是一个温度,而是在一个范围里面进行波动,这个情况就是我们说的这个噪声;

image-20250119202719233
image-20250119202719233

3)这个过拟合的情况下,最高项次数是11,为什么会是这个数字呢,因为我们有12个数据,可以唯一确定一个11次的多项式,这个实际上就是拉格朗日插值法的运用,但是他过拟合就是因为他根本不会考虑这个噪声,而是找到一个完美经过每一个点的这个曲线即可;

4)下面的这个就是我们的系数值:可以看到这个数值很大,这个就是因为我们的这个11次的多项式想要非常精确的解释这个里面用到的点,所以很容易受到这个数据的影响,只要我们稍微改变这个数据集,这个对应的系数就会很敏感的发生变化;

image-20250119203222288
image-20250119203222288

5)左右两个对比可以发现,都是小于c的,这个c就是我们的这个误差的一个检验的指标,只要再这个允许的范围里面就可以; 但是可能我们的11次的就是误差为0,但是我们的普通的拟合虽然有误差,但是这个误差我们是可以接受的,而且这个普通的拟合考虑了这个噪声的影响,反而进行预测的效果会更好;

image-20250119203439585
image-20250119203439585

6)经典题目:就是我们小学的时候经常写的这个题目,现在你就可以知道,这个题目的答案不唯一,因为我们可以填上任意一个数字,根据这几个数字求解一个多项式满足这个题目;

可能10年前,我们会不假思索的给出答案9,但是现在我们可以给出来很多个答案,并且根据这个拉格朗日的插值原理进行解释,当我看到这里的时候,确实很感慨;

image-20250119203459396
image-20250119203459396

5.正则化的思想解释

这个单词的前半部分是我们熟悉的这个regular,实际上因为这个翻译的原因,我们可能看不出来这个真正的意思,但是当回归英文这种地道的表达的时候,就会很容易理解了些;

regular实际上就是普通的意思,对于这个模型而言,就是让这个模型普通一些,不要过于的复杂,因为过于复杂反而会适得其反,效果不是很好,所以我们的先贤早就告诉我们:大道至简;

image-20250119204055984
image-20250119204055984

6.奥卡姆剃刀原理

image-20250119204127369
image-20250119204127369

7.对于刷题现象的解释

为什么很多人刷题刷的太多,反而考试考的很差呢?

本质上就是他们的解题思维,严重过拟合到了练习题和模拟题上过拟合。说白了呀就是过分的穿凿,看到一点点相关类似的细节,就脑补了很多复杂的逻辑,使用一套非常复杂的方法来解决问题和给出答案。这就导致他们在过分的追求把练习题和模拟题都做全对。

在这个硬钻牛角尖的过程当中啊,把很多练习题里不严谨不合理的那些部分都当成了自己解题思维不可分割的一块这儿这样反而使得他们走火入魔。

8对于现实生活的指导意义

在现实生活中也有很多生动的过拟合的例子。比如说星座,你看那几个点的连线,就构想出大量复杂的细节,这就是标准的过拟合。

image-20250119210051527
image-20250119210051527

再比如,我们的视觉系统对于人脸也有过拟合,只要看到的特征稍微有那些相似,你的大大脑就会因过过拟强烈的认为这有这是一张脸。有人脸特征;

image-20250119210122003
image-20250119210122003

9.思考和启迪

总而言之,深理解解过拟合,在追求理解世界的道路上,你就拥有了一种重要的警惕。因此,千万不要追求那种所谓的什么,一切都是历史的必然。这样的说法,用一套看似言之凿凿的理论,解释过去。这就像某些人自以为是,自以为理解一切,说一切都在自己的解释之中的油腻中年人一样,其实就是在用一套过拟合的函数。马后炮的解释过去的数据而已。而你一旦将这套理论论于预预测未来,往往过错的离谱,学而不思则欠拟合,思而不学则过拟合。

不要迷恋过分复杂的理论模型,不要苛求完美的解释,一切允许你的理论有些误差,是通往真理必要的代价。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-01-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.声明
  • 2.开篇
  • 3.问题的引入
  • 4.总结
  • 5.正则化的思想解释
  • 6.奥卡姆剃刀原理
  • 7.对于刷题现象的解释
  • 8对于现实生活的指导意义
  • 9.思考和启迪
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档