Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python爬取42年高考数据,告诉你高考为什么这么难?

Python爬取42年高考数据,告诉你高考为什么这么难?

作者头像
IT阅读排行榜
发布于 2019-06-12 13:08:33
发布于 2019-06-12 13:08:33
1.4K00
代码可运行
举报
文章被收录于专栏:华章科技华章科技
运行总次数:0
代码可运行

导读:对于像作者一样已经工作的“上班族”来说,6月7号到9号三天无疑是兴奋到飞起的,终于迎来了令人愉悦的端午假期。

然而有那么一群人,将在端午节日之际迎来人生特别重要的一次经历或者说是挑战,那就是高考生们。高考的重要性无须赘述,今天我们就来聊聊那些年我们一起经历的高考

作者:徐麟

来源:数据森麟(ID:shujusenlin)

然而有那么一群人,将在端午节日之际迎来人生特别重要的一次经历或者说是挑战,那就是高考生们。高考的重要性无须赘述,今天我们就来聊聊那些年我们一起经历的高考

01 历年录取率

可能很多经历过高考的人都不知道高考的全称,高考实际上是普通高等学校招生全国统一考试的简称。从1977年国家恢复高考制度至今,高考经历了许多的改革,其中最为显著的变化就是录取率的显著提升,曾经的“千军万马过独木桥”的场景得到了一定程度的缓解。

我们首先看下1977-2018年历年的录取人数和未录取(落榜)人数变化情况,本文数据均来自于网络公开高考数据

可以看到1977年恢复高考之后的几年,由于种种原因,高考人数到达了一个比较高的点,随后有所下降。到2000年之后,高考的人数有了进一步的提升,录取人数也随之大幅提升,2008、2009达到了顶峰(此时心疼自己1秒),2010年之后参与高考的人数趋于平稳。

通过上图也可以发现,早期的高考难度之高,未录取人数是录取人数的数倍之多,而且早期的高考实际上在开始之前有预选的过程,能够参加高考的考生实际上已经经过了一轮大浪淘沙的过程。随着教育改革,越来越多的考生有机会通过高考接受更进一步的教育。

我们通过下面的百分比图,对于录取率的变化进一步加深认知:

看到这不禁对老爸发出由衷的赞叹,作者参与高考时的录取率已经是老爸参加时的数倍之多,相较于老爸那个时候的“千军万马过独木桥”,作者过的独木桥已经要宽敞了好多。

部分代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
setwd('D:/爬虫/高考')
data = read_excel('历年录取率.xlsx')
data_year = melt(data,id.vars = '年份',measure.vars = c('录取','未录取'),
variable.name='录取情况', value.name='人数(万)')
ggplot(data_year,aes(x=年份,y=`人数(万)`,fill=录取情况))+
      geom_area(position = 'stack')+
      ggtitle('历年高考人数统计(1977-2018)')+ theme_wsj()+ 
      theme(axis.text.x = element_text(size=15),
            axis.text.y = element_text(size=15),
            axis.title =element_text(size=15),
            plot.title = element_text(hjust=0.5,size=25,face='bold'),
            panel.grid = element_blank(),
            legend.position = 'top',
            legend.title = element_blank(),
            legend.text = element_text(size=15),
            panel.background = element_blank(),
            axis.line = element_blank(),
            axis.ticks = element_blank()
            )+xlim(1977,2018)

说到这,似乎大家会认为现在的高考并不困难,录取率已经到达了8成左右,通过高考已经成了家常便饭,如果你真的这样认为,那只能将下面的表情包送你:

我们下面就进一步去分析高考数据,为大家列举横亘在高考生面前的三座大山:

02 三座“大山”

1. 名校录取率

前面我们提到的录取率有了显著的提升,然而录取率实际上是包括了所有的录取情况,同时包含了本科以及专科的录取情况。真正的“211”,“985”名校的竞争实际上还是异常激烈的,特别是在一些处于“地狱模式”的高考省份(由于没有在网上找到海南省的相关数据,我们选取了其他三十个省份、直辖市的数据):

下面就为大家对比各个省份2018年的985、211录取率:

可以看到,不同省份的985和211录取率有着比较明显的差距,12个省份的985录取率低于1.5%,安徽,河南,江苏和贵州更是低于1.2%,作为山东考生的作者也不由得表示“自愧不如”。

即使是录取率最高的省份,985和211的录取率也只是5.8%和13.9%,结合现在各大企业在招人要求中对985和211的要求,高考真的并没有真的变得简单。

2. 高考人数

除了名校录取率低之外,高考人数之多也是横亘在考生面前需要跨过的一个挑战。由于参与高考人数非常多,对于考试精细度就有了非常高的要求,可能一个细节的失误就会在全省的排名中下降非常多。

同样,我们看下各省2018年参与高考的人数:

河南省2018年的高考人数达到了86.5万,超过了不丹(80.7万)整个国家的人口数量,86.5万这个数据也超过了世界上接近2/3的国家人口数量。广东、山东、四川三个省的高考人数也超过了50万。由于参与高考的人数众多,这些省的高考几乎都是“肉搏战”。

3. 高考题目难度

除了名校录取率低,竞争人数多,另一个让广大考生为之“折服”的就是那些难度大到放飞自我的题目。其中一个省份的题目难度几乎是所有考生公认的最高,那就是江苏省,包括小编所在山东省在内的很多其他省的老师,都会告诉学生不需要关注江苏的历年题目,因为本省的考试题目不会那么难。

除了题目难度大,江苏高考改革的力度和速度也是冠绝全国,我们整理了一份江苏省2000年以来的历年高考改革的路线图:

看到这些模式的名称,可能大家已经有些眩晕,也深切体会到能从江苏高考中杀出重围的都是勇士。既然已经眩晕,不如就眩晕到底,下面是一道江苏省高考的真题,自行体验难度:

数学、物理这种大杀器都无需出场,只需一道作文题在作者这种“语文天残”看来就已经slay全场。

前面我们说了那么多高考的困难之处,是不是考生们真的就手足无措了呢,实际上并不是,只需要手握一些高考专属“杀器”就可以迎刃而解(以上纯属虚构)

03 高考“杀器”

1. 五年高考三年模拟

▲插个丧心病狂的广告

此杀器的使用方法无需赘述,只需把其全部吃透,虽然这也不表示高考就一定会有好成绩。希望各位考生努力复习,切勿如同书名一样“五年高考,三年模拟”。

2. 葛老师

葛老师乃高考中的超级大杀器,其威力可以参考下图,正所谓人不在江湖,但江湖上始终流传着他的传说:

由于葛老师过于强大,切勿幻想能将葛老师像“五年高考、三年模拟“那样吃透之后融会贯通,最好的方法就是“走为上计”,B站上的广大考生已经开始通过弹幕进行了实践:

04 写在最后

虽然我们前面列举了高考那么多的不易,但高考实际上为广大考生提供了改变自己人未来人生命运的机会。相较于其他很多缥缈不定的发展道路,高考给了大家一个明确的努力方向。

最后祝愿广大考生都能够放平心态(虽然并不现实),在高考中发挥自己所学,不留遗憾。取得不错的结果也不要因此沾沾自喜,没有达到自己的预期的也不要因此消沉,高考是我们人生中非常重要的一段历程,但不能完全决定我们未来的人生,未来还有很多需要去奋斗、去努力的地方。

PPT | 报告 | 读书 | 书单 | 干货

大数据 | 揭秘 | Python | 可视化

AI | 人工智能 | 5G | 区块链

机器学习 | 深度学习 | 神经网络

1024 | 段子 | 数学 | 高考

猜你想看

Q: 你是哪个省的考生?高考难吗?

欢迎留言与大家分享

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据DT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
各地高考“难度系数”告诉你,天津户口为什么值得抢
导读:天津户口有什么用?那些顶着37度高温排几个小时队的申请者可能有各自不同的答案。从一些媒体的采访来看,很多人看重的是天津的教育资源,也就是为子女的高考做准备。根据以往的规定,只要拥有天津户籍并取得高中毕业证书或具有同等学力,就可以在天津参加高考,不需要天津高中的学籍。
IT阅读排行榜
2018/08/16
9610
带你用Python解读高考数据:全国哪里的高校最多?什么专业最热门?
我们搜集整理了自1977年恢复高考以来到2019年,这四十多年来高考人数、录取人数和录取率的数据。
CDA数据分析师
2020/07/15
1.2K0
带你用Python解读高考数据:全国哪里的高校最多?什么专业最热门?
高考大数据:全国31省高考难度,哪个才是地狱模式?
每个地方的人,都会觉得自己是比较难的那一个。因为其实不管在哪里,高考都是件不容易的事情。
不脱发的程序猿
2021/01/20
9460
[数据可视化]哪年高考最难?哪里高考最难?
一年一度的高考又到来了。虽然对于大多数人来说,高考已经是过去的事情了。但每年到了这个时候,又难免再次想起那种被支配的恐惧?。譬如03年的江苏数学卷,十多年过去了仍不断被人提起。作为当时的亲历者之一,我
Crossin先生
2018/07/24
8910
[数据可视化]哪年高考最难?哪里高考最难?
高考数据究竟隐藏着怎样的惊人秘密?
本文整理自网络 十年寒窗无人问,一举成名天下知。 说到高考,很多人知道的无非就是状元,而再其次的,却真的是无人问津。高考学子十多年的寒窗苦读,终于在今明两天可以一崭矛头。那么2017年的高考应该如何用
CDA数据分析师
2018/02/26
8390
高考数据究竟隐藏着怎样的惊人秘密?
高考还能够改变普通人的命运么?数据分析来告诉你!!
高考的奇妙之处,身为当事人的我们可能在短期内无法深刻体会其中的差别,但是把衡量的时长延伸至十年甚至是二十年,当我们褪去稚嫩与懵懂、幻想与雄心壮志之时再回过头来看,会发现那个闷热却又不平凡的夏天,自己竟然做了这么一道重要的人生选择题,
用户6888863
2020/07/28
6160
高考还能够改变普通人的命运么?数据分析来告诉你!!
用一个高考数据的例子,说明数据的误导
又是一年高考 高考成绩刚出,正在紧张的志愿填报阶段。朋友圈里每天被高考刷屏。消息大部分可归为两类:i) 推荐学校,和ii)感叹阶级固化“寒门再难出贵子”。 后一类并不是高考时段的专属,不过因为今年北京
叶锦鲤
2018/03/15
1.1K0
用一个高考数据的例子,说明数据的误导
不读研,没出路?全国最疯狂考研地区榜
1978年,我国开始恢复招收研究生,那时招生数量仅一万出头。到2017年,研究生报名人数突破200万,共招收80余万人,比首届学生增加了大约74倍。
昱良
2019/05/14
5520
不读研,没出路?全国最疯狂考研地区榜
高考结束,用 Python 来分析下哪里的高考是地狱级难度
一年一度的高考,可以说是广大学子必经的磨练,正所谓十年寒窗苦,一朝天下知。而高考,也成为了当前中国最为广泛,最为公平的晋升之路,可以说考上了一个名牌大学,那么未来的道路会好走很多。
周萝卜
2021/07/14
5600
全国高校高考录取分数线查询
转眼又到一年毕业季,广大莘莘学子和家长们殷切期盼十年寒窗苦读能够取得金榜题名,当高考结束时,势必要好好经过一番考量和研究去选择心仪的大学。那么学子和家长们最应该提前了解和关心的是各大高校基本概况、排名、每年招生分数线等信息。
用户8236825
2023/03/27
8700
【Pyecharts】2014-2019年高考数据可视化~
之前我们看到,西北地区一本分数线非常低,那就代表这些地方考好大学更容易吗?当然不是!
Awesome_Tang
2020/08/11
5950
【Pyecharts】2014-2019年高考数据可视化~
python编程分析了一下高考那些事,发现了两个之最,原来是这样
Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象、直译式电脑编程语言,也是一种功能强大的通用型语言,已经具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理
猫咪编程
2018/06/07
4300
2021高考热度最高专业,大数据分析告诉你
经历了十二年苦读的学子们,终于到了真枪实弹、一考定输赢的时候了。小编不由自主替这些学子们捏了一把冷汗。
数据STUDIO
2021/06/24
6380
2020年高考考生规模创新高,虚拟现实技术专业是否值得报考?
(VRPinea 7月8日讯)受疫情影响,原定于6月7日至9日举行的2020年全国普通高等学校招生统一考试延期一个月,考试时间为7月7日至9日。而今天,是高考第二天。
VRPinea
2020/07/09
6340
2020年高考考生规模创新高,虚拟现实技术专业是否值得报考?
【2018年高校人工智能学院报考指南】第一批“00后”高考,数学满分同学看过来
新智元报道 编辑:克雷格、李静怡 【新智元导读】今天高考迎来了数学考试。数学不好能否学好人工智能?本科生学人工智能专业是否过早?北大黄铁军教授、南大俞扬副教授、上交大卢策吾教授进行了答疑解惑。 第
新智元
2018/06/22
1.2K0
对话社科赛斯CEO李发进:育人为本,引领考研培训行业向上发展
为了提升求职竞争力,为了放不下的名校情结,为了躲避不喜欢的工作……每年数百万人涌入考研洪流,即使旧人掩面、苦于上岸无望,也总有新人前仆后继加入考研大军。 2017年至今,考研人数从201万暴增至457万,但录取比例却从35.93%下降到了24.22%。庞大的人数、极低的录取率,让考研越来越“卷”的同时,也催生着考研培训行业的蓬勃发展。 据易观分析去年4月发布的《中国考研培训行业白皮书2021》显示,2020年中国考研培训市场规模达112亿元,同比增长33.3%,预计未来三年仍将保持高增长态势。 面对强劲的
罗超频道
2022/07/06
2820
对话社科赛斯CEO李发进:育人为本,引领考研培训行业向上发展
推荐阅读
相关推荐
各地高考“难度系数”告诉你,天津户口为什么值得抢
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验