Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python 硬核分析我国 14 亿人口,发现三大危机!

Python 硬核分析我国 14 亿人口,发现三大危机!

作者头像
AI科技大本营
发布于 2020-02-20 11:52:49
发布于 2020-02-20 11:52:49
7430
举报

作者 | 猪哥

来源 | 裸睡的猪(ID:IT--Pig)

2020年1月17日,国家统计局发布了2019年国民经济报告,报告中指出我国人口突破14亿。

猪哥的朋友圈被14亿人口刷屏,但是很多人并没有看到我国复杂的人口问题:老龄化、男女比例失衡、生育率下降、人口红利下降等。

今天我们就来分析一下我们国家的人口数据吧!

文章目录:

  1. 一、背景
    1. 人口突破14亿
    2. 人口普查年
    3. 全面放开二胎

  2. 二、分析目标
  3. 三、爬取数据
    1. 请求单页数据
    2. 分页数据
    3. 保存Excel
    4. 年数据

  4. 四、数据分析
    1. 总人口
    2. 男女人口比例
    3. 人口城镇化
    4. 人口增长率
    5. 年龄结构

  5. 五、总结

背景

1.人口突破14亿

2020年1月17日,国家统计局发布了 2019年国民经济报告 ,报告中指出:年末中国大陆总人口(包括31个省、自治区、直辖市和中国人民解放军现役军人,不包括中国香港、中国澳门特别行政区和中国台湾省以及海外华侨人数)140005万人。

也就是说2019年底我国人口突破14亿!

报告链接:

http://www.stats.gov.cn/tjsj/zxfb/202001/t20200117_1723383.html

2.人口普查年

根据2010年5月12日国务院第111次常务会议通过的《全国人口普查条例》第一章 第八条规定:人口普查每10年进行一次,尾数逢0的年份为普查年度,标准时点为普查年度的11月1日零时。

也就是说2020年11月将进行第七次人口普查,新中国成立后前六次人口普查分别为:1953、1964、1982、1990、2000、2010年。

PS:有些同学可能会有疑问:十年普查一次,那其他年份人口数怎么得来?在非普查年,当年总人口=上年总人口+当年出生人口-当年死亡人口 而计算得出!

3.全面放开二胎

《中华人民共和国人口与计划生育法修正案(草案)》明确规定,“全面两孩”政策2016年元旦开始即可实施。全面实施一对夫妇可生育两个孩子政策,是中国生育政策的一次历史性调整,实行了36年的独生子女政策全面终止。

分析目标

新中国成立70年,经历了许许多多的风风雨雨,政策、经济、文化也有很多的变化,人口也随之变化。

人口变化对社会经济发展带来巨大而深远的影响,所以今天我们从多角度来分析我国人口变化:

  1. 人口总数
  2. 男女比
  3. 城镇化
  4. 增长率
  5. 人口结构

爬取数据

关于我国人口的数据来源,可以从“国家数据”网站中获取。这是一个由国家统计局提供的网站,里面有很多国家公开的数据信息!

1.请求单页数据

在国家数据网站中,有从新中国成立到2018年的人口相关数据。

在人口数据中,有三项是我们需要的数据:总人口、增长率、人口结构。我们按F12查看一下请求的链接,然后复制链接使用Requests请求数据。

只使用一个简单的get请求,就把数据获取了,而且返回的直接是Json数据!

2.分页数据

我们此次的目的是抓取从新中国至今的所有人口数据,而页面中最多可以获取近20年的数据,所以我们需要分析网页请求中关于分页的参数。

分析请求参数猪哥发现主要有两个参数:zb、sj,分别表示指标和时间。

参数:sj=LAST0,表示近10年,于是猪哥猜想:sj=LAST70 是不是就可以获取70年的数据呢?

然后我们再将zb参数更换,获取到所有的数据!

3.保存Excel

获取到数据之后,我们先将数据清洗,提取出我们需要的数据,然后整理保存到Excel中,数据处理方面我们仍然使用 潘大师(pandas)。

我们来看看保存的excel文件数据。

4.2019年数据

目前数据唯一的不完整就是没有2019年的数据,因为2019年刚刚完结所以数据还没有登记到网站上,我们只能自己算出来然后补齐。

猪哥根据2020年1月17日,国家统计局发布了 2019年国民经济报告中关于人口的数据得出了2019年的相关数据。

来看看完整的70年人口数据。

数据分析

数据保存完毕后我们就可以开始数据分析步骤了,一般在我们数据分析之前我们需要有个思路:要分析什么?从哪些角度分析?选择何种可视化图形?得出了什么结论?(当然实际工作时的分析报告需要更为严谨,但大体思路类似。)

1.总人口

首先我们提取Excel中的“年末总人口”这一列的数据进行分析。

直接上代码,猪哥先使用潘大师读取Excel,然后再获取总人口的列数据(完整代码请查看源码)。

上面的代码和之前画曲线有点不同的是:添加了自定义曲线背景色和区域色的功能,下次有同学想自定义pyecharts曲线背景就可以参考这里的代码。

在下图中猪哥标注了四个点:

  1. 1949年:新中国成立,总人口 5.42亿
  2. 1980年:计划生育正式开始,总人口 9.87亿
  3. 2006年:全面放开二胎,总人口 13.83亿
  4. 2019年:总人口 14亿

通过观察总人口曲线图得知:

  1. 人口总体在增加,但增长曲线慢慢放缓,据社科院预测:中国人口将在2029年达到峰值14.42亿,往后逐步下降
  2. 新中国成立至今(2020年)唯一出现人口减少的是1960和1961年,这两年是我国的自然灾害年。

  1. 根据总人口数,我们再来分析一下 执行计划生育前31年 与 后31年增长的人口分别是多少?

根据上图我们可以看出:计划生育确实控制了人口的增长!

而放开二胎后并未迎来生育高峰期,联合国相关机构发布的《世界人口展望》2017修订版给出了类似的预期。它倾向于认定中国人口已经开始了倒V型反转,在人口到达高峰后,2050年将会保持13亿多,然后就会加速下滑(低、中、高三种生育率,来自联合国人口基金)。

2.男女人口比例

我们经常会听到别人说:“中国男女比例失衡,将有3000万中国男性娶不到老婆”。

其实这是我国男女比例失衡造成的结果

下面猪哥就从以下4个角度来分析我国男女比例的关系:

  1. 2019年男女比
  2. 男性占总人口比例
  3. 男女人口数曲线
  4. 男女人口数差值

根据上面4图我们可以得出一些结论:

  1. 新中国成立以来男性人口一直比女性人口多,可能与我国重男轻女思想有一定关系。
  2. 男性占比最高是在新中国成立之初为51.96%,最低是在1996年为50.82%。下图是来自快易数据提供的 中国、印度、日本、英国、美国 五国的男性占比图,从图中可以清晰看出中国与印度的男女比一直处于失衡状态。

  1. 2000年我国男女人口差值最大为4131万人,最小差值是在1965年为1718万人。
  2. 2006年以来我国男女比例失衡状况逐年缓解。

我国到底有多少男性同胞们会打光棍?由于篇幅有限,我们下期做一个专题分析这个问题!

3.人口城镇化

有很多同学不理解何为“人口城镇化”,下面猪哥引用百度百科的介绍:

人口城镇化是指农村人口转变为城镇人口、农业人口转变为非农业人口的过程,它是社会生产力发展到一定阶段的产物。

城镇化是一个综合指标,可以用来衡量当地经济发展情况、基础设施和人民生活水平。

同时,城镇化的进程也是房地产市场在需求层面的重要支撑力量,下图是一张人口城镇化与社会发展关系的图。

根据美国地理学家诺瑟姆对世界各国城市化的研究,世界城市化分为三个阶段:

  1. 初期(人口城镇化在30%以下):农村人口占优势,工农业生产力水平较低,工业提供就业机会少,农业剩余劳动力得不到释放。  
  2. 中期(人口城镇化30%~70%):工业基础比较雄厚,经济实力明显增强,农村劳动生产率提高,剩余劳动力转向工业,城市人口比重快速突破50%,而后上升到70%。  
  3. 后期(人口城镇化70%~90%):农村人口向城镇人口的转化趋于停止,农村人口占比稳定在10%左右,城市人口可以达到90%左右,趋于饱和,这个过程的城市化不再是人口从农村流向城市,而是城市人口在产业之间的结构性转移,主要是从第二产业向第三产业转移。

来看看我国人口城镇化数据分析:

由上图分析可知:

  1. 2019年我国人口城镇化达到60.6%,处于人口城镇化的中期。
  2. 1995年我国乡村人口达到峰值:8.59亿。
  3. 1996年我国城镇化步伐加快,同年城镇化超过30%,进入城镇化的中期。
  4. 在2010年我国城市人口与乡村人口持平约为6.7亿,城镇化为50%。

联合国对中国人口城镇化进程进行了预测:我国城镇化初期是1949年~1995年,中期是1996年~2032年,后期是2033年以后。

4.人口增长率

数据可视化的代码猪哥就不放出来了,想看的同学直接去看源码吧,我们直接看图片。

由上图得知:

  1. 在自然灾害三年(1959、1960、1961)我国人口死亡率陡增,出生率也下降,人口出现新中国成立以来第一次负增长!
  2. 在自然灾害过后的两年(1962、1963)迎来我国最大的一波生育潮,我们通过2010年人口第五次普查的数据也可以验证这个结论。

  1. 自然灾害三年过后我国的死亡率一直趋于稳定,维持在6-7‰左右。
  2. 我国出生率整体一直在下降,在计划生育之前出生率就在下降。
  3. 在2016年我国全面放开二胎之后的三年(2017-2019),出生率并没有出现好转,反而持续走低。

目前的育龄妇女基本都是85-90后,受计划生育(1980年)影响,育龄妇女人数比以前少了,生孩子的数量自然就比以前少了,这一情况会持续下去。

出生率降低,死亡率增加,人口增长就慢慢放缓,社科院预测在2029年左右我国人口达到峰值(14.42亿)之后慢慢减少!

题外话:猪哥在爬取数据之后,发现 国家数据网站 提供的数据也是有误的:1961年人口比1960年人口下降,而增长率却为正数!

5.年龄结构

人口年龄结构是衡量 老龄化 与 人口红利 的指标。

老龄化:指老年人口相对增多,在总人口中所占比例不断上升的过程,国际上通常看法是,当一个国家或地区60岁以上老年人口占人口总数的10%,或65岁以上老年人口占人口总数的7%,即意味着这个国家或地区的人口处于老龄化社会。 ——百度百科

老龄化是每个国家每个社会都会经历的阶段,目前来讲发达国家的老龄化问题比发展中国家更严重,据快易数据提供的一份 世界各国老龄化排名来看,中国只排到了65名,第一名是日本,而前几名基本都是欧洲国家。

人口红利:经济学术语,是指一个国家的劳动年龄人口占总人口比重较大,抚养率比较低,为经济发展创造了有利的人口条件,整个国家的经济呈高储蓄、高投资和高增长的局面。

人口红利简单来说就是 劳动力人口数 大于 非 劳动力人口,劳动人口比例较高,保证了经济增长中的劳动力需求,劳动力资源丰富和成本优势已经使中国成为世界工厂和世界经济增长的引擎。

从上面三图分析我们可得:

  1. 1982年我国 0-14岁少儿占比33.59%,而2019年减至17.9%,比例减至近半。
  2. 2019年我国65岁以上人口占比为12.57%,已经进入老龄化社会。世界有92个国家进入老龄化,中国排在65。
  3. 2010年我国总抚养比达到最低为:34.2%,意味着每3个劳动力需要养一个老人或小孩。
  4. 人口红利在2010年达到顶峰,之后在慢慢降低。

2019年我国老年人口为1.76亿,中国的老龄化即将进入快速老龄化阶段,目前我国多个省的养老金告急,我国养老金体系改革迫在眉睫。

总结

由于篇幅过长,很多分析代码并未放出,如果想学习的同学可以查看源码(https://github.com/pig6/china_population)。

我们来总结一下我们今天分析的结果吧:

  1. 总人口:我国总人口稳步增长,据社科院预测:中国人口将在2029年达到峰值14.42亿,往后逐步下降:

  1. 男女比例:我国自新中国成立以来,一直处于男多女少的状态中,2019年男女差为3000万。因为老年人中女性多于男性,所以年轻男女的差值应该会更大,下期我们可以专门分析一下:中国将会有多少光棍?

  1. 人口城镇化:2019年我国城镇化超过60%,处于城镇化发展的中期阶段。联合国对中国人口城镇化进程进行了预测:我国城镇化初期是1949年~1995年,中期是1996年~2032年,后期是2033年以后。

  1. 人口增长率:我国出生率持续走低,在全面放开二胎之后并未出现生育潮,人口增长慢慢放缓,据社科院预测在2029年人口增长率为0,之后出现负增长,生育率低使得我的老龄化进程加快。

  1. 人口年龄结构:人口年龄结构影响着两个重要的指标:人口红利、老龄化。我国人口红利在2010年达到顶峰,之后慢慢减少。老龄化问题是国际普遍存在的问题,尤其是发达国家。据快易数据显示:2018年全世界有92个国家进入老龄化,排在第一的日本老龄化为:27.58%,我国老龄化排在第65位。但随着时间推移我国即将进入快速老化期,养老问题日益凸显!

总结来说我国人口结构存在三个严峻的问题:

  1. 生育率低:生育率低、劳动力萎缩、老龄化加速、人口红利消失加快。
  2. 养老问题:老龄化加速、劳动力萎缩,导致多省养老金告急,需中央补贴!
  3. 剩男问题:计划生育实行后男女人口差拉大,男女失衡,剩男问题严峻,越南买媳妇新闻屡见不鲜!

面对三个严峻的考验,希望有专业人士能为我们国家出谋划策。

源码地址:https://github.com/pig6/china_population

数据来源: 1、http://data.stats.gov.cn/easyquery.htm?cn=C01 2、http://www.stats.gov.cn/tjsj/zxfb/202001/t20200117_1723383.html 3、https://www.kylc.com/stats

参考: 1、https://yq.aliyun.com/articles/668824 2、https://mp.weixin.qq.com/s/SmNxflkaYgBewwmjoqOfJw 3、https://www.ssap.com.cn/c/2019-01-03/1074956.shtml

(*本文为AI科技大本营翻译文章,转载请微信联系1092722531)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
1分钟读懂人口普查大数据——第七次人口普查数据可视化BI分析
5月11日,第七次全国人口普查主要数据结果正式公布,数据详实,信息量大。那么,如何才能迅速了解和读懂本次普查的关键数据和背后趋势呢? 我们基于国家统计局发布的第七次人口普查数据,制作出本次人口普查数据的可视化图表展现,让我们一起通过先进的数据可视化技术,直观地看看我国的人口情况吧:
葡萄城控件
2021/05/17
1.6K0
1分钟读懂人口普查大数据——第七次人口普查数据可视化BI分析
联合国:世界人口已过80亿!下降「拐点」或在60年后来临
联合国秘书长古特雷斯在一份声明中称,在这个里程碑时刻,国际社会「在庆祝多样性和发展进步的同时,也要思考人类对地球的责任」。
新智元
2023/01/07
3010
联合国:世界人口已过80亿!下降「拐点」或在60年后来临
数据的故事:逃离你终将衰落的家乡!
又到一年毕业季,许多人纠结于在“逃离北上广”还是“坚守大城市”之间徘徊不定,此文或可作为大家的一个参考,希望那些还在因为工作地点而迷茫中的人从此不再迷茫。 数据及算法支持:城市数据团 逃离你终将衰落的
CDA数据分析师
2018/02/23
8690
数据的故事:逃离你终将衰落的家乡!
养老机器人能拯救“老龄中国”吗?
“操作的时候你上身保持平衡,下压手柄60度,找准重心,几乎就不需要用力了。” 在上海浦东新区的金杨敬老院内,锝茂信息科技有限公司副总经理孙旭东正在亲自为护理员工培训这台来自德国的 S-max sella载人爬楼机器人的使用方法,能否操作好这个“新伙伴”帮助腿脚不便的老人上下楼梯,是该敬老院员工技能考核的一项重要指标。 该机器人也被视为“养老机器人”。凡是独立或者辅助帮老年人护理生活的,广义地都称为“养老机器人”。 这台载人爬楼机器人外观上几乎与普通轮椅无异,只是在座垫下方多了带有机械腿的爬楼组件,
机器人网
2018/04/13
8360
养老机器人能拯救“老龄中国”吗?
李克强总理的博士论文(全文)
1994年,时任共青团中央书记处第一书记的李克强获得北京大学经济学博士学位。他的论文题目为《论我国经济的三元结构》,该论文获得中国经济学界最高奖项——孙冶方经济学奖。也有人指出这并非毕业论文而是期刊论文
ShuYini
2023/10/31
1.5K0
李克强总理的博士论文(全文)
数据告诉你:跟缺“芯”相比,中国当前的这个问题更致命!
导读:近期,中美贸易摩擦引发各方关注,尤其是美国商务部对中兴通讯7年的销售禁令在业内引发普遍的悲观和焦虑。不过,也有不同的观点认为,缺“芯”问题导致的后果并没有想象得那么严重。中国当前面临的更致命的问题,不是缺芯,而是缺人!
IT阅读排行榜
2018/08/17
6700
生孩子是国事还是家事?
计划生育是从 1970 年代执行,到 2010 年,出生率从 3.065% 下降至 2010 年的 1.19%。由于人口调控产生了诸如老龄化、劳动人口下降等不利局面,政府逐渐意识到调整人口政策的重要性。2015 年,政府宣布废除「一胎政策」,允许所有妇女生育两个孩子。但是,生育率并没有得到显著提高,2017 年,出生率仅为 1.243%。
用户3596197
2018/10/15
8860
中国人口数据可视化_人口出生率预测
人口下降螺旋一旦形成,一个传承了几千年的大华夏族,几百年内,即将在世界民族之林中,消亡……
全栈程序员站长
2022/10/02
8030
中国人口数据可视化_人口出生率预测
品玩SAS:科技进步和生育率下降下的未来社会
最近在微博、公众号等平台看到许多关于女性生育后产生身体问题的文章,其中《生育后那些没有人告诉你的屎尿屁:是苦痛还是自由?》,引发了人们对于生育问题的广泛讨论。让我吃惊的除了文章中描绘的各种难堪、委屈的画面,更多的是生存至今从未通过媒体正面了解,甚至是小道听闻过此类内容的愧疚,因为在我不知道这些时,我只以为女性的痛苦仅存在于分娩时的短暂时分,而其后貌似与常人无异。
机器思维研究院
2019/05/27
6580
品玩SAS:科技进步和生育率下降下的未来社会
2016年中国机器人行业市场前景及发展趋势预测【图】
导读:机器人上世纪30年代才萌芽,经历成长期和快速发展期后,目前已经迈进智能化时代。过去十年,我国用工成本急剧上升,替换劳力成为拉到机器人行业大发展的重要因素。本文立足国内外机器人行业现状分析,对中国机器人行业市场前景及发展进行了趋势预测。 机器人是自动控制机器的俗称,指能自动执行任务的人造机器装置,用以取代或协助人类工作。主要包括以下几个部分:执行机构、驱动装置、检测装置、检测系统等。从应用层面来讲,机器人分为两大类,即工业机器人和服务机器人。工业机器人可以代替工人从事上下料、锻造切割、焊接、喷涂、装配、
钱塘数据
2018/03/01
7840
2016年中国机器人行业市场前景及发展趋势预测【图】
瞄准“银发经济”的智能家居为何叫好不叫座?丨科技云·视角
在老龄化日益加剧的当下,针对老年人的智能产品,如:老人手机、智能手环、智能腕表等不断涌现。尽管老年人数量巨大,但对现在的智能家居硬件接受度却很低。
科技云报道
2022/04/14
5970
“单身税”收多少才合适?生一个孩子奖励几千元,你愿意生吗?
导读:12月9日,《北京人口蓝皮书:北京人口发展研究报告(2018)》发布,数据显示北京外来人口、户籍人口双下降,逃离北上广已从口号走向现实;生育率从2015年的7.96‰上升到2017年的9.06‰,但超低生育水平格局未变;4个劳动力抚养1个非劳动力,老龄人口比例上升。
IT阅读排行榜
2018/12/28
3930
“单身税”收多少才合适?生一个孩子奖励几千元,你愿意生吗?
数学建模-二胎政策对中国人口的影响[通俗易懂]
研一的数学建模课上的关于“二胎政策对中国人口的影响”。研究中国人口,发现中国人口老龄化非常严重,如今假设不放开全面二胎,那么中国的未来真的非常令人堪忧。
全栈程序员站长
2022/10/03
1.5K0
数学建模-二胎政策对中国人口的影响[通俗易懂]
最全各国人口数据,印度的高出生率与俄罗斯的高死亡率
最近在国外网站看到这张图片,里边对比了2017年人口最多的国家在2050年的人口情况,可以看到印度在那时候人口会增长到16亿,而中国人口会下降2千万。
挖数
2019/07/09
13.5K0
最全各国人口数据,印度的高出生率与俄罗斯的高死亡率
中国人口红利消失的产业机会
联合国《世界人口展望 2019》对未来各国人口增长和人口结构变化进行预测,认为我国的人口增长和变化更接近于使用中等变量预测和低变量预测的中间值的结果。
庄帅
2020/05/09
7120
《中国SaaS产业的时代变革和投资机遇》
来源:叶盛的读书笔记 ---- 摘要: 目前,中国企业SaaS产业仍然在发展初期。根据艾瑞咨询的数据, 2018年中国企业级SaaS市场规模达到了243.5亿元,同比增长了47.9%。而美国仅Salesforce在2019财年的收入为132亿美元,是整个中国企业SaaS行业收入的近4倍。 中美企业软件市场规模的差距背后是劳动力成本的差距。企业服务软件的本质是工具,目的是用来提升效率的。企业决定是否使用工具的核心考量是使用工具带来的收益是否会超过付出的成本,而衡量基准则是劳动力成本。劳动力成本越高,
腾讯SaaS加速器
2020/06/09
6960
越南的 “人口红利”
一直想等疫情缓和后去越南看看,感觉那边很像30年前刚改革开放的中国,制造业崛起,开放包容,人口迅速增长。
挖数
2023/01/09
8050
越南的 “人口红利”
互联网掀起农家乐,巨头上演AI掘金战
前有网易、阿里AI养猪,后有腾讯AI养鹅,互联网大佬们纷纷玩起了“农家乐”,互联网的生意在尖端技术的引领之下频频跨界,巨头之间的较量也从线上延伸至线下。自古“民以食为天”,缺什么都不能缺粮食,技术赋能农业生产必然会成为解决未来民生问题的重要方式,为互联网公司的发展插上新翅膀。
刘旷
2020/06/30
3790
看一看:亮眼的趣味图
看不懂枯燥的公式,看烦了理论的文章,今天我们不一样,一起看一看几个亮眼的趣味小图,放松一下。
herain
2022/04/27
2350
看一看:亮眼的趣味图
这场战争,退无可退
最近辽宁开始鼓励老年人自主创业、奖励生育二孩,以对抗日益严重的老龄化危机,这会是全社会的预演吗?老龄化是把软刀子,割来的时候不觉得疼,但是当你把视野放大,把个人的行为汇集为整体,就会明白整个中国实际上正在试图通过储蓄房子来应对老龄化。作者从人口危机的视角深度切入,犀利解读中国当前的经济社会困境,却又不乏国家未来的期冀,推荐阅读。
IT派
2018/08/10
5890
推荐阅读
相关推荐
1分钟读懂人口普查大数据——第七次人口普查数据可视化BI分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档