前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >2017 Python 问卷调查结果初步分析

2017 Python 问卷调查结果初步分析

原创
作者头像
Alan Lee
修改于 2018-04-29 06:59:28
修改于 2018-04-29 06:59:28
4.1K5
举报
文章被收录于专栏:Small CodeSmall Code

Note:本文在我的个人站点同步发布:2017 Python 问卷调查结果初步分析 · Lee's Space Station,无广告,体验更好。 未经授权,禁止转载。

前言

2017 年末,PSF(Python Software Foundation,Python 软件基金会)和 JetBrains 一起进行了一次全球范围内的关于 Python 使用情况的问卷调查,共有来自 153 个国家的 9506 名开发者参与了这次调查,官方也发布了一份调查报告分析。

这次我从我自己感兴趣的角度来尝试做一些简单的分析,也是一次练手。这个过程断断续续持续了很长时间,中间也是被种种事情打断,现在终于基本完成了,然而还有很多东西可以分析,等以后有时间了再来接着分析。

我个人认为调查报告的分析主要有两点:

  • 验证一些常理
  • 发现一些现象

本文基本只做到了前者,而且侧重于直接展现分析结果(大多数为图),具体的代码实现见 analyzing-python-survey-2017.ipynbGitHub 上的内容见 secsilm/analyzing-python-survey-2017,包括问卷调查的内容(PDF)和调查结果原始数据(CSV)。

数据

我认为拿到数据的第一步就是先看下数据长什么样,这样才能着手分析。先来看下我们的调查结果数据:

数据总大小是 9506×162,即 9506 行 162 列,上图是前 5 行,每行代表一个样本,即一个参与调查的开发者。可以看到已经将一道选择题的答案拆分成多列,这一般是用于处理多选题,例如上图中的「What other language(s) do you use?」,而单选题则不用拆分,可以直接写答案,例如上图第一列。

问题

分析前,我们需要首先提出一些问题,基于这些问题来作分析。本文提出了以下几个问题:

  • 开发者中使用 Python 2 和 Python 3 的情况
  • 数据分析机器学习的人中分别有多少人使用的是 Python 3?
  • 常用框架中使用 Python 2 和 Python 3 的比例
  • 做数据分析和机器学习的人常用的框架?
  • 团队规模大小和是否使用 Python 3 的关系?
  • 开发者年龄和是否使用 Python 3 的关系?
  • 使用 Python 3 和 Python 2 的开发者的国别分布?

下面我们依次看下这几个问题。

开发者中使用 Python 2 和 Python 3 的情况

这个问题比较好解决,调查问卷中的问题 5 是「Which version of Python do you use the most?」,而且是单选题,那么我们直接那么对这列使用 value_counts() 进行处理,然后使用 plt.pie() 绘制饼图:

python version
python version

可以看到 Python 开发者中已经有 $\frac{3}{4}$ 的人在使用 Python 3 了。

Note:2020 年 Python 2 就会停止维护,如果你还在纠结使用 Python 2 还是 Python 3,毋庸置疑 Python 3!

做数据分析和机器学习的人中分别有多少人使用的是 Python 3

调查问卷中问题 4 是「What do you use Python for the most?」,这是一道单选题,选项中有「Data analysis」和「Machine learning」两项,因此我们可以直接将这列与「Which version of Python do you use the most?」列进行交叉,就可以得到数据分析和机器学习中使用 Python 3 的比例,而交叉可以使用 pd.crosstab() 来做,然后绘制出条形图:

data analysis and machine learning VS python version
data analysis and machine learning VS python version

可以看到其实相差无几,Python 3 似乎在机器学习中更为流行。数据分析和机器学习中涉及到的字符串处理比较多,而 Python 3 在这方面显然更具有优势。

机器学习尤其是深度学习中最常用的库就是 TensorFlow 了,但是这个库官方只支持 Python 3,可以说这也是机器学习中 Python 3 的比例略微高于数据分析的一个原因。

常用框架中使用 Python 2 和 Python 3 的比例

如果我们将开发者常用的框架(库)与所使用的 Python 版本进行交叉,那么将得到各框架中的 Python 2 和 Python 3 使用情况。

在这之前,让我们先来看下框架使用排行(Just for curious ?):

frameworks
frameworks

统治 Python 的两大阵营(Web 开发和数据科学)的框架果然占据了前两名 ?

好了回到正题,让我们来看下各框架中的 Python 2 和 Python 3 使用情况:

frameworks in python version
frameworks in python version

上图是按照 Python 3 的使用比例由高到低排序的,可以看到排名前五的都是网络和 UI 相关的库,排名第一的 aiohttp Python 2 与 Python 3 的比例甚至达到了 1:9 ? 由于我本人对这方面不太了解,就不做过多评价了,如有懂得同学可以留言解释下为何网络和 UI 方面的库中 Python 3 的占比如此高。

不过总体上来说,各大框架中 Python 3 的使用比例都已经超过甚至远超 Python 2 ?

做数据分析和机器学习的人常用的框架

接着上面,我们可以将框架使用情况与 Python 在数据分析和机器学习方面的应用进行交叉,得到数据分析和机器学习开发者最常用的框架:

frameworks in data analysis and machine learning
frameworks in data analysis and machine learning

可以看到数据分析和机器学习开发者所用的框架大体相同,数据分析开发者人数要多于机器学习开发者,但是由于机器学习开发者更常用 Keras、scikit-learn 和 TensorFlow 等框架,反而使用这些框架上的机器学习和数据分析开发者人数基本一致。

乍一看让我有点意外的是 Django 和 Flask 的位置,相对来说这两个用于构建网站的框架排名还是很靠前的,但是仔细一想,我见过很多数据分析和机器学习开发者做一个网站来展示自己的作品,这样一来也不足为奇了。又或者是 Web 开发者兼职数据分析和机器学习?细思极恐……

团队规模大小和是否使用 Python 3 的关系

一般来说,团队规模越大,由 Python 2 转型 Python 3 所花费的代价就越大,所以团队规模越大使用 Python 3 的比例可能就会越低,而下图也印证了这一点。

team scale and python 3
team scale and python 3

但是需要注意的是,有将近 62% 的人是独立开发或者是外部顾问(external consultant)和培训讲师(trainer),也就是说不在一个团队中进行工作。上图就是基于剩下的约 38% 的开发者来绘制的。

开发者年龄和是否使用 Python 3 的关系

同上,越年轻使用 Python 3 的比例就越高,毕竟年轻人「情怀」比较少 ?

BUT,物极必反,60 岁以上的开发者使用 Python 3 的比例陡然提升了 10%……难道回光返照?

age python 3
age python 3

60 岁以上还在 coding 的人应该不多,我们来统计下每个国家内 60 岁以上的开发者人数,然后排名取前十名:

top10
top10

几乎是美国一家独大,后面的几乎可以忽略不计,所有 153 个国家的 60 岁以上开发者人数为 111,而美国为 56,占到了一半,而这 56 个人中有 41 个人使用的是 Python 3,占比约为 73%,so,上面的疑问也就不是疑问了。

此外,我们来看下开发者人数最多的三个国家(美国、印度和中国)的开发者年龄构成:

age distribution
age distribution

结合国内程序圈的情况,大家都想着 30 以后要不转要不升,上图也不足为奇,美国的年龄分布相对来说要好很多。

使用 Python 3 和 Python 2 的开发者的国别分布

首先来看下所有开发者的国别分布:

country counts
country counts

美国、印度和中国排名前三,上一节的年龄分布图选取的三个国家就是就是根据这个排名取的。

再来看下上图排名前十的国家中的 Python 2 和 Python 3 的使用比例:

country python version
country python version

其实使用比例是差不多的,都是 Python 3 远超 Python 2,这一点也可以用下图佐证:

use-ratio-of-python3-in-the-world
use-ratio-of-python3-in-the-world

我们有了国家信息,那么自然而然就会想到直接在地图上显示数据:

Python 3 in the world
Python 3 in the world

上图在这里有更好的交互式体验。

总结

可以看到的趋势是:

  • Python 3 已经被大多数人使用,无论是 Web 开发还是数据科学(数据分析和机器学习),无论是美国还是中国还是其他国家
  • Web 开发和数据科学是 Python 开发的两大统治者
  • 数据分析和机器学习开发者使用的 Python 框架有很大的相似性,只是在 TensorFlow 等机器学习框架上的使用有一定区别
  • 年龄和团队规模和使用 Python 3 的比例有一定关系
  • 美国的开发者年龄分布要好于中国

总的来说,本文所分析的内容只能说是冰山一角,还有大量内容可以分析,但是时间精力有限,后续可能的话再在此基础上加以分析。

END

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
5 条评论
热度
最新
Python 3是大趋势,也为未来。Python2 马上就不维护了。
Python 3是大趋势,也为未来。Python2 马上就不维护了。
回复回复点赞举报
现在学习就直接开始python3吧
现在学习就直接开始python3吧
回复回复点赞举报
python2的老叔叔了,现在正在恶补python3 和TensorFlow。时代的脚步真是匆匆。
python2的老叔叔了,现在正在恶补python3 和TensorFlow。时代的脚步真是匆匆。
回复回复点赞举报
python3无疑是潮流啊,python2out了
python3无疑是潮流啊,python2out了
回复回复点赞举报
更正一下,TensorFlow初始也是支持python2的,但python3肯定是大势所趋,所以尽快拥抱python3吧。
更正一下,TensorFlow初始也是支持python2的,但python3肯定是大势所趋,所以尽快拥抱python3吧。
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
Plotly 初步
版权声明:本文为博主原创文章,未经授权禁止转载。 https://blog.csdn.net/u010099080/article/details/84197684
Alan Lee
2019/05/27
1.3K0
Kaggle 2017数据科学报告:最受欢迎的工具竟然是......
摘要:数据平台 Kaggle 近日发布了2017 机器学习及数据科学调查报告,针对最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等进行深度调查。此次调查共收到16000余份回复。 正文: 2017年,我们首次进行了全行业调查,以全面了解数据科学和机器学习的生态。我们收到了超过16,000份回复,我们调查了”谁在处理数据?”,"各行业机器学习的最前沿发生了什么?”,”新进入这一领域的数据科学家如何取得突破?”等问题并获得了大量反馈信息。本文分享了我们的一些重要发现,其中的摘要内容
小莹莹
2018/04/18
8500
Kaggle 2017数据科学报告:最受欢迎的工具竟然是......
Python开发者年度调研:一半Python用户也用JS,2/3选择Linux系统
作为高级编程语言,Python的受欢迎程度近几年一直在往上涨。每年,Python官方都会针对开发者社区做一次年度报告,统计当年的发展情况,并发布调研报告。
大数据文摘
2019/03/04
7170
Python开发者年度调研:一半Python用户也用JS,2/3选择Linux系统
2019 年 Python 开发者调查结果发布:Linux 最受欢迎
2019年秋天,Python软件基金会和JetBrains一起组织了第三届年度Python开发者调查。与以往的调查相同,我们致力于发现新的趋势,并探究Python开发者社区的现状。本次调查一共有2万4千名开发者参与,他们来自150个国家,这让我们得以对Python社区的全貌有一个大致的了解。
用户6543014
2020/05/21
9150
2019 年 Python 开发者调查结果发布:Linux 最受欢迎
基于Vue.js+Node问卷调查系统的设计与实现
随着网络信息技术的飞速发展,人们正在迅速适应互联网对人们的学习、生活和工作所产生的影响和变化。网络调查系统是网络信息时代发展的产物,正在被越来越广泛的受众所接受,并逐渐取代传统的调查。在线调查系统解决了传统调查无法解决的时间和空间限制等问题。可重用性;易于变化;数据恢复快捷方便。低成本。电子测量已成为一种普遍而实用的测量方法。它具有研究范围广、信息量大、选择空间大、隐私性好、成本低等优点。因此,电子调查不可避免地成为社会发展的一个组成部分。本文采用VUE节点语言进行开发,主要描述了一个调研系统的设计和开发过程,研究了在线调研的好处,并详细阐述了软件需求、设计和实现过程。
Designer 小郑
2023/08/01
1.6K0
基于Vue.js+Node问卷调查系统的设计与实现
2019开发者调查结果和总结
版权声明:转载注明出处 https://blog.csdn.net/weixin_42514606/article/details/89266711
叉叉敌
2019/04/21
6270
2019 S.O. 开发者调查结果
今年,将近90,000名开发人员告诉我们他们如何学习和升级,他们正在使用哪些工具以及他们想要什么。
叉叉敌
2019/04/13
5090
深度学习开发环境调查结果公布,你的配置是这样吗?(附新环境配置)
机器之心整理 参与:李泽南、李亚洲 本周一(6 月 19 日)机器之心发表文章《我的深度学习开发环境详解:TensorFlow + Docker + PyCharm 等,你的呢(附问卷)》介绍了研究员 Killian 的深度学习开发环境:TensorFlow + Docker + PyCharm + OSX Fuse + Tensorboard,并附了一份调查问卷想要了解机器之心读者配置的开发环境、对编程语言、框架的使用情况。虽然获得的反馈量比较有限,但我们也观察到了一些比较有趣的现象。在这篇文章中,我们将
机器之心
2018/05/08
9540
深度学习开发环境调查结果公布,你的配置是这样吗?(附新环境配置)
Java收入最低,996人口仅2%:2019全球开发者调查结果公布
而在最近被热议的工作时间问题上,这份覆盖了全球 179 个国家和地区、接近 9 万名软件开发者的统计告诉我们,996 并不是什么码农的代名词:有超过 50% 的开发者每周的工作时间为 40-44 小时,而每周工作超过 70 小时的人数仅为 2%。
机器之心
2019/04/29
5880
Java收入最低,996人口仅2%:2019全球开发者调查结果公布
2021 StackOverflow 开发者年度调查报告
StackOverflow 发布了 2021 年度开发者调查报告,整个调查问卷参与人数达到八万多,来自全球 180 多个地域。问卷内容包含基本信息,教育、工作经历,用到的技术相关,社区相关,人口相关,最终问题六个部分,每个部分由多个随机问题组成。涉及到的问题有受访者的所在地域,工作年限,薪资水平,性别,性取向,以及用到的语言和工具等。
Java极客技术
2022/12/02
5400
2021 StackOverflow 开发者年度调查报告
Python扩大领先优势:2018年数据科学语言&工具排名
导读:近日,著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程语言」进行了投票。该统计还对过去三年来的排名进行了对比分析。
IT阅读排行榜
2018/08/16
3420
Python扩大领先优势,PyTorch仅占6.4%:2018年数据科学语言&工具排名
作者:Gregory Piatetsky 机器之心编译 近日,著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程语言」进行了投票。该统计还对过去三年来的排名进行了对比分析。此外,机器之心在文末发起了一个投票,快选出你心中最美的深度学习框架吧。 这份投票结果既有预料之内,也有预料之外的部分。数据显示,Python 作为机器学习常用的编程语言正在不断扩大领先优势,R 语言的使用率
机器之心
2018/06/12
3710
2019 开发者调查报告:Java 最流行,Go 最有前途
知名软件开发公司 JetBrains 近日发布了名为「2019 开发人员生态系统现状」的调查报告。
xcbeyond
2020/04/02
5310
Kaggle 2018社区调研出炉:女性从业者比例降低,00后登上历史舞台!
不管是初学者还是大魔王,只要浸润过数据科学和机器学习界,那么对于Kaggle一定不陌生。各路英豪在这个平台上实战练习、膜拜大神、打怪升级,用某个媒体人的一句话,“简而言之,Kaggle 是玩数据、机器学习的开发者们展示功力、扬名立万的江湖。”
大数据文摘
2018/12/24
5070
Kaggle 2018社区调研出炉:女性从业者比例降低,00后登上历史舞台!
国外问卷调查怎么赚钱?为什么需要IP代理的加持?
随着互联网的普及,越来越多的人开始在网上寻找赚钱的机会。国外问卷调查是一个非常受欢迎的赚钱方式,通过填写问卷来获取奖励或者现金。 然而,对于一些想要尝试这种赚钱方式的人来说,他们可能会发现自己无法接受问卷调查,或者收到的奖励很少,这时候,使用IP代理可能会成为解决方案。
garry5544..
2023/04/23
9210
2017最不受欢迎编程语言榜,PHP上榜
01 最不受欢迎的编程语言 在 Stack Overflow 上,开发者可以创建属于自己的“Developer Story”,用来记录项目开发、获得的成就等个人开发经验,相当于简历,待发布之后也可以
BestSDK
2018/03/02
1.3K0
2017最不受欢迎编程语言榜,PHP上榜
动态 | Kaggle16000份问卷揭示数据科学家平均画像:30岁,硕士学位,年薪36万
AI科技评论按,日前,Kaggle官网发布了一份关于数据科学和机器学习的调查报告,他们通过分析超过16000份相关用户的问卷调查,给出了数据科学行业从业人员的基本概况,大家在工作中使用比较多的方法以及对初入该行业的人的建议。 AI科技评论将核心内容编译如下: 为了建立对数据科学和机器学习的全面认识,Kaggle在今年首次开展了一项覆盖多个行业的调查研究。 他们收到了超过16000份回复,了解到该行业很多的相关信息,例如数据科学从业者的概括、机器学习领域的前沿研究,以及新手数据科学家如何能最好地进入这个领域。
AI科技评论
2018/03/14
7990
动态 | Kaggle16000份问卷揭示数据科学家平均画像:30岁,硕士学位,年薪36万
十分钟搭建自己的问卷调查系统 | 码云周刊第 26 期
1调研问卷系统 DWSurvey 项目简介:DWSurvey 是一款方便、高效、实用的调研问卷系统,一款基于 JAVA WEB 的开源问卷表单系统。 项目特色: 全新体验、流程简单 以一种全新的设计体
码云Gitee
2018/03/29
4.8K0
十分钟搭建自己的问卷调查系统 | 码云周刊第 26 期
Kaggle 年度报告出炉:数据科学家年轻多金,薪资近百万
---- 新智元报道   来源:HyperAI超神经 编辑:SF 【新智元导读】近日,kaggle 在对 20,036 名 Kaggle 用户的反馈进行数据清洗后,发布其年度调查报告《机器学习与数据科学 2020》,向我们展示了当前数据科学家的群体画像。 数据分析竞赛平台 kaggle,近期针对平台用户进行了一项调查,涉及从业者基本信息、薪资水平、工作经验等多个维度。 对 20,036 名 Kaggle 用户的反馈进行数据清洗后,kaggle 最终针对 13%(2675 名)的受访者编制了这份报告
新智元
2023/05/22
3700
Kaggle 年度报告出炉:数据科学家年轻多金,薪资近百万
现代 Web 开发者问卷调查报告
前些日子在 GMTC 北京 2021 技术大会上分享的《字节跳动的现代 Web 开发实践》,介绍了「现代 Web 开发」这场「范式转移」,在字节跳动如何转化成具体的技术栈和研发体系,在内部广泛落地和从中获益。分享中也预告了开源项目 Modern.js、发布了「现代 Web 开发者问卷调查」。截止 8 月 20 日,已经收到了 「612」 份有效回复,在汇总和交叉对比之后,可以看到很多跟「现代 Web 开发」有关的结果:
用户6835371
2021/09/03
1.6K0
现代 Web 开发者问卷调查报告
推荐阅读
相关推荐
Plotly 初步
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档