GitHub刚刚发布了最新一期年度报告,其中列出了不少惊人的数字。遗憾的是,其中部分结果(特别是高达4000万开发人员这部分)不仅令人震惊,同时也是错得离谱。
当然,我并不是说GitHub是在恶意欺骗大众,他们也不会是那种博眼球的人。我想表达的意思是,单纯通过GitHub的账户数量,并不能让我们得出准确的开发人员数量结论。更重要的是,我们也没有必要通过硬性夸大开发者群体规模来强调开发工作的重要意义。
令人称奇的是,GitHub在列出4000万这一数字之后,马上添加了一条注释:4000万是指“截至2019年9月30日,GitHub上非垃圾邮件用户账户的总数,且无论活跃状态如何。”因此,就算是不谈是否真的对应这么多真人开发者,4000万个账户也仍然令人印象深刻,对吧?
嗯……恐怕还是有点难讲。
分析师Lawrence Hecht首先加入讨论,他表示“单凭有人创建了GitHub账户,并不能证明他们就是开发人员。真正重要的,是在账户创建的一个月之内,有多少个账户实际上变成了「无效」账户。”
所以说,GitHub账户并不一定能够与开发人员一一对应。毕竟我就有GitHub账户,但我本人恐怕算不上是开发人员。另外,我也认识不少产品运营以及产品管理人员,他们也都有GitHub账户,但从来不会在那里或者是任何其他场景下开发软件。不仅如此,也有很多账户几乎没怎么用过——或者至少是像Tom Krazit那样几年不登录一回。当然,还有不少人会像Ian Massingham那样一个人创建多个账户。
因此,如果我们真的关心开发人员的活动情况,那么调查就应该集中在那些真正着手进行代码贡献的群体身上。Hecht感叹道,“报告中提及的大多数人并不活跃。”相比之下,Adobe公司开源开发者Fil Maj则主张通过衡量企业贡献排名等其他几种方式,计算出较为可靠的活跃贡献者数量。GitHub本来也能轻松做到,但他们却没有选择这样的方式——我这么说可是有根有据的,GitHub在报告里已经列出了各类项目的积极贡献者人数,所以他们显然是掌握了这方面数据的。
不过别担心,各大分析企业给出了更靠谱的开发人员数量结果。例如,IDC公司认为开发人员的数量为:
加起来,全球共有约2420万软件开发人员。这一结果与Evans Data等其他分析企业的估算基本相符,后者在2018年的报告认为全球共有2300万开发人员,这一数字到2023年预计将增长至2770万。
好吧,姑且相信是真的。但正如Jono Bacon提出的反对意见,“我不知道普通用户/开发人员为什么要关心这件事。”GitHub或者其他地方到底有多少开发人员,有什么关系吗?
也有人,例如投资者Ethan Kurzweil,认为应该根据当前及未来的开发人员数量来估算行业投资的资金规模。在提到 GitHub发布的4000万数字时,他表示这是“一项强有力的领先指标,表示未来的开发者技术市场将一片光明。”我觉得他说得没错,但这种光明恐怕不是4000万这个错误数字带来的。
举例来说,GitHub的年度报告将first contributions 库列为过去一年当中贡献度最活跃的库之一(排名第四)。令人惊奇的是,Hecht提到该库旨在帮助初学者们一步步学会如何为开源项目做出贡献。由于开源技术对个人以及组织的重要性正与日俱增,对该库做出贡献的用户数量也在快速增长(已经超过15000名,且仍在不断增长)。在我看来,这个数字的意义要比4000万这么个亦真亦假的总体账户数量重要得多。
或者咱们换个角度,看看2019年内出现的130万首次贡献者?或者说来自美国以外的开源代码贡献已经大大超过本土贡献量(海外80%,本土20%)?或者说亚洲目前占2019年全部私有库中的36%?就贡献者数量的增长而言,全球范围内中国香港、新加坡以及日本成为增速最快的地区/国家。而在开源项目使用量方面(按克隆与分叉来衡量),中国则仅次于美国。
最后,这些数字非常重要,因为其不仅影响着软件开发行业,更影响到整个社会。我们的世界没有4000万名开发人员,但开发者群体确实在不断增加,大多数开源贡献活动发生在美国以外。在我看来,4000万这样的营销数字没什么意义,这些事实才是关键。
领取专属 10元无门槛券
私享最新 技术干货