GitHub今天发布了年度报告。去年有1000万的新开发者加入了GitHub社区,80%的repo贡献来自于美国本土之外,中国对开源的贡献仅次于美国。
报告还发现,以“深度学习”、“自然语言处理”和“机器学习”为主题的repo在过去的一年中越发受欢迎。
贡献最多的开源项目来自微软的VS Code (19.1K)、Azure Docs (14K)和Flutter (13K)。
紧随其后的是谷歌的TensorFlow (9.9K)、Kubernetes (6.9K)和Facebook创建的React原生框架。
虽然自2014年以来,我们都知道GitHub中大部分的repo来自美国本土之外,但最新的报告明确指出,这一数字已经超过80%。
在过去的一年中,GitHub总共创建了4400万个repo,并且在2018年11月突破1亿大关。
Python首次击败Java
JavaScript仍然是开发人员在GitHub上使用的最流行的语言。但在GitHub历史上,Python首次击败Java,成为使用第二多的编程语言。
报告还指出了增长最快的编程语言:Dart。Dart是谷歌用户界面工具包Flutter的编程语言。
其次是Rust、HCL、Kotlin和TypeScript。中国开源贡献仅次美国
最大的repo贡献还是来自亚洲、欧洲和北美。
上图展示了自2014年开始,美国之外的repo贡献便已经开始超过本土。
继美国之后,中国、印度和德国今年加快了开放源代码的使用速度。中国的开发者fork和clone的项目比去年多了48%。
然而,非洲国家在开放源代码repo的百分比增长方面处于领先地位。尼日利亚、肯尼亚、突尼斯和摩洛哥的增长速度最快。
在整个非洲,贡献增加了40%,比任何其他大陆都多。报告还发现,76万名开发人员正在学习在GitHub Student Developer Pack上编写代码。
TensorFlow
作为GitHub上最受欢迎的项目之一,TensorFlow已经建立了一个庞大的软件社区。去年有9900人为TensorFlow做出了贡献,有4.6万个项目依赖于TensorFlow。
虽然PyTorch近年来发展势头迅猛,但从GitHub的报告来看,最受欢迎的还是TensorFlow。
数据科学成焦点
GitHub的报告还指出,产业界的焦点在数据科学。Python增长的背后是快速扩张的数据科学用户社区,以及他们每天使用的工具和框架。
其中包括许多由Python驱动的核心数据科学软件包,这些软件包既降低了数据科学工作的障碍,成为了学术界和产业界项目的基础。
除Python外,随着越来越多的社区专注于数据科学,近年来诸如“深度学习”,“自然语言处理”和“机器学习”等主题的repo变得越来越受欢迎。
在这些主题里星标最多的repo中,超过一半的repo基于numpy构建,其中还有很多依赖于scipy,scikit-learn和TensorFlow。此外还有数据科学领域的非代码贡献,包括学术论文等资源。在数据科学的主题中,Jupyter和NLP成为增长最快的两大亮点。从2016年到2019年,Jupyter Notebook的使用量连续三年增长率都超过100%。
自然语言处理在GitHub上也越来越受欢迎,因为NTLK之类的工具包降低了NLP的入门门槛。
One more thing
2019年Octoverse报告在GitHub Universe之前发布,有关人士预计将在大会发布新的开发人员工具。
对此,你有所期待吗?
领取专属 10元无门槛券
私享最新 技术干货