无冕王者NumPy:GitHub 2018 机器学习年度官方报告

栏目: Python · 发布时间: 6年前

内容简介:在 GitHub 的 2018 年度报告中,机器学习和数据科学是 GitHub 上的热门话题。是贡献者最多的项目之一,PyTorch 是增长最快的项目之一,Python 是 GitHub 上第三流行的语言。为了深入研究 GitHub 上的机器学习和数据科学现状,GitHub 发布了关于二者的具体报告,统计了 2018 年 1 月 1 日到 12 月 31 日的贡献数据,包括 push 代码、打开 issue 或 pull request、评论 issue 等。至于最流行的包,GitHub 使用了来自依赖图的

在 GitHub 的 2018 年度报告中,机器学习和数据科学是 GitHub 上的热门话题。是贡献者最多的项目之一,PyTorch 是增长最快的项目之一,Python 是 GitHub 上第三流行的语言。

为了深入研究 GitHub 上的机器学习和数据科学现状,GitHub 发布了关于二者的具体报告,统计了 2018 年 1 月 1 日到 12 月 31 日的贡献数据,包括 push 代码、打开 issue 或 pull request、评论 issue 等。至于最流行的包,GitHub 使用了来自依赖图的数据,包括所有开放 repo 和依赖图中现有的私有 repo。

编程语言

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 查看了「machine-learning」相关 repo 的贡献者,对这些 repo 最常用的语言进行了排序。Python 是机器学习repo 中最常用的语言,也是 GitHub 平台上第三流行的语言。但是,并非所有机器学习repo 都使用 Python:GitHub 上的一些常用语言也是机器学习项目的常用语言。C++、JavaScript、 Java 、C#、 Shell 和 TypeScript 都在 GitHub 常用语言前十名中,同时也是机器学习项目常用语言前十名。Julia、R 和 Scala 仅为机器学习项目前十,但在 GitHub 平台的使用率并没有那么高。Julia和 R 是数据科学家常用的语言,Scala 在和大数据系统(如 Apache Spark)互动时的使用率逐渐提高。

流行的机器学习和数据科学包

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 从依赖图中抓取数据,计算机器学习或数据科学项目导入不同流行 Python 包的比例。上述列表展示了这些项目导入包的 top 10。从中,我们可以看到:

  • 支持在多维数据上的数学运算的 Numpy 包是最常导入的包,几乎 1/3 的机器学习和数据科学项目使用了 Numpy 包。

  • 用于科学计算的 Scipy 包、用于管理数据集的 pandas、可视化库 matplotlib 在机器学习和数据科学项目中的使用率均超过 40%。

  • Scikit-learn 是流行的机器学习包,包含大量机器学习算法的实现,几乎 40% 的机器学习和数据科学项目使用该包。

  • 接近 1/4 的机器学习和数据科学项目使用用于处理神经网络的 tensorflow 包。

前十名中的其余各包是实用程序包:six 是 Python 2 和 3 兼容库,python-dateutil 和 pytz 是处理日期的包。

最受欢迎的机器学习项目

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 还查看了 2018 年「机器学习」标签下贡献者最多的开源项目。tensorflow 是目前最受欢迎的项目,贡献者人数是第二名 scikit-learn 的 5 倍。前十名中的 explosion/spaCy 和 RasaHQ/rasa_nlu 项目聚焦于自然语言处理问题,CMU-Perceptual-Computing-Lab/openpose、thtrieu/darkflow、ageitgey/face_recognition 和 tesseract-ocr/tesseract 聚焦于图像处理问题。Julia语言源代码也是 2018 年贡献者最多的项目之一。

原文链接:https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/


以上所述就是小编给大家介绍的《无冕王者NumPy:GitHub 2018 机器学习年度官方报告》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Text Processing in Python

Text Processing in Python

David Mertz / Addison-Wesley Professional / 2003-6-12 / USD 54.99

Text Processing in Python describes techniques for manipulation of text using the Python programming language. At the broadest level, text processing is simply taking textual information and doing som......一起来看看 《Text Processing in Python》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

在线进制转换器
在线进制转换器

各进制数互转换器

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具