无冕王者NumPy:GitHub 2018 机器学习年度官方报告

栏目: Python · 发布时间: 5年前

内容简介:在 GitHub 的 2018 年度报告中,机器学习和数据科学是 GitHub 上的热门话题。是贡献者最多的项目之一,PyTorch 是增长最快的项目之一,Python 是 GitHub 上第三流行的语言。为了深入研究 GitHub 上的机器学习和数据科学现状,GitHub 发布了关于二者的具体报告,统计了 2018 年 1 月 1 日到 12 月 31 日的贡献数据,包括 push 代码、打开 issue 或 pull request、评论 issue 等。至于最流行的包,GitHub 使用了来自依赖图的

在 GitHub 的 2018 年度报告中,机器学习和数据科学是 GitHub 上的热门话题。是贡献者最多的项目之一,PyTorch 是增长最快的项目之一,Python 是 GitHub 上第三流行的语言。

为了深入研究 GitHub 上的机器学习和数据科学现状,GitHub 发布了关于二者的具体报告,统计了 2018 年 1 月 1 日到 12 月 31 日的贡献数据,包括 push 代码、打开 issue 或 pull request、评论 issue 等。至于最流行的包,GitHub 使用了来自依赖图的数据,包括所有开放 repo 和依赖图中现有的私有 repo。

编程语言

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 查看了「machine-learning」相关 repo 的贡献者,对这些 repo 最常用的语言进行了排序。Python 是机器学习repo 中最常用的语言,也是 GitHub 平台上第三流行的语言。但是,并非所有机器学习repo 都使用 Python:GitHub 上的一些常用语言也是机器学习项目的常用语言。C++、JavaScript、 Java 、C#、 Shell 和 TypeScript 都在 GitHub 常用语言前十名中,同时也是机器学习项目常用语言前十名。Julia、R 和 Scala 仅为机器学习项目前十,但在 GitHub 平台的使用率并没有那么高。Julia和 R 是数据科学家常用的语言,Scala 在和大数据系统(如 Apache Spark)互动时的使用率逐渐提高。

流行的机器学习和数据科学包

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 从依赖图中抓取数据,计算机器学习或数据科学项目导入不同流行 Python 包的比例。上述列表展示了这些项目导入包的 top 10。从中,我们可以看到:

  • 支持在多维数据上的数学运算的 Numpy 包是最常导入的包,几乎 1/3 的机器学习和数据科学项目使用了 Numpy 包。

  • 用于科学计算的 Scipy 包、用于管理数据集的 pandas、可视化库 matplotlib 在机器学习和数据科学项目中的使用率均超过 40%。

  • Scikit-learn 是流行的机器学习包,包含大量机器学习算法的实现,几乎 40% 的机器学习和数据科学项目使用该包。

  • 接近 1/4 的机器学习和数据科学项目使用用于处理神经网络的 tensorflow 包。

前十名中的其余各包是实用程序包:six 是 Python 2 和 3 兼容库,python-dateutil 和 pytz 是处理日期的包。

最受欢迎的机器学习项目

无冕王者NumPy:GitHub 2018 机器学习年度官方报告

GitHub 还查看了 2018 年「机器学习」标签下贡献者最多的开源项目。tensorflow 是目前最受欢迎的项目,贡献者人数是第二名 scikit-learn 的 5 倍。前十名中的 explosion/spaCy 和 RasaHQ/rasa_nlu 项目聚焦于自然语言处理问题,CMU-Perceptual-Computing-Lab/openpose、thtrieu/darkflow、ageitgey/face_recognition 和 tesseract-ocr/tesseract 聚焦于图像处理问题。Julia语言源代码也是 2018 年贡献者最多的项目之一。

原文链接:https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/


以上所述就是小编给大家介绍的《无冕王者NumPy:GitHub 2018 机器学习年度官方报告》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

常用算法程序集

常用算法程序集

2009-7 / 58.00元

《常用算法程序集(C++语言描述)第4版》是针对工程中常用且行之有效的算法而编写的,主要内容包括矩阵运算,矩阵特征值与特征向量的计算,线性代数方程组的求解,非线性方程与方程组的求解,插值与逼近,数值积分,常微分方程组的求解,数据处理,极值问题的求解,复数、多项式与特殊函数的计算,查找与排序。书中所有的算法程序均用C++描述,全部程序可从清华大学出版社网站上的《常用算法程序集(C++语言描述)第4版......一起来看看 《常用算法程序集》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具