​为什么Python在数据科学领域比R更受欢迎呢?

栏目: IT技术 · 发布时间: 4年前

​为什么 <a href='https://www.codercto.com/topics/20097.html'>Python</a> 在数据科学领域比R更受欢迎呢?

全文共 2256 字,预计学习时长 7 分钟

​为什么Python在数据科学领域比R更受欢迎呢?

来源:aliyun

新入门的数据科学家都面临一个非常重要的问题: 我应该学习Python还是R?

这个问题非常重要,因为学习第一门编程语言需要花费很多时间。 尝试两者兼得是不切实际的,尤其是在你刚开始职业生涯的时候。

所以你应该选哪一个呢?

根据我的经验,如果选择Python,你的职业生涯会受益更多。

在我看来,Python,尤其是在刚刚起步的情况下,是从事数据科学的更好选择

我会分四点来解释为什么要选择Python,但同时我要声明,这并不意味着R是一个糟糕的选择。

​为什么Python在数据科学领域比R更受欢迎呢?

选择R不会对你的工作产生负面影响,如果你的团队有要求,那你也必须去学习R。 事实上,Facebook已经使用R作为内部调查 工具 的分析组件,我们所有的数据科学基础设施都支持这种语言。

也就是说,我认为如果先学习Python,作为一名实践数据科学家,你将变得更有效率,并且能够更好地在统计建模之外的重要领域为团队做出贡献。

因此,学习Python后,你能为公司带来更大的影响力,而你的职业生涯也会受益更多。

理由1: 你总要学习Python

大多数公司不仅仅要求他们的数据科学家学会预测建模(即机器学习)。 至少,你可能需要维护为模型提供数据的数据管道,而这些数据管道可能是用Python构建的。

如今,管道的行业标准是基于Python的Airflow,,而在Facebook,我们使用的内部Python工具和其基本相同。

事实上,我估计Facebook的所有数据科学家每周都会使用Python,而只有大约10%的人会经常使用R。

因此,选择Python可能更有效: 虽然一些工作可以避免使用R,但不太可能会避免使用Python。

理由2: Python更容易学习

在就业之前,你学习这些技能的时间非常重要,特别是在大学之外自学的话。

Python以易学而闻名。 在同时学习了Python和R之后(尽管更深入地学习了Python),我认为Python有此名声当之无愧。

当你开始使用统计建模以外的语言特性时,Python易于学习的优点尤其明显。 这些特性包括打包项目以供分发、开发命令行接口、使用ORMs(如SQLAlchemy)建模数据结构等。

使用Python能让你更轻松地学会并精通这些特性,你的职业生涯也会因此受益。

理由3:Python社区更大

​为什么Python在数据科学领域比R更受欢迎呢?

来源:Pexels

Python是全球最流行的编程语言之一,在stack overflow、kaggle甚至medium等站点上都有一个庞大的社区。

因此,当遇到一个自己无法解决的问题时,你会更容易找到有经验的人寻求帮助,解决问题。

这意味着你无需在调试与系统的兼容性问题上花太多时间,这样一来,你也有更多的时间交付公司所需的代码。

理由4: Python更易于部署模型

最后,你可能会在职业生涯中达到这样一个阶段: 你想实时将模型提供给任何一个终端用户。 要解决这个问题,需要构建一个基于REST的web应用程序,而使用Python来构建这个程序会容易很多。

事实上,Python拥有一些全球最流行的web应用框架,即Django和Flask。 你公司的内部部署工具更可能支持这些框架,而相对不太可能支持R。

这些框架的流行还意味着它们得到了平台即服务提供商(如Heroku、Amazon Lightsail等)的良好支持。 你将能够在线发布个人项目,这与在R中部署相同项目所需的花费相比,简直是九牛一毛。

最重要的是,如果你足够幸运,你的公司为自己的产品使用了Python框架,学习Python意味着连接你的应用内跟踪变得十分危险。 如果你能自主为模型捕获更多的功能,个人影响力会发生巨大改变。

当然,所有的决定都有取舍,选择学习Python而不是R也是如此。 尽管我相信Python是数据科学职业的更好选择,但也要考虑它带来的不利因素。

对我来说,Python最大的缺点是没有等同于Rstudio的工具。 在Python中最具可比性的工具是Jupyter Notebook,但我个人认为Rstudio更好,因为它具有数据探索功能。

R在学术界也很受欢迎,因此R中包的文档更有可能直接引用学术研究。 这些文档对于从事“尖端”研究的数据科学家来说非常有用。

但我不认为缺少和Rstudio等同的工具可以否定Python的相对优势。 在数据科学学术界,职位也少得多,所以对大多数数据科学家来说,R的研究相关优势也不那么重要了。

​为什么Python在数据科学领域比R更受欢迎呢?

来源:weimeiba

因此,尽管R有很多优点,但我相信如果你选择学习Python,职业生涯将会受益匪浅。

最后值得一提的是,我并不认为学习R是一个糟糕的选择,最重要的是, 不论选择哪种语言,你都不应该永远止步于此。 所有的编程语言之间,相似之处总是多于差异: 学习第二语言也会比学习第一语言容易得多。

事实上,我选择了先学习R! 因此尽管我现在推荐Python作为职业生涯的更好选择,我也很难对R作出不好的评价。

​为什么Python在数据科学领域比R更受欢迎呢?

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组: 马唯一、方媛

相关链接:

https://towardsdatascience.com/why-python-is-better-than-r-for-data-science-careers-44ec7a149a18

如转载,请后台留言,遵守转载规范

推荐文章阅读


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

SEO深度解析

SEO深度解析

痞子瑞 / 电子工业出版社 / 2014-3-1 / CNY 99.00

《SEO深度解析》以SEO从业人员普遍存在的疑问、经常讨论的问题、容易被忽视的细节以及常见的错误理论为基础,对SEO行业所包含的各方面内容进行了深入的讨论,使读者更加清晰地了解SEO及操作思路。内容分为两类:一类为作者根据自己真实、丰富的SEO经验对SEO所涉及的各种问题进行详细的讨论,主要包括SEO 基础原理剖析、SEO实操思路方法、常用工具数据剖析、竞争对手分析案例实操、网站数据分析思路指导、......一起来看看 《SEO深度解析》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码