在Python和R中运行相同的任务

栏目: Python · 发布时间: 6年前

根据KDD调查,较少的受访者(按比例计算)在2017年仅使用R而不是2018年。同时,更多的受访者(按比例)在2017年仅使用 Python 而不是2016年。

让我们以此为借口快速了解当我们在两个系统中尝试任务时会发生什么。

对于我们的任务,我们选择了在仅有8GB内存的机器上直接读取50,000,000行50列数据集到内存中是痛苦的操作。

在Python中,Pandas包大约需要6分钟来读取数据,然后就可以准备工作了。

在Python和R中运行相同的任务

在R中,当内存不足时,utils::read.csv()和readr::read_csv()失败。因此,如果您对R的看法是“基本只有R”,或“基本只有R + tidyverse”,或“基本只有tidyverse”,读取这个文件是一项“艰巨的任务”。

在Python和R中运行相同的任务

按照上面的狭隘观点,如果想要完成工作,除了使用Python之外别无选择。

或者,我们可以记住data.table。而data.table显然不是tidyverse数据的一部分。data.table在R领域已经有12年的历史了。它可以读取数据,并且可以在不到一分钟的时间内以R语言工作。

在Python和R中运行相同的任务

总之,在紧急情况下完成任务:学习Python或学习data.table。而且,在我看来,“tidyverse first teaching”(通常是“tidyverse only teaching”的代码)从长远来看可能并不适合R社区。

作者: 原文链接: https://www.r-bloggers.com/running-the-same-task-in-python-and-r/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

雷军

雷军

蔡艳鹏 / 2012-12 / 29.80元

《雷军:人因梦想而伟大》内容简介:人生充满着期待,梦想连接着未来。雷军一直有个梦,就是建一个受世人尊敬的企业。他不仅建立了属于自己的受人尊敬的企业,也在帮助别人实现心中的梦想。雷军可以说是创业者、职场人奋斗的榜样,从他在金山的不折不挠,在投资界的百投百中,到小米的成功……无不充满传奇,让无数人争相效仿。一起来看看 《雷军》 这本书的介绍吧!

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试