在Python和R中运行相同的任务

栏目: Python · 发布时间: 7年前

根据KDD调查,较少的受访者(按比例计算)在2017年仅使用R而不是2018年。同时,更多的受访者(按比例)在2017年仅使用 Python 而不是2016年。

让我们以此为借口快速了解当我们在两个系统中尝试任务时会发生什么。

对于我们的任务,我们选择了在仅有8GB内存的机器上直接读取50,000,000行50列数据集到内存中是痛苦的操作。

在Python中,Pandas包大约需要6分钟来读取数据,然后就可以准备工作了。

在Python和R中运行相同的任务

在R中,当内存不足时,utils::read.csv()和readr::read_csv()失败。因此,如果您对R的看法是“基本只有R”,或“基本只有R + tidyverse”,或“基本只有tidyverse”,读取这个文件是一项“艰巨的任务”。

在Python和R中运行相同的任务

按照上面的狭隘观点,如果想要完成工作,除了使用Python之外别无选择。

或者,我们可以记住data.table。而data.table显然不是tidyverse数据的一部分。data.table在R领域已经有12年的历史了。它可以读取数据,并且可以在不到一分钟的时间内以R语言工作。

在Python和R中运行相同的任务

总之,在紧急情况下完成任务:学习Python或学习data.table。而且,在我看来,“tidyverse first teaching”(通常是“tidyverse only teaching”的代码)从长远来看可能并不适合R社区。

作者: 原文链接: https://www.r-bloggers.com/running-the-same-task-in-python-and-r/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

HTML 5实战

HTML 5实战

陶国荣 / 机械工业出版社 / 2011-11 / 59.00元

陶国荣编著的《HTML5实战》是一本系统而全面的HTML 5教程,根据HTML 5标准的最新草案,系统地对HTML 5的所有重要知识点进行了全面的讲解。在写作方式上,本书以一种开创性的方式使理论与实践达到极好的平衡,不仅对理论知识进行了清晰而透彻的阐述,而且根据读者理解这些知识的需要,精心设计了106个完整(每个案例分为功能描述、实现代码、效果展示和代码分析4个部分)的实战案例,旨在帮助读者通过实......一起来看看 《HTML 5实战》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

在线进制转换器
在线进制转换器

各进制数互转换器

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具