在Python和R中运行相同的任务

栏目: Python · 发布时间: 6年前

根据KDD调查,较少的受访者(按比例计算)在2017年仅使用R而不是2018年。同时,更多的受访者(按比例)在2017年仅使用 Python 而不是2016年。

让我们以此为借口快速了解当我们在两个系统中尝试任务时会发生什么。

对于我们的任务,我们选择了在仅有8GB内存的机器上直接读取50,000,000行50列数据集到内存中是痛苦的操作。

在Python中,Pandas包大约需要6分钟来读取数据,然后就可以准备工作了。

在Python和R中运行相同的任务

在R中,当内存不足时,utils::read.csv()和readr::read_csv()失败。因此,如果您对R的看法是“基本只有R”,或“基本只有R + tidyverse”,或“基本只有tidyverse”,读取这个文件是一项“艰巨的任务”。

在Python和R中运行相同的任务

按照上面的狭隘观点,如果想要完成工作,除了使用Python之外别无选择。

或者,我们可以记住data.table。而data.table显然不是tidyverse数据的一部分。data.table在R领域已经有12年的历史了。它可以读取数据,并且可以在不到一分钟的时间内以R语言工作。

在Python和R中运行相同的任务

总之,在紧急情况下完成任务:学习Python或学习data.table。而且,在我看来,“tidyverse first teaching”(通常是“tidyverse only teaching”的代码)从长远来看可能并不适合R社区。

作者: 原文链接: https://www.r-bloggers.com/running-the-same-task-in-python-and-r/

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

探索需求

探索需求

章柏幸、王媛媛、谢攀、杰拉尔德・温伯格、唐纳德・高斯 / 章柏幸、王媛媛、谢攀 / 清华大学出版社 / 2004-7-1 / 39.00元

本书将与您一起寻找"什么是客户真正想要的"这一问题的答案。 本书着眼于系统设计之前的需求过程,它是整个开发过程(如何设计人们想要的产品和系统)中最有挑战性的那部分。通过对一些需求分析中的常见误区和问题的分析和讨论,从和客户沟通开始,深入研究一些可能的需求,澄清用户和开发者期望值,最终给出了能够大幅度提高项目成功几率的一些建议方法。 本书由该领域内公认的两位作者合著,搜集了他们在大大小小......一起来看看 《探索需求》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具