学习 Spark 2(五):RDD 缓存

栏目: 编程工具 · 发布时间: 8年前

内容简介:学习 Spark 2(五):RDD 缓存

RDD 是惰性求值的

计算过程中,多次使用同一组数据时,通过调用 RDD.cacheRDD.persist 对 RDD 进行缓存持久哈,可以避免重复计算

当持久化一个 RDD 时,计算出 RDD 的节点会分别保存它们所求出的分区数据

出于不同的目的,可以选择不同的持久化级别:

注: RDD.cacheRDD.persist(StorageLevel.MEMORY_ONLY) 的简化,即把数据存储到内存中

Storage Level 说明
MEMORY_ONLY 存储未序列化的 Java 对象到 JVM。内存不足,则未缓存分区每次将重新计算。
MEMORY_AND_DISK 存储未序列化的 Java 对象到 JVM。内存不足,则溢写到磁盘上。
MEMORY_ONLY_SER 序列化数据的 MEMORY_ONLY
MEMORY_AND_DISK_SER 序列化数据的 MEMORY_AND_DISK
DISK_ONLY 存储数据到硬盘
_2 复制数据的一份副本
OFF_HEAP 类似 MEMORY_ONLY_SER,但是存储数据到堆外内存

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

深入解析Spring MVC与Web Flow

深入解析Spring MVC与Web Flow

Seth Ladd、Darren Davison、Steven Devijver、Colin Yates / 徐哲、沈艳 / 人民邮电出版社 / 2008-11 / 49.00元

《深入解析Spring MVCgn Web Flow》是Spring MVC 和Web Flow 两个框架的权威指南,书中包括的技巧和提示可以让你从这个灵活的框架中汲取尽可能多的信息。书中包含了一些开发良好设计和解耦的Web 应用程序的最佳实践,介绍了Spring 框架中的Spring MVC 和Spring Web Flow,以及着重介绍利用Spring 框架和Spring MVC 编写Web ......一起来看看 《深入解析Spring MVC与Web Flow》 这本书的介绍吧!

html转js在线工具
html转js在线工具

html转js在线工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具