SessionCatalog 是底层元数据(基于内存和基于 Hive)的代理,同时也负责临时视图和函数的管理。
SessionCatalog 类图:
ExternalCatalog
ExternalCatalog 用于管理数据库、表、分区和函数,在 Spark SQL 中具体有两个实现:
InMemoryCatalog HiveExternalCatalog
InMemoryCatalog
是 ExternalCatalog 基于内存(内部使用 scala.collection.mutable.HashMap )的实现,主要用于测试和探索。不建议用于生产环境。
HiveExternalCatalog
是 ExternalCatalog 基于 Hive(内部使用 org.apache.hadoop.hive.ql.metadata.Hive )的实现。
GlobalTempViewManager
GlobalTempViewManager 是线程安全的全局临时视图管理器,提供了对全局视图的原子操作,包括创建、更新和删除等。
内部由 scala.collection。mutable.HashMap[String, LogicalPlan] 实现。
FunctionResourceLoader
TODO
FunctionRegistry
提供了函数的注册、查找和删除等功能。
默认实现类 org.apache.spark.sql.catalyst.analysis.SimpleFunctionRegistry 。
基于 Spark 2.3.0 版本
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 以太坊源码分析(36)ethdb源码分析
- [源码分析] kubelet源码分析(一)之 NewKubeletCommand
- libmodbus源码分析(3)从机(服务端)功能源码分析
- [源码分析] nfs-client-provisioner源码分析
- [源码分析] kubelet源码分析(三)之 Pod的创建
- Spring事务源码分析专题(一)JdbcTemplate使用及源码分析
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
算法设计与分析基础
Anany Levitin / 潘彦 / 清华大学出版社 / 2015-2-1 / 69.00元
作者基于丰富的教学经验,开发了一套全新的算法分类方法。该分类法站在通用问题求解策略的高度,对现有大多数算法准确分类,从而引领读者沿着一条清晰、一致、连贯的思路来探索算法设计与分析这一迷人领域。《算法设计与分析基础(第3版)》作为第3版,相对前版调整了多个章节的内容和顺序,同时增加了一些算法,并扩展了算法的应用,使得具体算法和通用算法设计技术的对应更加清晰有序;各章累计增加了70道习题,其中包括一些......一起来看看 《算法设计与分析基础》 这本书的介绍吧!