Apache Parquet MR 1.12.0 发布,列存储格式

栏目: 软件资讯 · 发布时间: 3年前

内容简介:Apache Parquet MR 1.12.0 已经发布。 Parquet 是支持嵌套数据的通用列文件格式,使用节省空间的编码和用于处理框架(如Hadoop)的压缩和可拆分结构。 主要更新内容 parquet-format-structures 加密 parquet-mr 代...

Apache Parquet MR 1.12.0 已经发布。 Parquet 是支持嵌套数据的通用列文件格式,使用节省空间的编码和用于处理框架(如Hadoop)的压缩和可拆分结构。

主要更新内容

  • parquet-format-structures 加密
  • parquet-mr 代码更改以支持加密
  • 添加空命令
  • [C++] 修复在 32 位结构上产生的损坏文件
  • 修复 Maven Protobuf 插件无法正常工作的问题
  • 修复升级 Scrooge 版本时出现编译错误的问题
  • 修复 API 后向兼容性问题导致主分支构建失败的问题
  • 修复在 ParquetInputSplit 中找不到 FilleInputSplit 的问题
  • 修复 ParquetMetadataConveter 在 Iceberg 单元测试中抛出 NPE 的问题
  • 添加加密密钥管理工具
  • 添加 BYTE_STREAM_SPLIT 编码
  • 添加 parquet 加密的属性驱动接口

详情请查看更新公告


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

图论算法理论、实现及应用

图论算法理论、实现及应用

王桂平//王衍//任嘉辰 / 北京大学 / 2011-1 / 54.00元

《图论算法理论、实现及应用》系统地介绍了图论算法理论,并选取经典的ACM/ICPC竞赛题目为例题阐述图论算法思想,侧重于图论算法的程序实现及应用。《图论算法理论、实现及应用》第1章介绍图的基本概念和图的两种存储表示方法:邻接矩阵和邻接表,第2~9章分别讨论图的遍历与活动网络问题,树与图的生成树,最短路径问题,可行遍性问题,网络流问题,支配集、覆盖集、独立集与匹配,图的连通性问题,平面图及图的着色问......一起来看看 《图论算法理论、实现及应用》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

URL 编码/解码
URL 编码/解码

URL 编码/解码

html转js在线工具
html转js在线工具

html转js在线工具