学习 Hive(九):排序

栏目: 服务器 · 发布时间: 6年前

内容简介:Hive 中Hive 中的Hive 中的

ORDER BY

Hive 中 ORDER BY 的行为与关系型数据库的 ORDER BY 行为一致,实现了数据集的 全局排序 ,支持升序(ASC)和降序(DESC)。

SORT BY

Hive 中的 SORT BY 实现了数据集的 Map 排序 ,为每个 reducer 产生一个 排序 文件,支持升序(ASC)和降序(DESC)。如果只有一个 reducer(通过 SET mapred.reduce.tasks=1 ),那么 SORT BYORDER BY 的效果是相同的。

DISTRIBUTE BY

Hive 中的 DISTRIBUTE BY 实现了数据集的 Map 重分区 ,保证字段值相同的行在同一个 reducer。

CLUSTER BY

Hive 中的 CLUSTER BY 结合了 SORT BYDISTRIBUTE BY ,实现了数据集的 局部排序 ,支持升序(ASC)和降序(DESC)。

参考


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

运营制胜

运营制胜

张恒 / 电子工业出版社 / 2016-10-1 / 65

《运营制胜——从零系统学运营构建用户增长引擎》主要从内容运营、用户运营、推广运营三个方向来介绍产品运营方面的知识。 其中内容运营主要介绍了内容生成的机制、内容方向设定、内容输出、内容生产引擎、内容推荐机制、数据如何驱动内容运营、内容运营的KPI 设定、建立内容库、内容的赢利模式。用户运营主要介绍了产品的冷启动、获得种子用户及早期用户、建立用户增长引擎、利用心理学引爆产品用户增长、增加用户活跃......一起来看看 《运营制胜》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器