内容简介:Hive 中Hive 中的Hive 中的
ORDER BY
Hive 中 ORDER BY
的行为与关系型数据库的 ORDER BY
行为一致,实现了数据集的 全局排序
,支持升序(ASC)和降序(DESC)。
SORT BY
Hive 中的 SORT BY
实现了数据集的 Map 排序
,为每个 reducer 产生一个 排序 文件,支持升序(ASC)和降序(DESC)。如果只有一个 reducer(通过 SET mapred.reduce.tasks=1
),那么 SORT BY
和 ORDER BY
的效果是相同的。
DISTRIBUTE BY
Hive 中的 DISTRIBUTE BY
实现了数据集的 Map 重分区
,保证字段值相同的行在同一个 reducer。
CLUSTER BY
Hive 中的 CLUSTER BY
结合了 SORT BY
和 DISTRIBUTE BY
,实现了数据集的 局部排序
,支持升序(ASC)和降序(DESC)。
参考
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Cyberwar
Kathleen Hall Jamieson / Oxford University Press / 2018-10-3 / USD 16.96
The question of how Donald Trump won the 2016 election looms over his presidency. In particular, were the 78,000 voters who gave him an Electoral College victory affected by the Russian trolls and hac......一起来看看 《Cyberwar》 这本书的介绍吧!