Hive小技巧及优化

栏目: 服务器 · 发布时间: 6年前

内容简介:查询除了ds 和 hr 之外的所有列匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

查询除了ds 和 hr 之外的所有列

SELECT `(ds|hr)?+.+` FROM sales

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select#LanguageManualSelect-REGEXColumnSpecification

修改表生命周期(ODPS)

ALTER TABLE table_name SET lifecycle days;

正则匹配

匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

解析执行过程

explain

效率优化

数据倾斜

count(distinct ) 效率低下,数据倾斜,改用 group by 优化

遇到的坑

查询空值

例 字段 A 有三种取值 Y , N , null (空值)

我想取 Nnull ,如果查询条件为 <> ‘Y’ ,是查不出 null

应该这么写 A <> ‘Y’ or A is null

其他

快速编辑

vscode中

选择多行

option + shift + 鼠标左键

编辑每行的末尾或者开头

使用正则表达式进行替换 开头 ^ ,末尾 $


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

信息检索

信息检索

David A.Grossman、Ophir Frieder / 张华平 / 人民邮电出版社 / 201008 / 49.00元

随着Google、百度等搜索引擎公司的崛起,信息检索已经成为令人振奋的热门研究领域。 本书从发展的角度描述了ad hoc信息检索,讨论了用来实现大规模数据检索的最新算法。详细介绍了推理网络和系统的效率,并且对每种方法都给出了详细可行的实例。此外,本书整合了非结构化和结构化数据的处理技术,是其他教材所不具备的。第2版新增加了IR语言模型和跨语言检索。还讨论了许多当前的热点话题,如XML、P2P......一起来看看 《信息检索》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具