Hive小技巧及优化

栏目: 服务器 · 发布时间: 7年前

内容简介:查询除了ds 和 hr 之外的所有列匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

查询除了ds 和 hr 之外的所有列

SELECT `(ds|hr)?+.+` FROM sales

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select#LanguageManualSelect-REGEXColumnSpecification

修改表生命周期(ODPS)

ALTER TABLE table_name SET lifecycle days;

正则匹配

匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

解析执行过程

explain

效率优化

数据倾斜

count(distinct ) 效率低下,数据倾斜,改用 group by 优化

遇到的坑

查询空值

例 字段 A 有三种取值 Y , N , null (空值)

我想取 Nnull ,如果查询条件为 <> ‘Y’ ,是查不出 null

应该这么写 A <> ‘Y’ or A is null

其他

快速编辑

vscode中

选择多行

option + shift + 鼠标左键

编辑每行的末尾或者开头

使用正则表达式进行替换 开头 ^ ,末尾 $


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

中国机器人

中国机器人

[中]王鸿鹏、[中]马娜 / 辽宁人民出版社 / 2017-1-1 / 48.00元

本书对中国机器人领域的发展历史做了引人入胜的介绍,中国机器人成长的过程也是中国经济由弱到强的历程。本书实际是选择了一个独特的视角来解读中国数十年的政治、经济、国家战略问题。中国的未来充满了多重可能性,本书对想了解中国当代与未来发展战略的读者是难得的读本,对智能制造这一当今世界*受关注的高科技领域在战略层面和科技伦理层面进行了深入地剖析和思考,其中提出的诸多前沿性观点是全球都将面对的问题,对中国科学......一起来看看 《中国机器人》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具