Hive小技巧及优化

栏目: 服务器 · 发布时间: 6年前

内容简介:查询除了ds 和 hr 之外的所有列匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

查询除了ds 和 hr 之外的所有列

SELECT `(ds|hr)?+.+` FROM sales

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select#LanguageManualSelect-REGEXColumnSpecification

修改表生命周期(ODPS)

ALTER TABLE table_name SET lifecycle days;

正则匹配

匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

解析执行过程

explain

效率优化

数据倾斜

count(distinct ) 效率低下,数据倾斜,改用 group by 优化

遇到的坑

查询空值

例 字段 A 有三种取值 Y , N , null (空值)

我想取 Nnull ,如果查询条件为 <> ‘Y’ ,是查不出 null

应该这么写 A <> ‘Y’ or A is null

其他

快速编辑

vscode中

选择多行

option + shift + 鼠标左键

编辑每行的末尾或者开头

使用正则表达式进行替换 开头 ^ ,末尾 $


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

领域特定语言

领域特定语言

Martin Fowler / ThoughtWorks中国 / 机械工业出版社华章公司 / 2013-3 / 89.00元

本书是DSL领域的丰碑之作,由世界级软件开发大师和软件开发“教父”Martin Fowler历时多年写作而成,ThoughtWorks中国翻译。全面详尽地讲解了各种DSL及其构造方式,揭示了与编程语言无关的通用原则和模式,阐释了如何通过DSL有效提高开发人员的生产力以及增进与领域专家的有效沟通,能为开发人员选择和使用DSL提供有效的决策依据和指导方法。 全书共57章,分为六个部分:第一部分介......一起来看看 《领域特定语言》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换