Hive小技巧及优化

栏目: 服务器 · 发布时间: 6年前

内容简介:查询除了ds 和 hr 之外的所有列匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

查询除了ds 和 hr 之外的所有列

SELECT `(ds|hr)?+.+` FROM sales

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select#LanguageManualSelect-REGEXColumnSpecification

修改表生命周期(ODPS)

ALTER TABLE table_name SET lifecycle days;

正则匹配

匹配除“*n*”之外的任何单个字符。要匹配包括“*n*”在内的任何字符,请使用像“(.|\n)”的模式。

解析执行过程

explain

效率优化

数据倾斜

count(distinct ) 效率低下,数据倾斜,改用 group by 优化

遇到的坑

查询空值

例 字段 A 有三种取值 Y , N , null (空值)

我想取 Nnull ,如果查询条件为 <> ‘Y’ ,是查不出 null

应该这么写 A <> ‘Y’ or A is null

其他

快速编辑

vscode中

选择多行

option + shift + 鼠标左键

编辑每行的末尾或者开头

使用正则表达式进行替换 开头 ^ ,末尾 $


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

算法导论(原书第2版)

算法导论(原书第2版)

[美] Thomas H.Cormen、Charles E.Leiserson、Ronald L.Rivest、Clifford Stein / 潘金贵 等 / 机械工业出版社 / 2006-9 / 85.00元

这本书深入浅出,全面地介绍了计算机算法。对每一个算法的分析既易于理解又十分有趣,并保持了数学严谨性。本书的设计目标全面,适用于多种用途。涵盖的内容有:算法在计算中的作用,概率分析和随机算法的介绍。书中专门讨论了线性规划,介绍了动态规划的两个应用,随机化和线性规划技术的近似算法等,还有有关递归求解、快速排序中用到的划分方法与期望线性时间顺序统计算法,以及对贪心算法元素的讨论。此书还介绍了对强连通子图......一起来看看 《算法导论(原书第2版)》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

URL 编码/解码
URL 编码/解码

URL 编码/解码