用Partition函数怎么实现Hive动态分区
这篇文章主要讲解了“用Partition函数怎么实现Hive动态分区”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“用Partition函数怎么实现Hive动态分区”吧!
为修武等地区用户提供了全套网页设计制作服务,及修武网站建设行业解决方案。主营业务为成都网站制作、做网站、修武网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!
一、前段时间因为导表需求(从一张表中查找出数据,按日期分区overwrite 到指定分区表中),在Hive里面研究了一下自动分区。
步骤:
1、建好所需分区表
2、设置分区参数
set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) set hive.exec.dynamic.partition.mode=nonstrict; SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错) SET hive.exec.max.dynamic.partitions.pernode=100000;
3、书写代码(特别注意:日期字段一定要放在末尾),例如:
INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) select id ,... ,pv ,0 uv ,cal_dt from dw_stage.tiny_info_msg
二、如果要在partition字段用函数处理也可通过通过这种方式实现;例如:
set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nostrick; INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) SELECT id ,... ,pv ,date_sub('2014-03-23',7) cal_dt FROM dw_stage.tiny_info_msg07;
感谢各位的阅读,以上就是“用Partition函数怎么实现Hive动态分区”的内容了,经过本文的学习后,相信大家对用Partition函数怎么实现Hive动态分区这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!
分享题目:用Partition函数怎么实现Hive动态分区
标题URL:http://scyanting.com/article/jegodg.html