hive的metadata中的表用途说明-创新互联

在本例中将Hive的metadata存储在mysql中;

你所需要的网站建设服务,我们均能行业靠前的水平为你提供.标准是产品质量的保证,主要从事成都网站建设、网站制作、企业网站建设、移动网站建设、网页设计、成都品牌网站建设、网页制作、做网站、建网站。创新互联建站拥有实力坚强的技术研发团队及素养的视觉设计专才。

透彻理解每个表的用途,以及每个表之间是通过什么进行关联,对于用hive用着很大的帮助;

Hive的版本不同,表的个数也有可能不同;Hive 1.1是36张表,1.2是35张表;

要重点理解的表:

VERSION

DBS

CDS

TBLS

COLUMNS_V2

PARTITIONS

PARTITION_KEYS

PARTITION_KEY_VALUES

FUNCS

VERSION表

此表中只能有一条信息,如果为0条或者大于1条,Hive均无法启动;
此表记录了Hive的版本信息;

hive的metadata中的表用途说明

DBS表

此表记录了Hive中的数据库信息;
包括数据库的ID(DB_ID)、在HDFS上的存储位置(DB_LOCATION_URI)、DB的名字(NAME字段)

hive的metadata中的表用途说明

TBLS表

此表记录了Hive库中的表信息;
包含了表的ID(TBL_ID)、所属的数据库(DB_ID)、表名(TBL_NAME)、表类型(TBL_TYPE,比如是内部表还是外部表),表的存储格式(SD_ID);
select * from TBLS\G;

hive的metadata中的表用途说明

SDS表

此表记录了表的输入、输出格式、存储位置等信息;
select * from SDS\G;

hive的metadata中的表用途说明

COLUMNS_V2表

此表记录了hive表中的列字段信息;通过CD_ID进行关联;
包含了表的列名(COLUMN_NAME)、列的数据类型(TYPE_NAME)、列的编号(INTEGER_IDX)
select * from COLUMNS_V2\G

注:hive通过列的编号(INTEGER_IDX)来确定列的位置,以防止数据错乱;

hive的metadata中的表用途说明

PARTITIONS(分区)表

此表记录了分区表的信息;
包括了分区表的分区值(PART_NAME)、表的输入输出格式(SD_ID)、所属的表(TBL_ID); 
select * from PARTITIONS;

hive的metadata中的表用途说明

PARTITION_KEYS(分区的key)表

此表记录了分区的key;通过TBL_ID关联到表;
select * from PARTITION_KEYS;
注:可以看到分区的key是day;

hive的metadata中的表用途说明

PARTITION_KEY_VALS(分表key的value)表

此表记录了分区的key的value;通过TBL_ID关联到表;
select * from PARTITION_KEY_VALS;
注:可以看重到key的value值

hive的metadata中的表用途说明

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


当前名称:hive的metadata中的表用途说明-创新互联
网站路径:http://scyanting.com/article/ipchd.html