Hive3分区表和分桶表的区别及应用场景
发布日期:2021-09-27 12:34:31 浏览次数:1 分类:技术文章

本文共 472 字,大约阅读时间需要 1 分钟。

区别

  • 建表时不同:创建表时分区字段不能直接写在表结构中,通过指定分区字段和类型的方式成为表结构;分桶表的字段必须写在表结构中,再指定分桶字段。
-- 创建分区表create table stu_par3(id int,name string) partitioned by (class string)row format delimited fields terminated by '\t';-- 创建分桶表create table stu_buk(id int,name string)clustered by (id) into 4 bucketsrow format delimited fields terminated by '\t';
  • 数据存储方式不同:分区表是根据不同分区以文件夹的形式存储在HDFS上;分桶表是以多个数据文件的形式存储在表数据目录下。

    分区表数据存储方式
    分桶表数据存储方式

  • 使用场景不同:分区表适合用于多条数据有相同字段值的情况,比如所属分类。分桶表适合用于数据字段没有重复值的情况,或者分区太多更不利于查询的情况,比如表id。

应用场景:

如上

转载地址:https://blog.csdn.net/FlatTiger/article/details/113879595 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Hive3查看内置函数的命令
下一篇:Hive3创建分桶表并加载数据

发表评论

最新留言

哈哈,博客排版真的漂亮呢~
[***.90.31.176]2024年04月07日 11时17分04秒