teradata collect statistics
发布日期:2021-07-29 11:13:40 浏览次数:2 分类:技术文章

本文共 713 字,大约阅读时间需要 2 分钟。

teradata可以用下面语句收集统计信息:

collect statistice on tablename column(columnname);

收集统计信息后,teradata PE就会按照收集的统计信息确定执行计划,没有统计信息,PE就不知道什么样的执行计划才是合适的,这样就可能做出很让人难以接受的执行计划!

前几天执行一个SQL,执行了好几个小时,报错,spool空间不足,建数据库时分配了10T的spool空间,竟然报不足,难以接受。

重新执行SQL,打开manager查看执行计划,竟然在重分布一张5亿条数据的表,重分布的原因竟然是因为该表与一个只有40条记录的小表关联,由于是按照关联字段重新分布,关联字段的取值只有几十种,分布非常的不均匀,导致一大部分数据都分布到同一个amp上,而其他有几百个amp都是空的,那个分布数亿条记录的amp自然报spool不足;这由于没有统计信息,PE不知道表的大小,就做出了大表重分布的错误决定;

对两个表的关联字段用上面语句收集了统计信息后,PE选择了正确的执行计划,把小表拷贝到各个amp,再在每个amp上与大表关联,这也仅仅拷贝了16000条记录,0.1s就结束,关联也只花费了3分钟多。问题解决了。

COLLECT STATISTICS on gt_deptsal index(deptno);

定义收集的索引。

COLLECT STATISTICS on gt_deptsal columnavgsal;

定义收集的列。

HELP STATISTICS gt_deptsal;

COLLECT STATISTICS on temporary gt_deptsal;

转载地址:https://blog.csdn.net/thy822/article/details/49448931 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:teradata delete会释放空间吗
下一篇:常用的两种数据分区方法(以Teradata为例)

发表评论

最新留言

路过按个爪印,很不错,赞一个!
[***.219.124.196]2024年04月13日 14时27分26秒