数据库优化中什么是星型转换(Star Transform)?

    在数据仓库中经常查询的SQL总带有下列特征:

  • 几个表进行关联
  • 只有一个数据量巨大的表, 称为事实表
  • 其他的都是编码表, 称为维表
  • 维表和事实表之间有主外键关系

    假设有D1(key1),D2(key2),D3(key3),D4(key)四个小的维表和一个事实表F(key1,key2,key3,key4), 那么经常进行的查询将是:

SELECT
  D1.xxx, D2.xxx, D3.xxx, D4.xxx,
  SUM(F.xxx), SUM(F.xxx)
FROM F, D1, D2, D3, D4
WHERE F.KEY1=D1.KEY1 AND F.KEY2=D2.KEY2
  AND F.KEY3=D3.KEY3 AND F.KEY4=D4.KEY4
  AND D1.xxx=? AND D2.xxx=?
  AND D3.xxx=? AND D4.xxx=?
GROUP BY D1.xxx, D2.xxx, D3.xxx, D4.xxx

    而为了提高查询速度, 根据数据特征, key1,key2,key3,key4这四个字段会比较适合每个字段上建一个位图索引(Bitmap Index), 但是上面的查询语句并不能用到位图索引, 除非是进行了星型转换, 这个转换需要将SQL转换成下面的格式:

SELECT
  D1.xxx, D2.xxx, D3.xxx, D4.xxx,
  SUM(F.xxx), SUM(F.xxx)
FROM F, D1, D2, D3, D4
WHERE F.KEY1=D1.KEY1 AND F.KEY2=D2.KEY2
  AND F.KEY3=D3.KEY3 AND F.KEY4=D4.KEY4
  AND D1.xxx=? AND D2.xxx=?
  AND D3.xxx=? AND D4.xxx=?
  AND F.KEY1 IN (SELECT D1.KEY1 FROM D1 WHERE D1.xxx=?)
  AND F.KEY2 IN (SELECT D2.KEY2 FROM D2 WHERE D2.xxx=?)
  AND F.KEY3 IN (SELECT D3.KEY3 FROM D3 WHERE D3.xxx=?)
  AND F.KEY4 IN (SELECT D4.KEY4 FROM D4 WHERE D4.xxx=?)
GROUP BY D1.xxx, D2.xxx, D3.xxx, D4.xxx

    有条件的可以试试, 使用星型转换有三个条件:

  • 事实表的每个代码列上有位图索引
  • 参数STAR_TRANSFORMATION_ENABLED的值要设为TRUE
  • 必须使用CBO, 所以最好对表进行适当的分析

    应当好好地看一下没做转换和做了转换之后的执行计划的不同, 从而体会什么是星型转换.

留言 (4)

笔误:D4(key)应为D4(key4)

晕,用dba_objects生成几张表来实例说明会让更多人理解的

感觉在数据仓库项目中有时候还是要对事实表进行删除的,像一般的月统计,不一定就是一定要到月尾才进行统计,所以可能要删本年再进行统计,位图索引就不好用了,先删再建感觉也不很好

我经常做一个这样的工作,一个大表有许多代码,然后要连接维表把代码转换成名称。学习下……

发表留言:

« Previous | Main | Next »

英语900句 | English 900

  • What are you doing next week?
  • 下周你干什么?
  • I plan to go to the concert.
  • 我打算去听音乐会.
  • I'm thinking of going to my grandma's.
  • 我想去外婆家.
  • I'll go skiing of the weather permits.
  • 天气允许的话, 我会去滑雪.
  • I suppose I can finish the project next year.
  • 我想我明年完成此工程.