oracle中临时表是用来做什么的
2020-09-21 · MySQL开源数据库领先者
我们仍使用 实验 05 中的环境,略去准备数据的过程。
我们仍然使用两个会话,一个会话 run,用于运行主 SQL;另一个会话 ps,用于进行 performance_schema 的观察:
将 performance_schema 中的统计量重置,
临时表的表大小限制取决于参数 tmp_table_size 和 max_heap_table_size 中较小者,我们实验中以设置 max_heap_table_size 为例。
我们将会话级别的临时表大小设置为 2M(小于上次实验中临时表使用的空间),执行使用临时表的 SQL:
查看内存的分配记录:
会发现内存分配略大于 2M,我们猜测临时表会比配置略多一点消耗,可以忽略。
可以看到语句使用了一次需要落磁盘的临时表。
那么这张临时表用了多少的磁盘呢?
我们开启 performance_schema 中 waits 相关的统计项:
重做实验,略过。
再查看 performance_schema 的统计值:
可以看到几个现象:
1. 临时表空间被写入了 7.92MiB 的数据。
2. 这些数据是语句写入后,慢慢逐渐写入的。
来看看这些写入操作的特征,该方法我们在 实验 03 使用过:
可以看到写入的线程是 page_clean_thread,是一个刷脏操作,这样就能理解数据为什么是慢慢写入的。
也可以看到每个 IO 操作的大小是 16K,也就是刷数据页的操作。
结论:
我们可以看到,
1. MySQL 会基本遵守 max_heap_table_size 的设定,在内存不够用时,直接将表转到磁盘上存储。
2. 由于引擎不同(内存中表引擎为 heap,磁盘中表引擎则跟随 internal_tmp_disk_storage_engine 的配置),本次实验写磁盘的数据量和 实验 05 中使用内存的数据量不同。
3. 如果临时表要使用磁盘,表引擎配置为 InnoDB,那么即使临时表在一个时间很短的 SQL 中使用,且使用后即释放,释放后也会刷脏页到磁盘中,消耗部分 IO。
可以先把 大表的数据, 检索出那一小部分, 然后插入到 临时表中, 最后再关联处理.
例如:
某百货公司的数据库.
里面有下面这2张 没有分区的表
销售表: 销售日期, 销售流水号, 销售金额
销售明细表: 销售流水号, 销售物品, 销售数量
当上面的表里面,包含几年的数据以后。
假如你要查询 昨天的销售合计。 很简单
SELECT * FROM 销售表 WHERE 销售日期 = 昨天。
但是当你要查询 昨天的销售的, 某种商品的 销售情况的时候。 就要
SELECT
......
FROM
销售表 JOIN 销售明细表
ON (销售表.销售流水号 = 销售明细表.销售流水号)
WHERE
销售表.销售日期 = 昨天
AND 销售明细表.销售物品 =某物品
这种情况下,由于2个大表关联,查询时间非常的长。
可以通过临时表。
先
INSERT INTO 临时表1
SELECT * FROM 销售表 WHERE 销售日期 = 昨天
然后再
INSERT INTO 临时表2
SELECT * FROM 销售明细表 WHERE 销售流水号 IN (SELECT 销售流水号 FROM 临时表1)
最后
SELECT
......
FROM
临时表1 JOIN 临时表2
ON (临时表1.销售流水号 = 临时表2.销售流水号)
这样就是 2个小表关联处理,查询起来,速度快一些。
参考资料: http://database.51cto.com/art/201001/180851.htm