详解MySQL中的Explain

您的位置：
门户
>> 文章精选
>> 软件开发专栏
>> 数据库
>> 查看资讯

发表于：2016-6-30 11:24

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：艾米丽来源：51Testing软件测试网采编

　　extra

　　本字段显示了查询中mysql的附加信息。以下是这个字段的几个不同值的解释：

　　distinct:mysql当找到当前记录的匹配联合结果的第一条记录之后，就不再搜索其他记录了。

　　not exists:mysql在查询时做一个 left join优化时，当它在当前表中找到了和前一条记录符合 left join条件后，就不再搜索更多的记录了。下面是一个这种类型的查询例子：

　　select * from t1 left join t2 on t1.id=t2.id where t2.id isnull;

　　假使 t2.id 定义为 not null。这种情况下，mysql将会扫描表 t1并且用 t1.id 的值在 t2 中查找记录。当在 t2中找到一条匹配的记录时，这就意味着 t2.id 肯定不会都是null，就不会再在 t2 中查找相同 id值的其他记录了。也可以这么说，对于 t1 中的每个记录，mysql只需要在t2 中做一次查找，而不管在 t2 中实际有多少匹配的记录。

　　range checked for each record (index map: #)

　　mysql没找到合适的可用的索引。取代的办法是，对于前一个表的每一个行连接，它会做一个检验以决定该使用哪个索引（如果有的话），并且使用这个索引来从表里取得记录。这个过程不会很快，但总比没有任何索引时做表连接来得快。

　　using filesort: mysql需要额外的做一遍从而以排好的顺序取得记录。排序程序根据连接的类型遍历所有的记录，并且将所有符合 where条件的记录的要排序的键和指向记录的指针存储起来。这些键已经排完序了，对应的记录也会按照排好的顺序取出来。详情请看”7.2.9how mysql optimizes order by”。

　　using index

　　字段的信息直接从索引树中的信息取得，而不再去扫描实际的记录。这种策略用于查询时的字段是一个独立索引的一部分。

　　using temporary: mysql需要创建临时表存储结果以完成查询。这种情况通常发生在查询时包含了groupby 和 order by 子句，它以不同的方式列出了各个字段。

　　using where

　　where子句将用来限制哪些记录匹配了下一个表或者发送给客户端。除非你特别地想要取得或者检查表种的所有记录，否则的话当查询的extra 字段值不是 using where 并且表连接类型是 all 或 index时可能表示有问题。

　　如果你想要让查询尽可能的快，那么就应该注意 extra 字段的值为usingfilesort 和 using temporary 的情况。

　　你可以通过 explain 的结果中 rows字段的值的乘积大概地知道本次连接表现如何。它可以粗略地告诉我们mysql在查询过程中会查询多少条记录。如果是使用系统变量 max_join_size 来取得查询结果，这个乘积还可以用来确定会执行哪些多表select 语句。

　　下面的例子展示了如何通过 explain提供的信息来较大程度地优化多表联合查询的性能。

　　假设有下面的 select 语句，正打算用 explain 来检测：

　　explain select tt.ticketnumber, tt.timein, tt.projectreference,tt.estimatedshipdate,

　　tt.actualshipdate, tt.clientid,tt.servicecodes, tt.repetitiveid, tt.currentprocess,

　　tt.currentdppers tt.recordvolume, tt.dpprinted, et.country,et_1.country,

　　do.custname from tt, et, et as et_1, do wherett.submittime is null and tt.actualpc = et.employid

　　andtt.assignedpc = et_1.employid and tt.clientid = do.custnmbr;

　　在这个例子中，先做以下假设：

　　要比较的字段定义如下：

　　table column columntype

　　tt actualpc char(10)

　　tt assignedpc char(10)

　　tt clientid char(10)

　　et employid char(15)

　　do custnmbr char(15)

　　数据表的索引如下：

　　table index

　　tt actualpc

　　tt assignedpc

　　tt clientid

　　et employid (primary key)

　　do custnmbr (primary key)

　　tt.actualpc 的值是不均匀分布的。

　　在任何优化措施未采取之前，经过 explain分析的结果显示如下：

　　table type possible_keys key key_len ref rows extra

　　et all primarynull null null 74

　　do all primary null null null 2135

　　et_1 allprimary null null null 74

　　tt all assignedpc, null null null 3872 clientid, actualpc range checked for each record (key map: 35)

　　由于字段 type 的对于每个表值都是all，这个结果意味着mysql对所有的表做一个迪卡尔积；这就是说，每条记录的组合。这将需要花很长的时间，因为需要扫描每个表总记录数乘积的总和。在这情况下，它的积是74 * 2135 * 74 * 3872 = 45,268,558,720条记录。如果数据表更大的话，你可以想象一下需要多长的时间。

　　在这里有个问题是当字段定义一样的时候，mysql就可以在这些字段上更快的是用索引（对isam类型的表来说，除非字段定义完全一样，否则不会使用索引）。在这个前提下，varchar和 char是一样的除非它们定义的长度不一致。由于 tt.actualpc 定义为char(10)，et.employid 定义为 char(15)，二者长度不一致。

　　为了解决这个问题，需要用 alter table 来加大 actualpc的长度从10到15个字符：

　　mysql> alter table tt modify actualpc varchar(15);

　　现在 tt.actualpc 和 et.employid 都是 varchar(15)

　　了。再来执行一次 explain 语句看看结果：

　　table type possible_keys key key_len ref rows extra

　　tt allassignedpc, null null null 3872 using clientid, where actualpc

　　do all primary null null null 2135 range checked for each record (keymap: 1)

　　et_1 all primary null null null 74 range checked for eachrecord (key map: 1) et eq_ref primary primary 15 tt.actualpc 1

　　这还不够，它还可以做的更好：现在 rows值乘积已经少了74倍。这次查询需要用2秒钟。

　　第二个改变是消除在比较 tt.assignedpc = et_1.employid 和 tt.clientid= do.custnmbr 中字段的长度不一致问题：

　　mysql> alter table tt modify assignedpc varchar(15), ->modify clientid varchar(15);

　　现在 explain 的结果如下：

　　table type possible_keys key key_len ref rows extra

　　et all primary null null null 74

　　tt ref assignedpc, actualpc 15 et.employid 52 using clientid, where actualpc

　　et_1 eq_ref primary primary 15 tt.assignedpc 1

　　do eq_ref primary primary 15 tt.clientid 1

　　这看起来已经是能做的最好的结果了。

　　遗留下来的问题是，mysql默认地认为字段 tt.actualpc的值是均匀分布的，然而表 tt并非如此。幸好，我们可以很方便的让mysql分析索引的分布：

　　mysql> analyze table tt;

　　到此为止，表连接已经优化的很完美了，explain 的结果如下：

　　table type possible_keys key key_len ref rows extra

　　tt all assignedpc null null null 3872 using clientid, where actualpc

　　et eq_ref primary primary 15 tt.actualpc 1

　　et_1 eq_ref primary primary 15 tt.assignedpc 1

　　do eq_ref primary primary 15 tt.clientid 1

　　请注意，explain 结果中的 rows字段的值也是mysql的连接优化程序大致猜测的，请检查这个值跟真实值是否基本一致。如果不是，可以通过在select 语句中使用 straight_join 来取得更好的性能，同时可以试着在from分句中用不同的次序列出各个表。

22/2<12

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

测试技术了解

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选