详解MySQL分组查询Group By实现原理

您的位置：
门户
>> 文章精选
>> 软件开发专栏
>> 数据库
>> 查看资讯

详解MySQL分组查询Group By实现原理

发表于：2011-2-24 09:54

作者：简朝阳来源：51Testing软件测试网采编

　　我们看到在执行计划的 Extra 信息中有信息显示“Using index for group-by”，实际上这就是告诉我们，MySQL Query Optimizer 通过使用松散索引扫描来实现了我们所需要的 GROUP BY 操作。

　　下面这张图片描绘了扫描过程的大概实现：

　　要利用到松散索引扫描实现 GROUP BY，需要至少满足以下几个条件：

　　◆GROUP BY 条件字段必须在同一个索引中最前面的连续位置；

　　◆在使用GROUP BY 的同时，只能使用 MAX 和 MIN 这两个聚合函数；

　　◆如果引用到了该索引中 GROUP BY 条件之外的字段条件的时候，必须以常量形式存在；

　　为什么松散索引扫描的效率会很高？

　　因为在没有WHERE子句，也就是必须经过全索引扫描的时候，松散索引扫描需要读取的键值数量与分组的组数量一样多，也就是说比实际存在的键值数目要少很多。而在WHERE子句包含范围判断式或者等值表达式的时候，松散索引扫描查找满足范围条件的每个组的第1个关键字，并且再次读取尽可能最少数量的关键字。

　　2、使用紧凑（Tight）索引扫描实现 GROUP BY

　　紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别主要在于他需要在扫描索引的时候，读取所有满足条件的索引键，然后再根据读取恶的数据来完成 GROUP BY 操作得到相应结果。

1 　sky@localhost : example 08:55:14> EXPLAIN
2 
3 -> SELECT max(gmt_create)
4 
5 -> FROM group_message
6 
7 -> WHERE group_id = 2
8 
9 -> GROUP BY user_id\G
10 
11 *************************** 1. row ***************************
12 
13 id: 1
14 
15 select_type: SIMPLE
16 
17 table: group_message
18 
19 type: ref
20 
21 possible_keys: idx_group_message_gid_uid,idx_gid_uid_gc
22 
23 key: idx_gid_uid_gc
24 
25 key_len: 4
26 
27 ref: const
28 
29 rows: 4
30 
31 Extra: Using where; Using index
32 
33 1 row in set (0.01 sec)

42/4<123 4 >

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

测试技术了解

2023测试行业调查报告

挣点稿费

车载测试入门

文章资料精选