数据库查询性能调优和索引优化的知识是本文我们主要要介绍的内容,了解了这方面的知识有助于提高SQL查询的效率,接下来我们开始介绍这部分内容。
查询性能调优是个很大的话题,这里边涉及到的技术非常广泛,但是我们一般可以把它大致分为以下几个层次:
1、减少数据访问。相关的技术就是建立合适的索引,将全表扫描、索引扫描(scan)等耗时的操作转化为索引查找(seek)。建立正确的索引,能让数据库查询性能提升100-1000倍甚至更高,就好比一本非常厚的词典,如果没有任何索引,你要查一个东西,那可是相当费尽,需要整本书查一遍,有索引就可以直接根据索引定位了。这是最重要的改善性能的途径。
2、减少返回的数据。在网络中传输数据,带宽是有限的,如果能按需提取最少量的数据,会起到不错的作用。这里需要注意的是,在SQL中,不要出现select *,而是需要什么字段,就提取什么字段。
3、减少与数据库交互次数。网络资源有限,显然,频繁与数据库交互,也是制约性能的一个因素。一个良好的建议就是,使用存储过程,或者批处理语句,这样能减少与数据库的交互,提升一部分性能。
4、减少CPU的负荷。这里,主要是使用缓存计划。在查询中,尽量使用参数化的查询。这样的话,数据库会对查询参数进行缓存,从而复用查询计划。
5、提升硬件性能。这是最后一招了,如果其他方面都已经做得非常不错了,性能瓶颈在CPU,内存和磁盘上,那采取提升硬件性能的方案就会显得比较合适了,否则还是先去优化其他的地方吧。
以上5个层次的优化带来的性能改善,是依次下降的,是一个倒置的金字塔。
下边详细讨论一下索引的知识。
百度百科上对索引的描述是:“数据库索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。”
索引,分为聚集索引(clustered index)和非聚集索引(nonclustered index)两种。
a、聚集索引
含有聚集索引的表,叫做聚集表,它的数据行的组织方式,是跟聚集索引的顺序是一致的。聚集索引覆盖的列,叫做聚集键。
用新华字典来比喻的话,正文的每一个字就是一个数据行,他们的组织顺序是根据拼音,如果拼音相同,就会根据笔画(不一定准确,见谅),因此,新华字典里的聚集索引覆盖的列就是拼音和笔画。
很容易理解的是,正文只能按照一种既定的顺序去排序,同理,在一张表里,只能有一个聚集索引,从而决定着数据行的组织方式。