SQL Server索引进阶之页和区

发表于:2012-9-12 10:20

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:CareySon 译    来源:51Testing软件测试网采编

  在上一篇文章中,我们比较了完全相同的查询语句分别在存在聚集索引和非聚集索引的环境下耗费的成本.我们以“逻辑读”作为衡量成本的主要标准。现在就让我们来解释逻辑读作为主要衡量标准的原因以及SQL Server在读取时究竟读取什么。

  当你提交一个向SQL Server的请求查询时,SQL Server知道扫描整表一定可以满足这个需求。但如果使用索引进行数据查找的成本要低于整表扫描时,SQL Server会选择索引。也许你就开始有疑问了,那SQL Server根据什么因素判断成本呢?主要是磁盘IO,查询所请求的磁盘IO是查询消耗的主要部分,这也许是因为IO占用了最宝贵的两种资源:时间和内存。

  扫描整表时SQL Server所引起的I/O很多人都理解的不太正确,因为实际上SQL Server并不会读取行,而是读取页。页和行作为不同粒度的单位对于读取来说是完全不同的。

  本篇文章是系列文章中最短的,因为本文主要讲述SQL Server进行IO请求。理解SQL Server的IO是对于理解很多现象的必要基础,比如为什么某些索引使得查询跑得更快而另一些查询不会,或是为什么某些修改数据的查询比其它查询执行的更快,亦或是为什么某些维护计划需要更长的时间。总之,对于SQL Server IO的理解是理解本系列文章的后续文章的关键所在

  页

  你创建了一个数据库时,你指定了数据库文件所存储的位置。对于SQL Server来说,每一个文件都是一长串的bytes.SQL Server逻辑上(仅仅是逻辑上,不是物理上)把这个文件分成N多8K大小的块。这个块就是所谓的页。数据库文件第一个8K的块就是页#0,下一个8K的块就是页#1,依此类推。页是IO读取的最小单元,SQL Server每一个IO读写都涉及一个页,当然了,对于多个物理上连续的页,SQL Server也可以用一个IO全部完成。

  页不仅仅是IO读取的最小单位,也是所有权的最小单位。如果一页中包含了表A的一行数据,这页就只能存储表A的行数据了。或是一页中包含了索引B的条目,那这页也仅仅只能存储索引B的条目了。每页中除去存储数据之外,还存储一些页头信息以及行偏移以便SQL Server知道具体每一行在页中的存储位置。

  在上一篇中,我们多次讲述了条目在索引中连续,无论是在聚集索引还是非聚集索引中,下面,我们更详细的说一下所谓的连续。在SalesOrderDetail表中的部分数据可以让你对页有一个更直观的认识。

  SalesOrderID SalesOrderDetailID ProductID OrderQty UnitPrice

  Page n-1:
  43668 106 722 3 178.58
  43668 107 708 1 20.19

  Page n:
  43668 108 733 3 356.90
  43668 109 763 3 419.46
  43669 110 747 1 714.70
  43670 111 710 1 5.70
  43670 112 709 2 5.70
  43670 113 773 2 2,039.99
  43670 114 776 1 2,024.99
  43671 115 753 1 2,146.96
  43671 116 714 2 28.84
  43671 117 756 1 874.79

  Page n+1:
  43671 118 768 2 419.46
  43671 119 732 2 356.90
  43671 120 763 2 419.46
  43671 121 755 2 874.79
  43671 122 764 2 419.46
  43671 123 716 1 28.84
  43671 124 711 1 20.19
  43671 125 708 1 20.19
  43672 126 709 6 5.70
  43672 127 776 2 2,024.99

  Page n+2:
  43672 128 774 1 2,039.99
  43673 129 754 1 874.79
  43673 130 715 3 28.84
  43673 131 729 1 183.94

  页的逻辑顺序和物理顺序可以不一致。如上所示的这些数据既可以分布在n页,n+1页,n+2页中,也可以分布在n页,n+9页,n-5页,n+2页。逻辑顺序和物理顺序的差异被称为外部碎片。同样的,页面内部没有被使用的空间被称为内部碎片,在本系列接下来的文章中我们将会对内部碎片和外部碎片产生的影响进行更详细的讲解。

  每一页并不需要含有完全一样的行数,通常情况下,在有聚集索引的表上进行插入或删除操作的结果是每一个页都含有近似的行或条目数。如果不按页中含有的行数,而按页中含有的字节数来看的话,因为有可能包含变长数据,虽然每页包含的字节数类似,但每页所含的行数可能有差异很大。

21/212>
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号