在选择即不重复值,又容易分辨大小的列时,我们通常会选择主键。下表列出了笔者用有着1000万数据的办公自动化系统中的表,在以 GID(GID是主键,但并不是聚集索引。)为排序列、提取gid,fariqi,title字段,分别以第1、10、100、500、1000、1万、 10万、25万、50万页为例,测试以上三种分页方案的执行速度:(单位:毫秒)
从上表中,我们可以看出,三种存储过程在执行100页以下的分页命令时,都是可以信任的,速度都很好。但第一种方案在执行分页1000页以上 后,速度就降了下来。第二种方案大约是在执行分页1万页以上后速度开始降了下来。而第三种方案却始终没有大的降势,后劲仍然很足。
在确定了第三种分页方案后,我们可以据此写一个存储过程。大家知道SQL SERVER的存储过程是事先编译好的SQL语句,它的执行效率要比通过WEB页面传来的SQL语句的执行效率要高。下面的存储过程不仅含有分页方案,还 会根据页面传来的参数来确定是否进行数据总数统计。
-- 获取指定页的数据
1 CREATE PROCEDURE pagination3 2 3 @tblName varchar(255), -- 表名 4 5 @strGetFields varchar(1000) = '*', -- 需要返回的列 6 7 @fldName varchar(255)='', -- 排序的字段名 8 9 @PageSize int = 10, -- 页尺寸 10 11 @PageIndex int = 1, -- 页码 12 13 @doCount bit = 0, -- 返回记录总数, 非 0 值则返回 14 15 @OrderType bit = 0, -- 设置排序类型, 非 0 值则降序 16 17 @strWhere varchar(1500) = '' -- 查询条件 (注意: 不要加 where) 18 19 AS 20 21 declare @strSQL varchar(5000) -- 主语句 22 23 declare @strTmp varchar(110) -- 临时变量 24 25 declare @strOrder varchar(400) -- 排序类型 26 27 if @doCount != 0 28 29 begin 30 31 if @strWhere !='' 32 33 set @strSQL = "select count(*) as Total from [" + @tblName + "] where "+@strWhere 34 35 else 36 37 set @strSQL = "select count(*) as Total from [" + @tblName + "]" 38 39 end |
--以上代码的意思是如果@doCount传递过来的不是0,就执行总数统计。以下的所有代码都是@doCount为0的情况
1 else 2 3 begin 4 5 if @OrderType != 0 6 7 begin 8 9 set @strTmp = "<(select min" 10 11 set @strOrder = " order by [" + @fldName +"] desc" 12 13 --如果@OrderType不是0,就执行降序,这句很重要! 14 15 end 16 17 else 18 19 begin 20 21 set @strTmp = ">(select max" 22 23 set @strOrder = " order by [" + @fldName +"] asc" 24 25 end 26 27 if @PageIndex = 1 28 29 begin 30 31 if @strWhere != '' 32 33 set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from [" + @tblName + "] where " + @strWhere + " " + @strOrder 34 35 else 36 37 set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from ["+ @tblName + "] "+ @strOrder |
--如果是第一页就执行以上代码,这样会加快执行速度
1 end 2 3 else 4 5 begin 6 7 --以下代码赋予了@strSQL以真正执行的SQL代码 8 9 set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from [" 10 11 + @tblName + "] where [" + @fldName + "]" + @strTmp + "(["+ @fldName + "]) from (select top " + str((@PageIndex-1)*@PageSize) + " ["+ @fldName + "] from [" + @tblName + "]" + @strOrder + ") as tblTmp)"+ @strOrder 12 13 if @strWhere != '' 14 15 set @strSQL = "select top " + str(@PageSize) +" "+@strGetFields+ " from [" 16 17 + @tblName + "] where [" + @fldName + "]" + @strTmp + "([" 18 19 + @fldName + "]) from (select top " + str((@PageIndex-1)*@PageSize) + " [" 20 21 + @fldName + "] from [" + @tblName + "] where " + @strWhere + " " 22 23 + @strOrder + ") as tblTmp) and " + @strWhere + " " + @strOrder 24 25 end 26 27 end 28 29 exec (@strSQL) 30 31 GO |
上面的这个存储过程是一个通用的存储过程,其注释已写在其中了。
在大数据量的情况下,特别是在查询最后几页的时候,查询时间一般不会超过9秒;而用其他存储过程,在实践中就会导致超时,所以这个存储过程非常适用于大容量数据库的查询。
笔者希望能够通过对以上存储过程的解析,能给大家带来一定的启示,并给工作带来一定的效率提升,同时希望同行提出更优秀的实时数据分页算法。