发布新日志

  • 获取存储过程返回值

    2007-06-18 16:46:04

    jdbc调存储过程:
    1.out,inout参数必须registerOutParameter一下。
    2.返回值用CallableStatement.get(int )取得
    3.如可驱动支持,可将游标return ,将强制转换为resultSet进行操作。
    4.如果返回多个结果集,则必须取完所有结果集后,最后取out参数
    5.jdbc会自动依相应类型自动处理值为null的字段为相应的java类型。
  • 使用 INDEX 优化器提示

    2007-06-12 14:37:34

    a. 使用 INDEX 优化器提示

    以下示例说明了使用 INDEX 优化器提示的两种方式。第一个示例说明如何强制优化器使用非聚集索引检索表中的行,第二个示例使用索引 0 强制执行表扫描。

    复制代码
    -- Use the specifically named INDEX.
    USE AdventureWorks ;
    GO
    SELECT c.FirstName, c.LastName, e.Title
    FROM HumanResources.Employee e WITH (INDEX(IX_Employee_ManagerID))
    JOIN Person.Contact c on e.ContactID = c.ContactID
    WHERE ManagerID = 2 ;
    GO
    
    -- Force a table scan by using INDEX = 0.
    USE AdventureWorks ;
    GO
    SELECT c.LastName, c.FirstName, e.Title
    FROM HumanResources.Employee e WITH (INDEX = 0) JOIN Person.Contact c
    ON e.ContactID = c.ContactID
    WHERE LastName = 'Johnson' ;
    GO
  • DBCC DBREINDEX重建索引提高SQL Server性能

    2007-06-12 09:37:34

    DBCC DBREINDEX重建索引提高SQL Server性能

    [转载]大多数SQL Server表需要索引来提高数据的访问速度,如果没有索引,SQL Server 
    要进行表格扫描读取表中的每一个记录才能找到索要的数据。索引可以分为簇索引和非簇索
    引,簇索引通过重排表中的数据来提高数据的访问速度,而非簇索引则通过维护表中的数据
    指针来提高数据的索引。

    1. 索引的体系结构 
    为什么要不断的维护表的索引?首先,简单介绍一下索引的体系结构。SQL 
    Server在硬盘中用8KB页面在数据库文件内存放数据。缺省情况下这些页面及其包含的数据
    是无组织的。为了使混乱变为有序,就要生成索引。生成索引后,就有了索引页和数据页,
    数据页保存用户写入的数据信息。索引页存放用于检索列的数据值清单(关键字)和索引表
    中该值所在纪录的地址指针。索引分为簇索引和非簇索引,簇索引实质上是将表中的数据排
    序,就好像是字典的索引目录。非簇索引不对数据排序,它只保存了数据的指针地址。向一
    个带簇索引的表中插入数据,当数据页达到100%时,由于页面没有空间插入新的的纪录,这
    时就会发生分页,SQL Server 
    将大约一半的数据从满页中移到空页中,从而生成两个半的满页。这样就有大量的数据空间
    。簇索引是双向链表,在每一页的头部保存了前一页、后一页地址以及分页后数据移动的地
    址,由于新页可能在数据库文件中的任何地方,因此页面的链接不一定指向磁盘的下一个物
    理页,链接可能指向了另一个区域,这就形成了分块,从而减慢了系统的速度。对于带簇索
    引和非簇索引的表来说,非簇索引的关键字是指向簇索引的,而不是指向数据页的本身。

    为了克服数据分块带来的负面影响,需要重构表的索引,这是非常费时的,因此只能在需要
    时进行。可以通过DBCC SHOWCONTIG来确定是否需要重构表的索引。

    2. DBCC SHOWCONTIG用法 下面举例来说明DBCC SHOWCONTIG和DBCC 
    REDBINDEX的使用方法。以应用程序中的Employee数据表作为例子,在 SQL Server的Query 
    analyzer输入命令: 
    use database_name declare @table_id int set @table_id=object_id(’Employee’) dbcc showcontig(@table_id)

    输出结果: 
     DBCC SHOWCONTIG scanning ’Employee’ table... Table: ’Employee’ 
    (1195151303); index ID: 1, database ID: 53 TABLE level scan performed. - Pages 
    Scanned................................: 179 - Extents 
    Scanned..............................: 24 - Extent 
    Switches..............................: 24 - Avg. Pages per 
    Extent........................: 7.5 - Scan Density [Best Count:Actual 
    Count].......: 92.00% [23:25] - Logical Scan Fragmentation ..................: 
    0.56% - Extent Scan Fragmentation ...................: 12.50% - Avg. Bytes Free 
    per Page.....................: 552.3 - Avg. Page Density 
    (full).....................: 93.18% DBCC execution completed. If DBCC printed 
    error messages, contact your system administrator. 
    通过分析这些结果可以知道该表的索引是否需要重构。如下描述了每一行的意义: 信息 
    描述 Pages Scanned 表或索引中的长页数 Extents Scanned 
    表或索引中的长区页数 Extent Switches 
    DBCC遍历页时从一个区域到另一个区域的次数 Avg. Pages per Extent 
    相关区域中的页数 Scan Density[Best Count:Actual Count] Best 
    Count是连续链接时的理想区域改变数,Actual Count是实际区域改变数,Scan 
    Density为100%表示没有分块。 Logical Scan Fragmentation 
    扫描索引页中失序页的百分比 Extent Scan Fragmentation 
    不实际相邻和包含链路中所有链接页的区域数 Avg. Bytes Free per Page 
    扫描页面中平均自由字节数 Avg. Page Density (full) 
    平均页密度,表示页有多满

    从上面命令的执行结果可以看的出来,Best count为23 而Actual 
    Count为25这表明orders表有分块需要重构表索引。下面通过DBCC 
    DBREINDEX来重构表的簇索引。

    3. DBCC DBREINDEX 用法 重建指定数据库中表的一个或多个索引。

    语法 DBCC DBREINDEX ( [ ’database.owner.table_name’ [ , index_name [ , 
    fillfactor ] ] ] ) 

    参数 ’database.owner.table_name’ 
    是要重建其指定的索引的表名。数据库、所有者和表名必须符合标识符的规则。有关更多信
    息,请参见使用标识符。如果提供 database 或 owner 部分,则必须使用单引号 (’) 
    将整个 database.owner.table_name 括起来。如果只指定 table_name,则不需要单引号。

    index_name 是要重建的索引名。索引名必须符合标识符的规则。如果未指定 index_name 
    或指定为 ’ ’,就要对表的所有索引进行重建。

    fillfactor 是创建索引时每个索引页上要用于存储数据的空间百分比。fillfactor 
    替换起始填充因子以作为索引或任何其它重建的非聚集索引(因为已重建聚集索引)的新默
    认值。如果 fillfactor 为 0,DBCC DBREINDEX 在创建索引时将使用指定的起始 
    fillfactor。

    同样在Query Analyzer中输入命令:
    dbcc dbreindex(’database_name.dbo.Employee’,’’,90)

    然后再用DBCC SHOWCONTIG查看重构索引后的结果: 
     DBCC SHOWCONTIG scanning 
    ’Employee’ table... Table: ’Employee’ (1195151303); index ID: 1, database ID: 53 
    TABLE level scan performed. - Pages Scanned................................: 178 
    - Extents Scanned..............................: 23 - Extent 
    Switches..............................: 22 - Avg. Pages per 
    Extent........................: 7.7 - Scan Density [Best Count:Actual 
    Count].......: 100.00% [23:23] - Logical Scan Fragmentation ..................: 
    0.00% - Extent Scan Fragmentation ...................: 0.00% - Avg. Bytes Free 
    per Page.....................: 509.5 - Avg. Page Density 
    (full).....................: 93.70% DBCC execution completed. If DBCC printed 
    error messages, contact your system administrator.
    通过结果我们可以看到Scan Denity为100%。 
  • jar

    2007-06-09 13:04:17

    rem jdk目录安装在D:\j2sdk1.4.2_04
    cd d:
    cd D:\j2sdk1.4.2_04\bin
    rem 删除文件
    del D:\j2sdk1.4.2_04\bin\app6.0.jar  /Q
    del D:\j2sdk1.4.2_04\bin\com\test\*.* /Q /S
    rem 删除目录
    rmdir D:\j2sdk1.4.2_04\bin\com\test  /S/Q
    rmdir D:\j2sdk1.4.2_04\bin\com\test  /S/Q
    rem 建立目录
    mkdir D:\j2sdk1.4.2_04\bin\com\
    rem 建立目录
    mkdir D:\j2sdk1.4.2_04\bin\com\test\
    rem 拷贝目录
    xcopy D:\workspace\techwork\defaultroot\WEB-INF\classes\com\test D:\j2sdk1.4.2_04\bin\com\test\  /S/E
    rem jar文件
    jar cvf app6.0.jar cvf com/
    copy D:\j2sdk1.4.2_04\bin\app6.0.ja
  • eclipse 查看源码

    2007-06-09 12:35:43

       Eclipse中有这样一个功能,就是在编写程序的时候,按住Ctrl键不松手,这时用鼠标去点击某个方法或者类,就会看到该方法或类的源代码。可是我今天下载了最新的Eclipse3.2和JDK5.0并安装之后,发现该功能并不能使用,每次都无法看到源代码。我进入设置中看了看,在JAVA / Build Path / Classpath Variables下有一个JAR_SRC变量,该变量负责设置源代码路径,但是该变量是不可修改的,必须由系统自动检测。而我的系统恰恰没有检测到,这可如何是好?经研究发现,原来是另外一处没有设置好。在JAVA / Installed JREs中,可以选择一个JRE来支持Eclipse,而一般情况下我们的机器中都装了2套JRE,一套有源码,一套无源码,而系统恰恰选择了那套无源码的JRE,因此在使用中便无法查看源代码。问题找到后,解决起来就方便了。点击最右边的Search按钮,选择Search的路径为你安装JDK的路径,在我的机器上是C:\Program Files\Java\jdk1.5.0_08,经过查找后,系统就会发现另外一套JRE,这套JRE是有源代码的,这时你选择刚刚找到的这个JRE作为Eclipse的默认JRE,那么就可以正常查看源代码了!
  • function

    2007-06-05 13:59:57

    -- ================================================
    -- Template generated from Template Explorer using:
    -- Create Scalar Function (New Menu).SQL
    --
    -- Use the Specify Values for Template Parameters
    -- command (Ctrl-Shift-M) to fill in the parameter
    -- values below.
    --
    -- This block of comments will not be included in
    -- the definition of the function.
    -- ================================================
    SET ANSI_NULLS ON
    GO
    SET QUOTED_IDENTIFIER ON
    GO
    -- =============================================
    -- Author:  <Author,,Name>
    -- Create date: <Create Date, ,>
    -- Descrīption: <Descrīption, ,>
    -- =============================================
    CREATE FUNCTION formatEmpty
    (
    @pValue varchar(200)
    )
    RETURNS varchar(200)
    AS
    BEGIN

     DECLARE @pReturn varchar(200);
     DECLARE @i int;
     DECLARE @len int;

     SET @pReturn=RTRIM(@pValue);
     SET @len=Len(@pReturn);
     SET @i=1;
     while  @i<=@len
      if (Substring(@pReturn,@i,1)='?')
        SET @i=@i+1;
      ELSE IF( Substring(@pReturn,@i,2)='?')
        SET @i=@i+2;
      ELSE
       return @pReturn;

     return '';

    END
    GO

     

  • 在SQL语句中使用索引提示提高SQL性能

    2007-06-04 21:03:47

     

    Hints are used to give specific information that we know about our data and application, to Oracle. This further improves the performance of our system. There can be instances where the default optimizer may not be efficient for certain SQL statements. We can specify HINTS with the SQL statements, to improve the efficiency of those SQL statements.

    In this article, we shall see how to specify INDEX hints and what the advantages of the same are.

    How to specify Hints

    The Hints are enclosed in comment, /* comment */, in an SQL statement, and can only be specified with SELECT, DELETE and UPDATE keyword.

    SELECT /* comment */ ........ ;

    All hints should start with a + sign. This tells the SQL Parser that the SQL has a hint specified with it.

    SELECT /*+{hint} */ ........ ;

    Using INDEX Hints

    When you specify an INDEX Hint, the optimizer knows that it has to use the INDEX specified in the hint. In this case, the optimizer does not go for a Full Table Scan nor does it use any other index. In addition, it does not calculate the cost of the Index to be used.

    If no INDEX hint is specified the optimizer determines the cost of the each index that could be used to access the table and uses the one with the lower cost.

    If there are multiple indexes specified with the Hint then the optimizer has to determine the cost of each index to be used with the specified table. Once that is determined, it uses the Index with the lower cost to access the table. In this case, the optimizer does not do a FULL Table Scan. Also note that, the optimizer may choose to use multiple indexes and then merge the result sets to access the table. This method is used if the cost is low.

    Syntax:

    /*+ INDEX ( table [index [index]...] ) */

    Where:

    • table specifies the name or alias of the table associated with the index to be scanned.
    • index specifies an index on which an index scan is to be performed.

    Examples:

    select /*+ INDEX(emp_city idx_job_code) */ empname, 
    job_code from emp where job_code = 'T';

    In the above example we are querying the emp table to find employees who are Temporary (job_code = 'T') in the organization.

    The above approach will be faster only if we know that less than 50% rows will be returned by the above query. If we know that there are more Temporary employees than the Permanent (job_code = 'P') employees, then the above approach will not be efficient. It is better that we do a FULL Table scan.

     
    DELETE /*+ INDEX(emp_status idx_emp_status)*/ FROM 
    emp_status WHERE status = 'T';

    INDEX_ASC

    /*+ INDEX_ASC(table index[index .. index]) */

    INDEX_ASC is almost the same as INDEX Hint. The difference is that if INDEX Range is specified the entries are scanned in ascending order.

    INDEX_DESC

    /*+ INDEX_DESC (table index[index .. index]) */

    INDEX_DESC is almost the same as INDEX Hint. The difference is that if INDEX Range is specified the entries are scanned in descending order.

    FULL

    You can use the FULL hint to bypass the use of the INDEX. For example if you have a table, which is indexed, and the value you are searching for has a large number of duplicates, then you can go in for a Full Table scan. If an index is used, in this case it will be inefficient. Using FULL hint will bypass the index(es).

    Syntax:

    /*+ FULL (table) */

    Example:

     
    select /*+ FULL(emp_status) */ empname, status from 
    emp_status where status = 'P';

    NO_INDEX

    The NO_INDEX hint explicitly specifies which index cannot be used for the specified table.

    Example:

     
    select /*+ NO_INDEX(emp_status emp_status) */ empname, 
    status from emp_status where status = 'P';
    • If this hint specifies single or multiple available index(es), then the optimizer does not consider a scan on these indexes. Other indexes not specified are still considered.
    • If this hint specifies no indexes, then the optimizer does not consider a scan on any index on the table. This is the same as a NO_INDEX hint that specifies a list of all available indexes for the table.

    Summary

    Since you know more about your application and data, you can pass on this information to Oracle to improve the performance of your system.

    By using Hints, you can improve certain SQL statements that might otherwise be inefficient.



    Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=628283

  • 30岁以前不要去在乎的29件事

    2007-05-31 19:34:12

     1、放弃

      把握的反面就是放弃,选择了一个机会,就等于放弃了其他所有的可能。当新的机会摆在面前的时候,敢于放弃已经获得的一切,这不是功亏一篑,这不 是半途而废,这是为了谋求更大的发展空间;或者什么都不为,只因为喜欢这样做,因为,年轻就是最大的机会。人,只有在三十岁之前才会有这个胆量,有这个别 资本,有这个资格。 

      2、失恋 

      不是不在乎,是在乎不起。三十岁前最怕失去的不是已经拥有的东西,而是梦想。爱情如果只是一个过程,那么正是这个年龄应当经历的,如果要承担结 果,三十岁以后,可能会更有能力,更有资格。其实,三十岁之前我们要做的事情很多,稍纵即逝,过久地沉溺在已经乾涸的爱河的河床中,与这个年龄的生命节奏 不合。 

      3、离婚 

      不是不在乎,是一切还来得及。一位三十八岁的女友与老公结婚十五年,冷战十三年,终于分手。她说:「如果说后来不愿意离婚是为了孩子,那他第一 次提出离婚我没有同意,现在想来真不知道为什么。如果那个时候早分手,我的生活绝不会是今天这个样子。现在再重新开始,总觉得一切都晚了。」 

      4、漂泊 

      漂泊不是一种不幸,而是一种资格。趁著没有家室拖累,趁著身体健康,此时不飘何时飘?当然,漂泊的不一定是身体,也许只是幻想和梦境。新世纪的时尚领袖是飘一代,渴望漂泊的人惟一不飘的是那颗心。 

      5、失业 

      三十岁以前就尝到失业的滋味当然是一件不幸的事,但不一定是坏事。三十岁之前就过早地固定在一个职业上终此一生也许才是最大的不幸。失业也许让你想起埋藏很久而尘封的梦想,也许会唤醒连你自己都从未知道的潜能。也许你本来就没什么梦想,这时候也会逼著你去做梦。 

      6、时尚 

      不要追赶时尚。按说青年人应该是最时尚的,但是独立思考和个性生活更重要。在这个物质社会,其实对时尚的追求早已经成为对金钱的追求。今天,时尚是物欲和世俗的同义语。 

      7、格调 

      这是小资的东西,「小资」这个词在今天又二度流行,追求格调就是他们的专利。小资们说,有格调要满足四大要件:智慧、素养、自信和金钱。格调就 是把「高尚」理解成穿著、气质、爱好的品味和室内装潢。也就是大老粗只会表现谈吐的庸俗,「小资」们已经有能力庸俗他们的心灵了。主流观念倒不是非要另 类,另类已经成为年轻人观念的主流了,在今天,老土倒显得另类。关键是当今社会是一个创造观念的时代,而不是一个固守陈旧观念的时代。 

        8、评价 

      我们最不应该做出的牺牲就是因为别人的评价而改变自我,因为那些对你指手画脚的人自己也不知道他们遵从的规则是什么。千万不要只遵从规矩做事,规矩还在创造之中,要根据自己的判断做每一件事,虽然这样会麻烦一点。 

      9、幼稚 

      不要怕人说我们幼稚,这正说明你还年轻,还充满活力。「成熟」是个吓人的词儿,也是个害人的词儿。成熟和幼稚是对一个人最大而无当、最不负责 任、最没用的概括。那些庸人,绝不会有人说他们幼稚。不信,到哪天你被生活压得老气横秋,暮气沉沉的时候,人们一定会说你成熟了,你就会知道「成熟」是个 什么东西。 

      10、不适应 

    在一首摇滚里有这么一句:「这个城市改变了我,这个城市不需要我。」不要盲目地适应你生存的环境,因为很可能这环境自身已经不适应这个社会的发展了。 

      11、失败 

      我的老师曾经跟我说,一个人起码要在感情上失恋一次,在事业上失败一次,在选择上失误一次,才能长大。不要说失败是成功之母那样的老话,失败来得越早越好,要是三十岁,四十岁之后再经历失败,有些事,很可能就来不及了。 

      12、错误 

      这是年轻人的专利。 

      13、浅薄 

      如果每看一次《泰坦尼克号》就流一次眼泪,每看一次《大话西游》就笑得直不起腰,就会有人笑你浅薄。其实那只能说明你的神经依旧非常敏锐,对哪怕非常微弱的刺激都会迅速做出适应的反应;等你的感觉迟钝了,人们就会说你深沉了。 

      14、明星 

      不是不必在乎,是不能在乎。明星在商品社会是一种消费品,花了钱,听了歌,看了电影,明星们的表现再好,不过是物超所值而己,也不值得崇拜呀?就像你在地摊上花五十块钱买的裙子,别人都猜是八百块钱买的,物超所值了吧?你就崇拜上这身裙子了? 

    15、代价 

      不是不计代价,而是要明白做任何事都要付出代价。对我们这个年龄的人来说,这绝不是一句废话。否则,要到三十岁的时候才会明白自己曾经付出了多少代价,却不明白为什么付出,更不明白自己得到了多少,得到什么。 

      16、孤独 

      这是为自由付出的代价。 

      17、失意 

      包括感情上的,事业上的,也许仅仅是今天花了冤枉钱没买到可心的东西,朋友家高朋满座自己却插不上一句话。过分在乎失意的感受不是拿命运的捉弄来捉弄自己,就是拿别人的错误来惩罚自己。 

      18、缺陷 

      也许你个子矮,也许你长得不好看,也许你的嗓音像唐老鸭、、、那么你的优势就是你不会被自己表面的浅薄的亮点所耽搁,少花一些时间,少走一些弯,直接发现你内在的优势,直接挖掘自己深层的潜能。 

      19、误会 

      如果出于恶意,那么解释也没有用;如果出于善意,就不需要解释。专门说到「误会」倒不是因为一个人在三十岁之前被人误会的时候更多,而是这个年龄的人想不开的时候更多。 

      20、谣言 

      这是一种传染病,沈默是最好的疫苗。除非你能找出传染源,否则解释恰恰会成为病毒传播最理想的条件。 

      21、疯狂 

      这是年轻人最好的心理调适,只能说明你精力旺盛,身心健康。说你「疯狂」是某些生活压抑、心力交瘁的中老年人恶意的评价,他们就像一部年久修的机器,最需要调适,但只能微调,一次大修就会让他们完诞。 

      22、稳定 

      三十岁之前就在乎稳定的生活,那只有两种可能,要么就是中了彩票,要么就是未老先衰。 

    23、压力 

      中年人能够承受多大压力检验的是他的韧性;年轻人能承受多大压力,焕发的是他的潜能。 

      24、出国 

      也许是个机会,也许是个陷阱。除非从考大学的那一刻你就抱著这个目标,否则,对待出国的态度应该像对待爱情一样,努力争取,成败随缘。 

      25、薪水 

      只是给人打工,薪水再高也高不到哪儿去。所以在三十岁之前,机会远比金钱重要,事业远比金钱重要,将来远比金钱重要。对大多数人来说,三十岁之前干事业的首要目标绝不是挣钱,而是挣未来。 

      26、存款 

      这倒不一定是因为我们钱少,年轻人现在谁都知道钱是有生命的。机会这么多,条件这么好,可以拿钱去按揭,做今天的事,花明天的钱;也可以拿钱去投资,拿钱去「充电」。钱只有在它流通的过程中才是钱,否则只 

      是一叠世界上质量最好的废纸。 

      27、房子 

      除非你买房子是为了升值,要嘛就是你结婚了。我有个同学,家在外地,大学毕业之后,单位没有宿舍,家里就给他买了一套房子。他曾经有过去北京工 作的机会,但是他觉得刚买了房子就离开这座城市说不过去,就放弃了。到现在他工作稳定,但一事无成。唯一的成就就是结婚了,并且有了孩子,因为他觉得不该 让这房子永远空著,所以房子变成了家。房子是都市生活的寓言,这个寓言不应该过早的和我们相关。 

      28、年龄 

      女孩子一过二十五就开始隐瞒自己的年龄,其实大可不必。现在青年期都延迟到四十五岁了,二十五又算得了什么呢? 

      29、在乎 

      这是一种拿不起、放不下的心态,它的反面不是放弃,而是天马行空,自由自在,永远保持革命乐观主义的精神。

  • 今天使用了spring-mock来进行单元测试

    2007-05-30 12:05:13

    今天使用了spring-mock来进行单元测试 - -

                                          

    今天用了一下spring-mock来测试系统中的dao.感觉真的不错。这个很简单,记下来得原因是怕自己会忘。
    你的测试用例必须从AbstractDependencyInjectionSpringContextTests继承。他会帮你创建beanfactory以及beans.但是你必须告诉他到那去找配置文件。这个工作就是通过getConfigLocations方法来完成。一般情况下,这个方法都很简单。
    看看我的就知道他要干些什么了。
    @Override
        
    protected String[] getConfigLocations() {
            
    // TODO Auto-generated method stub
            return new String[]{ "/springContext-hibernate.xml" };
        }
    好了,这样就配置完成了。下面的工作就是获取你要测试的对象,并对他测试了。

    public ShipMasterDao getShipMasterDao() {
            
    if(shipMasterDao == null ){
                shipMasterDao 
    = (ShipMasterDao)this.applicationContext.getBean("shipMasterDao");
            }
            
    return shipMasterDao;
        }
        
        
    public void testGetUser(){
            ShipMaster shipMaster 
    = this.getShipMasterDao().getShipMaster(1);
            
    this.assertEquals(shipMaster.getImono(), "imo01");
        }
    嗯,很简单吧。但是很有用。
    记下,怕自己忘掉。
    http://www.blogjava.net/JetGeng/
  • 快速上手Spring--2.HelloWorld

    2007-05-30 11:47:59

    这篇文章主要谈谈Spring的入门开发,例子很简单,就是输出一条语句。有关各种软件的配置这里就不在多说了,如有不明白的,可以参考我以前的文章。
     
    在开始看这篇文章之前,最好弄清楚IoC、DI等概念,参考《快速上手Spring--1.收集的一些资料》。  
     
     
    1. 所需软件
     
    · JDK 5.0
     
     
     
     
    如果安装后在Eclipse中看不到XmlBuddy,那么在eclipse命令后加上“-clean”参数。
     
     
    2. 配置
     
    ●  配置Eclipse:
    · Window->Perferences->Java->Compiler:将"Compiler compliance level"设为“5.0”
    · Window->Perferences->Java->Build Path:勾选“Folders”
     
    ●  建立库文件夹
     
       具体做法参考《Eclipse快速上手Hibernate--1. 入门实例》一文中的“建立库文件夹”的相关部分。
     
       这里先将spring-framework-1.2.1-with-dependencies.zip解压,将其中的spring.jar(dist目录中)、commons-logging.jar(lib\jakarta-commons目录)、log4j-1.2.9.jar(lib\log4j目录)这三个文件复制到的”D:\java\Spring\lib" 目录中,然后在Eclipse中建立一个“Spring”库,将那三个文件添加进“Spring”库中。
     
     
     
     
     
    1. 创建项目
     
    · 新建一个Java Project:SpringHello,注意要导入用户库Spring。
     
    · 这是完成后整个项目的结构(预览一下):
     
    · 项目源码下载(不包含库文件):http://free.ys168.com/?javamxj  Spring目录下面。
     
     
    2. 简单的HelloWorld
     
    ·下面开始创建一个新类:HelloWorld ;包名:javamxj.spring.beginning1,代码如下:

    HelloWorld.java

    package javamxj.spring.beginning1;

    public class HelloWorld {
        public static void main(String[] args) {       
            System.out.println("Hello World!");
        }
    }
    OK!非常简单,我就是要它打印出一条语句“Hello World!”。
     
     
      现在我不想输出“Hello World!”,我想随心所欲的输出任何语句,很简单啊!将“Hello World!”替换成所希望输出的语句即可。不过这样有一个缺点,每次修改好了,都需要重新编译一下程序。像这样的小程序固然无所谓,可是如果是一个大项目,这样做就有些讨厌了。
      还好,只要稍微修改一下程序,通过参数输入即可。
     
    · 继续在这个包下建立一个新类:HelloWorldWithCommandLine,同样非常简单:

    HelloWorldWithCommandLine.java

    package javamxj.spring.beginning1;

    public class HelloWorldWithCommandLine {

        public static void main(String[] args) {
            if (args.length > 0) {
                System.out.println(args[0]);
            } else {
                System.out.println("Hello World!");
            }
        }
    }
     
    · 选中HelloWorldWithCommandLine,右击->Run As->Run...,在弹出窗口切换到“Arguments”栏,在“program arguments”中填入“Hello,javamxj!”,如下图:
    这样,就输出了我希望的语句。
    第一部分到此,请继续看第二部分。
     
    3. 采用“工厂模式”
     
    · 新建一个包,包名:javamxj.spring.beginning2,在这个包下,新建一个“Hello”接口,这个接口含有一个方法。 

    Hello.java

    package javamxj.spring.beginning2;

    public interface Hello {
        void sayHello();
    }
     
    · 分别新建两个类,实现这个接口。
    HelloWorld.java
    package javamxj.spring.beginning2;

    public class HelloWorld implements Hello {

        public void sayHello() {
            System.out.println("Hello World!");
        }
    }
     

    HelloJavamxj.java

    package javamxj.spring.beginning2;

    public class HelloJavamxj implements Hello {

        public void sayHello() {
            System.out.println("Hello, javamxj!");
        }
    }
     
    · 建立一个工厂类,调用上面两个实现接口的子类。 

    HelloFactory.java

    package javamxj.spring.beginning2;

    public class HelloFactory {

        public Hello getHello(String hello) {

            if (hello.equals("world"))
                return new HelloWorld();
            else if (hello.equals("javamxj"))
                return new HelloJavamxj();
            else
                throw new IllegalArgumentException("输入参数错误!");
        }
    }
     
    · 最后,利用工厂类,测试一下。

    Test.java

    package javamxj.spring.beginning2;

    public class Test {
        public static void main(String[] args) {

            Hello hello = null;
            HelloFactory factory = new HelloFactory();

            hello = factory.getHello("world");
            hello.sayHello();

            hello = factory.getHello("javamxj");
            hello.sayHello();
        }
    运行Test,控制台输出如下语句:
    Hello World!
    Hello, javamxj!
     
     
     
    4. Setter Injection
     
    讲了这么多,似乎一点都不关Spring的事,别急,下面就看看用Spring是如何实现的。
     
    · 新建一个包,包名:javamxj.spring.beginning3
    · 在这个包下,新建一个HelloBean的类,这个类有一个属性:helloWorld属性,这个属性只是一个字符串。可以通过setHelloWorld方法设置这个属性,getHelloWorld方法得到这个属性。

    HelloBean.java

    package javamxj.spring.beginning3;

    public class HelloBean {

        private String helloWorld = "Hello!World!";

        public void setHelloWorld(String helloWorld) {
            this.helloWorld = helloWorld;
        }

        public String getHelloWorld() {
            return helloWorld;
        }

    }
     
    · 同样,在这个包下,建立一个XML文件,它是Spring配置文件。

    bean.xml

    <?xml version="1.0" encoding="GBK"?>
    <!DOCTYPE beans PUBLIC "-//SPRING/DTD BEAN/EN"
    "http://www.springframework.org/dtd/spring-beans.dtd">

    <beans>
        <bean id="helloBean" class="javamxj.spring.beginning3.HelloBean">
            <property name="helloWorld">
                <value>Hello! Javamxj!</value>
            </property>
        </bean>
    </beans>
     
      Spring配置文件必须遵循spring-beans.dtd定义的内容模型。
     
      这个XML文件在Spring容器中声明了一个HelloBean的实例,并且将它的helloWorld属性设置为“Hello! Javamxj!”。
      分析这个XML文件,位于根部的是<beans>元素,它是任何Spring配置文件的根元素。<bean>元素用于告诉Spring容器一个类以及它是如何配置的。这里,id属性用于为Bean helloBean命名,而class属性指定了这个Bean的全限定类名。
      在<bean>元素内,<property>元素用于设置一个属性,在本例中它是helloWorld属性。通过使用<property>,我们告诉Spring容器当设置这个属性时调用setHelloWorld方法。greeting属性的值定义在<value>元素内。在这里我设置为“Hello! Javamxj!”。
     
      bean.xml必须在您的CLASSPATH可以存取到的目录中。
     
     
     
    · 新建Main.java,测试一下。

    Main.java

    package javamxj.spring.beginning3;

    import org.springframework.beans.factory.BeanFactory;
    import org.springframework.beans.factory.xml.XmlBeanFactory;
    import org.springframework.core.io.ClassPathResource;
    import org.springframework.core.io.Resource;

    public class Main {
        public static void main(String[] args) {

            // 直接调用HelloBean
            HelloBean helloBean = new HelloBean();
            System.out.println(helloBean.getHelloWorld());

            // 利用Spring调用HelloBean
            Resource res = new ClassPathResource("javamxj/spring/beginning3/bean.xml");
            BeanFactory factory = new XmlBeanFactory(res);

            helloBean = (HelloBean) factory.getBean("helloBean");
            System.out.println(helloBean.getHelloWorld());
        }
    }
     
      这里使用的BeanFactory类就是Spring容器。在将hello.xml文件装入容器后,main方法调用BeanFactory的getBean方法检索出了helloBean服务的一个引用。通过这个引用,它调用了getHelloWorld方法。当我们运行这个Hello应用时,它会打印出“Hello! Javamxj!”。
     
     
    · 另外,为了更好的调试程序,了解运行机理,建立一个log4j.properties,放在src目录下。 

    src/log4j.properties

    log4j.rootLogger=warn, stdout
    log4j.appender.stdout=org.apache.log4j.ConsoleAppender
    log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
    log4j.appender.stdout.layout.ConversionPattern=%c{1} - %m%n 
     
     
     
     
    5. Constructor Injection
     
    · 新建一个包,包名:javamxj.spring.beginning3
    · 新建一个HelloBean.java文件,可以与Setter Injection中的HelloBean比较一下,注意是通过Constructor设置helloWorld属性值的。

    HelloBean.java

    package javamxj.spring.beginning4;

    public class HelloBean {

        private String helloWorld;

        public HelloBean(String helloWorld) {
            this.helloWorld = helloWorld;
        }

        public void sayHello() {
            System.out.println(helloWorld);
        }
    }
     
    · 同样,在这个包下,也需要一个Spring配置文件。

    bean.xml

    <?xml version="1.0" encoding="GBK"?>
    <!DOCTYPE beans PUBLIC "-//SPRING/DTD BEAN/EN"
    "http://www.springframework.org/dtd/spring-beans.dtd">

    <beans>
        <bean id="helloBean" class="javamxj.spring.beginning4.HelloBean">
            <constructor-arg>
                <value>Hello! Javamxj!</value>
            </constructor-arg>
        </bean>
    </beans>
       这里通过<constructor-arg>来表示将使用 constructor injection。如果constructor的参数不只一个,那么需要利用index属性指定参数的位置索引,即<constructor-arg index="索引值">,索引值从0开始。 
     
    · 测试一下。 

    Main.java

    package javamxj.spring.beginning4;

    import org.springframework.beans.factory.BeanFactory;
    import org.springframework.beans.factory.xml.XmlBeanFactory;
    import org.springframework.core.io.ClassPathResource;
    import org.springframework.core.io.Resource;

    public class Main {
        public static void main(String[] args) {

            Resource res = new ClassPathResource("javamxj/spring/beginning4/bean.xml");
            BeanFactory factory = new XmlBeanFactory(res);

            HelloBean helloBean = (HelloBean) factory.getBean("helloBean");
            helloBean.sayHello();
        }
    }
     
     
     
       这样,通过BeanFactory的getBean方法,以及xml配置文件,避免了在Main类中直接实例化HelloBean,消除了应用程序(Main)与服务(HelloBean)之间的耦合,实现了IOC(控制反转)或者说实现了依赖的注射(Dependency Injection)。
      
       Setter Injection和Constructor Injection都有自己的长处和不足。至于,是选择Setter Injection,还是选择Constructor Injection?在《Spring in Action》、《Inversion of Control Containers and the Dependency Injection pattern》和《Spring开发指南》都有比较详细的论述,这里就不多说了。
  • 表Information中有四个字段:ID,Name,Sex,Position

    2007-05-29 22:16:51

    delete   from   information   t0  
      where   exist   (select   id    
                                from   information   t1    
                                where   t1.id<t0.id   and   t1.name=t0.name)

     

     

    你不是说ID是主键吗,既然是主键,就不应该有两条完全相同的记录。  
      我的语句你说有错,用飘香兄改过的,以下语句查出Name有重复的记录,删除Name相同而ID不是最大的记录,也就是保留ID最大的一条记录,其他的删除。  
      delete   a                                              
      from   Information   a,  
      (  
      select   max(id)   as   id,Name   from   Information    
      group   by   name   having   count(*)>1  
      )   as   b  
      where   a.id<>b.id  
      and   a.name=b.name  

  • sql中distinct的用法

    2007-05-29 22:11:07

    2007年05月11日 星期五 15:19

    在说distinct之前,先记录下今天遇到的一个问题,今天出现了SESSION冲突的问题,查了很久之后才发现原因是php.ini中把SESSION变量设定为全局变量造成的。昨天的格林威治时间也是因为php.ini中设置造成。

    distinct会筛选出不同的记录,也就是说想通内容的那个字段只会取一条

    eg:select distinct(ebay_id) from autoorder order by id

    这个会查询中autoorder表中ebay_id不同的所有记录。

    这里有个问题要注意一下,就是用了distinct,它只能查distinct对应的字段哦,如果你写成:

    eg:select distinct(ebay_id),id,referer    from autoorder order by id

    的话,那查询的将会是autoorder表中的所有记录,没有做到筛选不同ebay_id的记录

  • SQL优化-索引

    2007-05-29 17:48:44

    (一)深入浅出理解索引结构

    实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集索引的区别:

    其实,我们的汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,就会很自然地翻开字典的前几页,因为“安”的拼音是“an”,而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的,那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”开头的部分仍然找不到这个字,那么就说明您的字典中没有这个字;同样的,如果查“张”字,那您也会将您的字典翻到最后部分,因为“张”的拼音是“zhang”。也就是说,字典的正文部分本身就是一个目录,您不需要再去查其他目录来找到您需要找的内容。

    我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。

    如果您认识某个字,您可以快速地从自典中查到这个字。但您也可能会遇到您不认识的字,不知道它的发音,这时候,您就不能按照刚才的方法找到您要查的字,而需要去根据“偏旁部首”查到您要找的字,然后根据这个字后的页码直接翻到某页来找到您要找的字。但您结合“部首目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法,比如您查“张”字,我们可以看到在查部首之后的检字表中“张”的页码是672页,检字表中“张”的上面是“驰”字,但页码却是63页,“张”的下面是“弩”字,页面是390页。很显然,这些字并不是真正的分别位于“张”字的上下方,现在您看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序,是字典正文中的字在非聚集索引中的映射。我们可以通过这种方式来找到您所需要的字,但它需要两个过程,先找到目录中的结果,然后再翻到您所需要的页码。

    我们把这种目录纯粹是目录,正文纯粹是正文的排序方式称为“非聚集索引”。

    通过以上例子,我们可以理解到什么是“聚集索引”和“非聚集索引”。

    进一步引申一下,我们可以很容易的理解:每个表只能有一个聚集索引,因为目录只能按照一种方法进行排序。

    (二)何时使用聚集索引或非聚集索引

    下面的表总结了何时使用聚集索引或非聚集索引(很重要)。

    动作描述      使用聚集索引 使用非聚集索引
    ---------------------------  ------------ --------------
    外键列         应           应
    主键列              应          应
    列经常被分组排序(order by)   应        应
    返回某范围内的数据           应     不应
    小数目的不同值        应    不应
    大数目的不同值           不应     应
    频繁更新的列       不应    应
    频繁修改索引列      不应         应
    一个或极少不同值    不应    不应


    事实上,我们可以通过前面聚集索引和非聚集索引的定义的例子来理解上表。如:返回某范围内的数据一项。比如您的某个表有一个时间列,恰好您把聚合索引建立在了该列,这时您查询2004年1月1日至2004年10月1日之间的全部数据时,这个速度就将是很快的,因为您的这本字典正文是按日期进行排序的,聚类索引只需要找到要检索的所有数据中的开头和结尾数据即可;而不像非聚集索引,必须先查到目录中查到每一项数据对应的页码,然后再根据页码查到具体内容。


    (三)结合实际,谈索引使用的误区

    理论的目的是应用。虽然我们刚才列出了何时应使用聚集索引或非聚集索引,但在实践中以上规则却很容易被忽视或不能根据实际情况进行综合分析。下面我们将根据在实践中遇到的实际问题来谈一下索引使用的误区,以便于大家掌握索引建立的方法。

    1、主键就是聚集索引

    这种想法笔者认为是极端错误的,是对聚集索引的一种浪费。虽然SQL SERVER默认是在主键上建立聚集索引的。

    通常,我们会在每个表中都建立一个ID列,以区分每条数据,并且这个ID列是自动增大的,步长一般为1。我们的这个办公自动化的实例中的列Gid就是如此。此时,如果我们将这个列设为主键,SQL SERVER会将此列默认为聚集索引。这样做有好处,就是可以让您的数据在数据库中按照ID进行物理排序,但笔者认为这样做意义不大。

    显而易见,聚集索引的优势是很明显的,而每个表中只能有一个聚集索引的规则,这使得聚集索引变得更加珍贵。

    从我们前面谈到的聚集索引的定义我们可以看出,使用聚集索引的最大好处就是能够根据查询要求,迅速缩小查询范围,避免全表扫描。在实际应用中,因为ID号是自动生成的,我们并不知道每条记录的ID号,所以我们很难在实践中用ID号来进行查询。这就使让ID号这个主键作为聚集索引成为一种资源浪费。其次,让每个ID号都不同的字段作为聚集索引也不符合“大数目的不同值情况下不应建立聚合索引”规则;当然,这种情况只是针对用户经常修改记录内容,特别是索引项的时候会负作用,但对于查询速度并没有影响。

    在办公自动化系统中,无论是系统首页显示的需要用户签收的文件、会议还是用户进行文件查询等任何情况下进行数据查询都离不开字段的是“日期”还有用户本身的“用户名”。

    通常,办公自动化的首页会显示每个用户尚未签收的文件或会议。虽然我们的where语句可以仅仅限制当前用户尚未签收的情况,但如果您的系统已建立了很长时间,并且数据量很大,那么,每次每个用户打开首页的时候都进行一次全表扫描,这样做意义是不大的,绝大多数的用户1个月前的文件都已经浏览过了,这样做只能徒增数据库的开销而已。事实上,我们完全可以让用户打开系统首页时,数据库仅仅查询这个用户近3个月来未阅览的文件,通过“日期”这个字段来限制表扫描,提高查询速度。如果您的办公自动化系统已经建立的2年,那么您的首页显示速度理论上将是原来速度8倍,甚至更快。

    在这里之所以提到“理论上”三字,是因为如果您的聚集索引还是盲目地建在ID这个主键上时,您的查询速度是没有这么高的,即使您在“日期”这个字段上建立的索引(非聚合索引)。下面我们就来看一下在1000万条数据量的情况下各种查询的速度表现(3个月内的数据为25万条):

    (1)仅在主键上建立聚集索引,并且不划分时间段:

    Select gid,fariqi,neibuyonghu,title from tgongwen

    用时:128470毫秒(即:128秒)

    (2)在主键上建立聚集索引,在fariq上建立非聚集索引:

    select gid,fariqi,neibuyonghu,title from Tgongwen
    where fariqi> dateadd(day,-90,getdate())

    用时:53763毫秒(54秒)

    (3)将聚合索引建立在日期列(fariqi)上:

    select gid,fariqi,neibuyonghu,title from Tgongwen
    where fariqi> dateadd(day,-90,getdate())

    用时:2423毫秒(2秒)

    虽然每条语句提取出来的都是25万条数据,各种情况的差异却是巨大的,特别是将聚集索引建立在日期列时的差异。事实上,如果您的数据库真的有1000万容量的话,把主键建立在ID列上,就像以上的第1、2种情况,在网页上的表现就是超时,根本就无法显示。这也是我摒弃ID列作为聚集索引的一个最重要的因素。

    得出以上速度的方法是:在各个select语句前加:

    declare @d datetime
    set @d=getdate()

    并在select语句后加:

    select [语句执行花费时间(毫秒)]=datediff(ms,@d,getdate())


    2、只要建立索引就能显著提高查询速度

    事实上,我们可以发现上面的例子中,第2、3条语句完全相同,且建立索引的字段也相同;不同的仅是前者在fariqi字段上建立的是非聚合索引,后者在此字段上建立的是聚合索引,但查询速度却有着天壤之别。所以,并非是在任何字段上简单地建立索引就能提高查询速度。

    从建表的语句中,我们可以看到这个有着1000万数据的表中fariqi字段有5003个不同记录。在此字段上建立聚合索引是再合适不过了。在现实中,我们每天都会发几个文件,这几个文件的发文日期就相同,这完全符合建立聚集索引要求的:“既不能绝大多数都相同,又不能只有极少数相同”的规则。由此看来,我们建立“适当”的聚合索引对于我们提高查询速度是非常重要的。

    3、把所有需要提高查询速度的字段都加进聚集索引,以提高查询速度

    上面已经谈到:在进行数据查询时都离不开字段的是“日期”还有用户本身的“用户名”。既然这两个字段都是如此的重要,我们可以把他们合并起来,建立一个复合索引(compound index)。

    很多人认为只要把任何字段加进聚集索引,就能提高查询速度,也有人感到迷惑:如果把复合的聚集索引字段分开查询,那么查询速度会减慢吗?带着这个问题,我们来看一下以下的查询速度(结果集都是25万条数据):(日期列fariqi首先排在复合聚集索引的起始列,用户名neibuyonghu排在后列)

    (1)select gid,fariqi,neibuyonghu,title from Tgongwen
    where fariqi>'2004-5-5'

    查询速度:2513毫秒

    (2)select gid,fariqi,neibuyonghu,title from Tgongwen
    where fariqi>'2004-5-5' and neibuyonghu='办公室'

    查询速度:2516毫秒

    (3)select gid,fariqi,neibuyonghu,title from Tgongwen
    where neibuyonghu='办公室'

    查询速度:60280毫秒

    从以上试验中,我们可以看到如果仅用聚集索引的起始列作为查询条件和同时用到复合聚集索引的全部列的查询速度是几乎一样的,甚至比用上全部的复合索引列还要略快(在查询结果集数目一样的情况下);而如果仅用复合聚集索引的非起始列作为查询条件的话,这个索引是不起任何作用的。当然,语句1、2的查询速度一样是因为查询的条目数一样,如果复合索引的所有列都用上,而且查询结果少的话,这样就会形成“索引覆盖”,因而性能可以达到最优。同时,请记住:无论您是否经常使用聚合索引的其他列,但其前导列一定要是使用最频繁的列。


    (四)其他书上没有的索引使用经验总结

    1、用聚合索引比用不是聚合索引的主键速度快

    下面是实例语句:(都是提取25万条数据)

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16'

    使用时间:3326毫秒

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid<=250000

    使用时间:4470毫秒

    这里,用聚合索引比用不是聚合索引的主键速度快了近1/4。


    2、用聚合索引比用一般的主键作order by时速度快,特别是在小数据量情况下

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen order by fariqi

    用时:12936

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen order by gid

    用时:18843

    这里,用聚合索引比用一般的主键作order by时,速度快了3/10。事实上,如果数据量很小的话,用聚集索引作为排序列要比使用非聚集索引速度快得明显的多;而数据量如果很大的话,如10万以上,则二者的速度差别不明显。


    3、使用聚合索引内的时间段,搜索时间会按数据占整个数据表的百分比成比例减少,而无论聚合索引使用了多少个

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi>'2004-1-1'

    用时:6343毫秒(提取100万条)

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi>'2004-6-6'

    用时:3170毫秒(提取50万条)

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16'

    用时:3326毫秒(和上句的结果一模一样。如果采集的数量一样,那么用大于号和等于号是一样的)

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi>'2004-1-1' and fariqi<'2004-6-6'

    用时:3280毫秒


    4 、日期列不会因为有分秒的输入而减慢查询速度

    下面的例子中,共有100万条数据,2004年1月1日以后的数据有50万条,但只有两个不同的日期,日期精确到日;之前有数据50万条,有5000个不同的日期,日期精确到秒。

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi>'2004-1-1' order by fariqi

    用时:6390毫秒

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi<'2004-1-1' order by fariqi

    用时:6453毫秒

    (五)其他注意事项

    “水可载舟,亦可覆舟”,索引也一样。索引有助于提高检索性能,但过多或不当的索引也会导致系统低效。过多的索引甚至会导致索引碎片。
    索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索引技术得到解决。

    1. 不要索引常用的小型表

    不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。

    2. 不要把社会保障号码(SSN)或身份证号码(ID)选作键

    永远都不要使用 SSN 或 ID 作为数据库的键。除了隐私原因以外,SSN 或 ID 需要手工输入。永远不要使用手工输入的键作为主键,因为一旦你输入错误,你唯一能做的就是删除整个记录然后从头开始。

    3. 不要用用户的键

    在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。这样做会迫使你采取以下两个措施:

    4. 不要索引 memo/notes 字段和不要索引大型文本字段(许多字符)

    这样做会让你的索引占据大量的数据库空间

    5. 使用系统生成的主键

    假如你总是在设计数据库的时候采用系统生成的键作为主键,那么你实际控制了数据库的索引完整性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。
    采用系统生成键作为主键还有一个优点:当你拥有一致的键结构时,找到逻辑缺陷很容易。


    二、改善SQL语句

    很多人不知道SQL语句在SQL SERVER中是如何执行的,他们担心自己所写的SQL语句会被SQL SERVER误解。比如:

    select * from table1 where name='zhangsan' and tID > 10000

    和执行:

    select * from table1 where tID > 10000 and name='zhangsan'

    一些人不知道以上两条语句的执行效率是否一样,因为如果简单的从语句先后上看,这两个语句的确是不一样,如果tID是一个聚合索引,那么后一句仅仅从表的10000条以后的记录中查找就行了;而前一句则要先从全表中查找看有几个name='zhangsan'的,而后再根据限制条件条件tID>10000来提出查询结果。

    事实上,这样的担心是不必要的。SQL SERVER中有一个“查询分析优化器”,它可以计算出where子句中的搜索条件并确定哪个索引能缩小表扫描的搜索空间,也就是说,它能实现自动优化。

    虽然查询优化器可以根据where子句自动的进行查询优化,但大家仍然有必要了解一下“查询优化器”的工作原理,如非这样,有时查询优化器就会不按照您的本意进行快速查询。

    在查询分析阶段,查询优化器查看查询的每个阶段并决定限制需要扫描的数据量是否有用。如果一个阶段可以被用作一个扫描参数(SARG),那么就称之为可优化的,并且可以利用索引快速获得所需数据。

    SARG的定义:用于限制搜索的一个操作,因为它通常是指一个特定的匹配,一个值得范围内的匹配或者两个以上条件的AND连接。形式如下:

    列名 操作符 <常数 或 变量>

    <常数 或 变量> 操作符列名

    列名可以出现在操作符的一边,而常数或变量出现在操作符的另一边。如:

    Name=’张三’

    价格>5000

    5000<价格

    Name=’张三’ and 价格>5000

    如果一个表达式不能满足SARG的形式,那它就无法限制搜索的范围了,也就是SQL SERVER必须对每一行都判断它是否满足WHERE子句中的所有条件。所以一个索引对于不满足SARG形式的表达式来说是无用的。

    介绍完SARG后,我们来总结一下使用SARG以及在实践中遇到的和某些资料上结论不同的经验:

    1、Like语句是否属于SARG取决于所使用的通配符的类型

    如:name like ‘张%’ ,这就属于SARG
    而:name like ‘%张’ ,就不属于SARG。

    原因是通配符%在字符串的开通使得索引无法使用。

    2、or 会引起全表扫描

    如:Name=’张三’ and 价格>5000 符号SARG,
    而:Name=’张三’ or  价格>5000 则不符合SARG。
    使用or会引起全表扫描。

    3、非操作符、函数引起的不满足SARG形式的语句

    不满足SARG形式的语句最典型的情况就是包括非操作符的语句,如:NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等,另外还有函数。下面就是几个不满足SARG形式的例子:

    ABS(价格)<5000
    Name like ‘%三’

    有些表达式,如:

    WHERE 价格*2>5000
    SQL SERVER也会认为是SARG,SQL SERVER会将此式转化为:
    WHERE 价格>2500/2

    但我们不推荐这样使用,因为有时SQL SERVER不能保证这种转化与原始表达式是完全等价的。

    4、IN 的作用相当与OR

    语句:

    Select * from table1 where tid in (2,3)

    Select * from table1 where tid=2 or tid=3

    是一样的,都会引起全表扫描,如果tid上有索引,其索引也会失效。

    5、尽量少用NOT

    6、exists 和 in 的执行效率是一样的

    很多资料上都显示说,exists要比in的执行效率要高,同时应尽可能的用not exists来代替not in。但事实上,我试验了一下,发现二者无论是前面带不带not,二者之间的执行效率都是一样的。因为涉及子查询,我们试验这次用SQL SERVER自带的pubs数据库。运行前我们可以把SQL SERVER的statistics I/O状态打开。

    (1)select title,price from titles where title_id in
    (select title_id from sales where qty>30)

    该句的执行结果为:
    表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。
    表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。

    (2)select title,price from titles where exists
    (select * from sales where sales.title_id=titles.title_id and qty>30)

    第二句的执行结果为:
    表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。
    表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。

    我们从此可以看到用exists和用in的执行效率是一样的。

    7、用函数charindex()和前面加通配符%的LIKE执行效率一样

    前面,我们谈到,如果在LIKE前面加上通配符%,那么将会引起全表扫描,所以其执行效率是低下的。但有的资料介绍说,用函数charindex()来代替LIKE速度会有大的提升,经我试验,发现这种说明也是错误的:

    select gid,title,fariqi,reader from tgongwen
    where charindex('刑侦支队',reader)>0 and fariqi>'2004-5-5'

    用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。

    select gid,title,fariqi,reader from tgongwen
    where reader like '%' + '刑侦支队' + '%' and fariqi>'2004-5-5'

    用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。

    8、union并不绝对比or的执行效率高

    我们前面已经谈到了在where子句中使用or会引起全表扫描,一般的,我所见过的资料都是推荐这里用union来代替or。事实证明,这种说法对于大部分都是适用的。

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16' or gid>9990000

    用时:68秒。扫描计数 1,逻辑读 404008 次,物理读 283 次,预读 392163 次。

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16'
    union
    select gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid>9990000

    用时:9秒。扫描计数 8,逻辑读 67489 次,物理读 216 次,预读 7499 次。

    看来,用union在通常情况下比用or的效率要高的多。

    但经过试验,笔者发现如果or两边的查询列是一样的话,那么用union则反倒和用or的执行速度差很多,虽然这里union扫描的是索引,而or扫描的是全表。

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16' or fariqi='2004-2-5'

    用时:6423毫秒。扫描计数 2,逻辑读 14726 次,物理读 1 次,预读 7176 次。

    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where fariqi='2004-9-16'
    union
    select gid,fariqi,neibuyonghu,reader,title from Tgongwen
    where  fariqi='2004-2-5'

    用时:11640毫秒。扫描计数 8,逻辑读 14806 次,物理读 108 次,预读 1144 次。

    9、字段提取要按照“需多少、提多少”的原则,避免“select *”

    我们来做一个试验:

    select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc

    用时:4673毫秒

    select top 10000 gid,fariqi,title from tgongwen order by gid desc

    用时:1376毫秒

    select top 10000 gid,fariqi from tgongwen order by gid desc

    用时:80毫秒

    由此看来,我们每少提取一个字段,数据的提取速度就会有相应的提升。提升的速度还要看您舍弃的字段的大小来判断。

    10、count(*)不比count(字段)慢

    某些资料上说:用*会统计所有列,显然要比一个世界的列名效率低。这种说法其实是没有根据的。我们来看:

    select count(*) from Tgongwen

    用时:1500毫秒

    select count(gid) from Tgongwen

    用时:1483毫秒

    select count(fariqi) from Tgongwen

    用时:3140毫秒

    select count(title) from Tgongwen

    用时:52050毫秒

    从以上可以看出,如果用count(*)和用count(主键)的速度是相当的,而count(*)却比其他任何除主键以外的字段汇总速度要快,而且字段越长,汇总的速度就越慢。我想,如果用count(*), SQL SERVER可能会自动查找最小字段来汇总的。当然,如果您直接写count(主键)将会来的更直接些。

    11、order by按聚集索引列排序效率最高

    我们来看:(gid是主键,fariqi是聚合索引列)

    select top 10000 gid,fariqi,reader,title from tgongwen

    用时:196 毫秒。 扫描计数 1,逻辑读 289 次,物理读 1 次,预读 1527 次。

    select top 10000 gid,fariqi,reader,title from tgongwen order by gid asc

    用时:4720毫秒。 扫描计数 1,逻辑读 41956 次,物理读 0 次,预读 1287 次。

    select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc

    用时:4736毫秒。 扫描计数 1,逻辑读 55350 次,物理读 10 次,预读 775 次。

    select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi asc

    用时:173毫秒。 扫描计数 1,逻辑读 290 次,物理读 0 次,预读 0 次。

    select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi desc

    用时:156毫秒。 扫描计数 1,逻辑读 289 次,物理读 0 次,预读 0 次。

    从以上我们可以看出,不排序的速度以及逻辑读次数都是和“order by 聚集索引列” 的速度是相当的,但这些都比“order by 非聚集索引列”的查询速度是快得多的。

    同时,按照某个字段进行排序的时候,无论是正序还是倒序,速度是基本相当的。

    12、高效的TOP

    事实上,在查询和提取超大容量的数据集时,影响数据库响应时间的最大因素不是数据查找,而是物理的I/0操作。如:

    select top 10 * from (
    select top 10000 gid,fariqi,title from tgongwen
    where neibuyonghu='办公室'order by gid desc) as a
    order by gid asc

    这条语句,从理论上讲,整条语句的执行时间应该比子句的执行时间长,但事实相反。因为,子句执行后返回的是10000条记录,而整条语句仅返回10条语句,所以影响数据库响应时间最大的因素是物理I/O操作。而限制物理I/O操作此处的最有效方法之一就是使用TOP关键词了。TOP关键词是SQL SERVER中经过系统优化过的一个用来提取前几条或前几个百分比数据的词。经笔者在实践中的应用,发现TOP确实很好用,效率也很高。但这个词在另外一个大型数据库ORACLE中却没有,这不能说不是一个遗憾,虽然在ORACLE中可以用其他方法(如:rownumber)来解决。在以后的关于“实现千万级数据的分页显示存储过程”的讨论中,我们就将用到TOP这个关键词。

    到此为止,我们上面讨论了如何实现从大容量的数据库中快速地查询出您所需要的数据方法。当然,我们介绍的这些方法都是“软”方法,在实践中,我们还要考虑各种“硬”因素,如:网络性能、服务器的性能、操作系统的性能,甚至网卡、交换机等。


    三、实现小数据量和海量数据的通用分页显示存储过程

    建立一个web 应用,分页浏览功能必不可少。这个问题是数据库处理中十分常见的问题。经典的数据分页方法是:ADO 纪录集分页法,也就是利用ADO自带的分页功能(利用游标)来实现分页。但这种分页方法仅适用于较小数据量的情形,因为游标本身有缺点:游标是存放在内存中,很费内存。游标一建立,就将相关的记录锁住,直到取消游标。游标提供了对特定集合中逐行扫描的手段,一般使用游标来逐行遍历数据,根据取出数据条件的不同进行不同的操作。而对于多表和大表中定义的游标(大的数据集合)循环很容易使程序进入一个漫长的等待甚至死机。

    更重要的是,对于非常大的数据模型而言,分页检索时,如果按照传统的每次都加载整个数据源的方法是非常浪费资源的。现在流行的分页方法一般是检索页面大小的块区的数据,而非检索所有的数据,然后单步执行当前行。

    最早较好地实现这种根据页面大小和页码来提取数据的方法大概就是“俄罗斯存储过程”。这个存储过程用了游标,由于游标的局限性,所以这个方法并没有得到大家的普遍认可。

    后来,网上有人改造了此存储过程,下面的存储过程就是结合我们的办公自动化实例写的分页存储过程:

    CREATE procedure pagination1
    (@pagesize int,  --页面大小,如每页存储20条记录
    @pageindex int   --当前页码
    )
    as
    set nocount on    //不返回计数,不返回任何结果集
    begin
    declare @indextable table(id int identity(1,1),nid int)  --定义表变量
    declare @PageLowerBound int      --定义此页的底码
    declare @PageUpperBound int      --定义此页的顶码
    set @PageLowerBound=(@pageindex-1)*@pagesize
    set @PageUpperBound=@PageLowerBound+@pagesize
    set rowcount @PageUpperBound
    insert into @indextable(nid) select gid from TGongwen where fariqi  > dateadd(day,-365,getdate()) order by fariqi desc
    select O.gid,O.mid,O.title,O.fadanwei,O.fariqi from TGongwen O, @indextable t where O.gid=t.nid
    and t.id>@PageLowerBound and t.id<=@PageUpperBound order by t.id
    end
    set nocount off  //返回计数,返回任何结果集


    以上存储过程运用了SQL SERVER的最新技术――表变量。应该说这个存储过程也是一个非常优秀的分页存储过程。当然,在这个过程中,您也可以把其中的表变量写成临时表:CREATE TABLE #Temp。但很明显,在SQL SERVER中,用临时表是没有用表变量快的。所以笔者刚开始使用这个存储过程时,感觉非常的不错,速度也比原来的ADO的好。但后来,我又发现了比此方法更好的方法。

    笔者曾在网上看到了一篇小短文《从数据表中取出第n条到第m条的记录的方法》,全文如下:

    从publish 表中取出第 n 条到第 m 条的记录:

    SELECT TOP m-n+1 *
    FROM publish
    WHERE (id NOT IN (SELECT TOP n-1 id FROM publish))

    id 为publish 表的关键字

    我当时看到这篇文章的时候,真的是精神为之一振,觉得思路非常得好。等到后来,我在作办公自动化系统(ASP.NET+ C#+SQL SERVER)的时候,忽然想起了这篇文章,我想如果把这个语句改造一下,这就可能是一个非常好的分页存储过程。于是我就满网上找这篇文章,没想到,文章还没找到,却找到了一篇根据此语句写的一个分页存储过程,这个存储过程也是目前较为流行的一种分页存储过程,我很后悔没有争先把这段文字改造成存储过程:

    CREATE PROCEDURE pagination2
    (
     @SQL nVARCHAR(4000),    --不带排序语句的SQL语句
     @Page int,              --页码
     @RecsPerPage int,       --每页容纳的记录数
     @ID VARCHAR(255),       --需要排序的不重复的ID号
     @Sort VARCHAR(255)      --排序字段及规则
    )
    AS

    DECLARE @Str nVARCHAR(4000)

    SET @Str='SELECT   TOP '+CAST(@RecsPerPage AS VARCHAR(20))+' * FROM ('+@SQL+') T WHERE T.'+@ID+'NOT IN
    (SELECT   TOP '+CAST((@RecsPerPage*(@Page-1)) AS VARCHAR(20))+' '+@ID+' FROM ('+@SQL+') T9 ORDER BY '+@Sort+') ORDER BY '+@Sort

    PRINT @Str

    EXEC sp_ExecuteSql @Str
    GO

    其实,以上语句可以简化为:

    SELECT TOP 页大小 *
    FROM Table1
    WHERE (ID NOT IN
              (SELECT TOP 页大小*页数 id
             FROM 表
             ORDER BY id))
    ORDER BY ID

    但这个存储过程有一个致命的缺点,就是它含有NOT IN字样。虽然我可以把它改造为:

    SELECT TOP 页大小 *
    FROM Table1
    WHERE not exists
    (select * from (select top (页大小*页数) * from table1 order by id) b
       where b.id=a.id )
    order by id

    即,用not exists来代替not in,但我们前面已经谈过了,二者的执行效率实际上是没有区别的。

    既便如此,用TOP 结合NOT IN的这个方法还是比用游标要来得快一些。

    虽然用not exists并不能挽救上个存储过程的效率,但使用SQL SERVER中的TOP关键字却是一个非常明智的选择。因为分页优化的最终目的就是避免产生过大的记录集,而我们在前面也已经提到了TOP的优势,通过TOP 即可实现对数据量的控制。

    在分页算法中,影响我们查询速度的关键因素有两点:TOP和NOT IN。TOP可以提高我们的查询速度,而NOT IN会减慢我们的查询速度,所以要提高我们整个分页算法的速度,就要彻底改造NOT IN,同其他方法来替代它。

    我们知道,几乎任何字段,我们都可以通过max(字段)或min(字段)来提取某个字段中的最大或最小值,所以如果这个字段不重复,那么就可以利用这些不重复的字段的max或min作为分水岭,使其成为分页算法中分开每页的参照物。在这里,我们可以用操作符“>”或“<”号来完成这个使命,使查询语句符合SARG形式。如:

    Select top 10 * from table1 where id>200

    于是就有了如下分页方案:

    select top 页大小 *
    from table1
    where id>
          (select max (id) from
          (select top ((页码-1)*页大小) id from table1 order by id) as T
           )    
    order by id

    在选择即不重复值,又容易分辨大小的列时,我们通常会选择主键。下表列出了笔者用有着1000万数据的办公自动化系统中的表,在以GID(GID是主键,但并不是聚集索引。)为排序列、提取gid,fariqi,title字段,分别以第1、10、100、500、1000、1万、10万、25万、50万页为例,测试以上三种分页方案的执行速度:(单位:毫秒)

    页  码        方案1            方案2           方案3
    -----------   -----------    ---------  ------------
    1             60             30              76
    10              46             16              63
    100            1076            720             130
    500            540             12943           83
    1000          17110          470             250
    1万             24796           4500            140
    10万           38326           42283           1553
    25万           28140           128720          2330
    50万           121686         127846          7168


     从上表中,我们可以看出,三种存储过程在执行100页以下的分页命令时,都是可以信任的,速度都很好。但第一种方案在执行分页1000页以上后,速度就降了下来。第二种方案大约是在执行分页1万页以上后速度开始降了下来。而第三种方案却始终没有大的降势,后劲仍然很足。

    在确定了第三种分页方案后,我们可以据此写一个存储过程。大家知道SQL SERVER的存储过程是事先编译好的SQL语句,它的执行效率要比通过WEB页面传来的SQL语句的执行效率要高。下面的存储过程不仅含有分页方案,还会根据页面传来的参数来确定是否进行数据总数统计。

    -- 获取指定页的数据

    CREATE PROCEDURE pagination3
    @tblName varchar(255),          -- 表名
    @strGetFields varchar(1000) = '*',   -- 需要返回的列
    @fldName varchar(255)='',         -- 排序的字段名
    @PageSize int = 10,             -- 页尺寸(每页记录数)
    @PageIndex int = 1,              -- 页码
    @doCount bit = 0,        -- 返回记录总数, 非0值则返回记录数
    @OrderType bit = 0,       -- 设置排序类型, 非0值则降序
    @strWhere  varchar(1500) = ''     -- 查询条件 (注意: 不要加 where)
    AS
    declare @strSQL   varchar(5000)        -- 主语句
    declare @strTmp   varchar(110)         -- 临时变量
    declare @strOrder varchar(400)         -- 排序类型

    if @doCount != 0
      begin
        if @strWhere !=''
           set @strSQL = "select count(*) as Total from [" + @tblName + "] where "+@strWhere
        else
           set @strSQL = "select count(*) as Total from [" + @tblName + "]"
     end   --以上代码的意思是如果@doCount传递过来的不是0,就执行总数统计。以下的所有代码都是@doCount为0的情况
    else
    begin
    if @OrderType != 0         // 降序(desc)
    begin
        set @strTmp = "<(select min"
    set @strOrder = " order by [" + @fldName +"] desc"
    --如果@OrderType不是0,就执行降序,这句很重要!
    end
    else      // 升序(asc)
    begin
        set @strTmp = ">(select max"
        set @strOrder = " order by [" + @fldName +"] asc"
    end

    if @PageIndex = 1   // 页码
    begin
        if @strWhere != ''  
    set @strSQL = "select top " +str(@PageSize)+ " " +@strGetFields+ " from [" + @tblName + "] where " + @strWhere + " " + @strOrder
            else
    set @strSQL = "select top " +str(@PageSize)+" " +@strGetFields+ "  from [" +@tblName+ "] " +@strOrder
    --如果是第一页就执行以上代码,这样会加快执行速度
    end
    else
    begin --以下代码赋予了@strSQL以真正执行的SQL代码
    set @strSQL = "select top " +str(@PageSize)+ " " +@strGetFields+ "  from [" +@tblName+ "] where [" +@fldName+ "]" +@strTmp+ "([" +@fldName+ "]) from (select top " +str((@PageIndex-1)*@PageSize)+ " [" +@fldName+ "] from [" +@tblName+ "]" +@strOrder+ ") as tblTmp)" +@strOrder

    if @strWhere != ''
    set @strSQL ="select top " +str(@PageSize)+ " " +@strGetFields+ "  from [" +@tblName+ "] where [" +@fldName+ "]" +@strTmp+ "([" +@fldName+ "]) from (select top " +str((@PageIndex-1)*@PageSize) + " [" +@fldName+ "] from [" +@tblName+ "] where " +@strWhere+ " " +@strOrder+ ") as tblTmp) and " +@strWhere+ " " +@strOrder
    end
    end  
    exec (@strSQL)
    GO

    上面的这个存储过程是一个通用的存储过程,其注释已写在其中了。

    select top 页大小 *
    from table1
    where id >
          (select max (id) from
          (select top ((页码-1)*页大小) id from table1 order by id) as T
           )    
    order by id

    在大数据量的情况下,特别是在查询最后几页的时候,查询时间一般不会超过9秒;而用其他存储过程,在实践中就会导致超时,所以这个存储过程非常适用于大容量数据库的查询。

    笔者希望能够通过对以上存储过程的解析,能给大家带来一定的启示,并给工作带来一定的效率提升,同时希望同行提出更优秀的实时数据分页算法。


    四、聚集索引的重要性和如何选择聚集索引

    在上一节的标题中,笔者写的是:实现小数据量和海量数据的通用分页显示存储过程。这是因为在将本存储过程应用于“办公自动化”系统的实践中时,笔者发现这第三种存储过程在小数据量的情况下,有如下现象:

    1、分页速度一般维持在1秒和3秒之间。

    2、在查询最后一页时,速度一般为5秒至8秒,哪怕分页总数只有3页或30万页。

    虽然在超大容量情况下,这个分页的实现过程是很快的,但在分前几页时,这个1-3秒的速度比起第一种甚至没有经过优化的分页方法速度还要慢,借用户的话说就是“还没有ACCESS数据库速度快”,这个认识足以导致用户放弃使用您开发的系统。

    笔者就此分析了一下,原来产生这种现象的症结是如此的简单,但又如此的重要:排序的字段不是聚集索引!

    本篇文章的题目是:“查询优化及分页算法方案”。笔者只所以把“查询优化”和“分页算法”这两个联系不是很大的论题放在一起,就是因为二者都需要一个非常重要的东西――聚集索引。

    在前面的讨论中我们已经提到了,聚集索引有两个最大的优势:

    1、以最快的速度缩小查询范围。
    2、以最快的速度进行字段排序。

    第1条多用在查询优化时,而第2条多用在进行分页时的数据排序。

    而聚集索引在每个表内又只能建立一个,这使得聚集索引显得更加的重要。聚集索引的挑选可以说是实现“查询优化”和“高效分页”的最关键因素。

    但要既使聚集索引列既符合查询列的需要,又符合排序列的需要,这通常是一个矛盾。

    笔者前面“索引”的讨论中,将fariqi,即用户发文日期作为了聚集索引的起始列,日期的精确度为“日”。这种作法的优点,前面已经提到了,在进行划时间段的快速查询中,比用ID主键列有很大的优势。

    但在分页时,由于这个聚集索引列存在着重复记录,所以无法使用max或min来最为分页的参照物,进而无法实现更为高效的排序。而如果将ID主键列作为聚集索引,那么聚集索引除了用以排序之外,没有任何用处,实际上是浪费了聚集索引这个宝贵的资源。

    为解决这个矛盾,笔者后来又添加了一个日期列,其默认值为getdate()。用户在写入记录时,这个列自动写入当时的时间,时间精确到毫秒。即使这样,为了避免可能性很小的重合,还要在此列上创建UNIQUE约束。将此日期列作为聚集索引列。

    有了这个时间型聚集索引列之后,用户就既可以用这个列查找用户在插入数据时的某个时间段的查询,又可以作为唯一列来实现max或min,成为分页算法的参照物。

    经过这样的优化,笔者发现,无论是大数据量的情况下还是小数据量的情况下,分页速度一般都是几十毫秒,甚至0毫秒。而用日期段缩小范围的查询速度比原来也没有任何迟钝。

    聚集索引是如此的重要和珍贵,所以笔者总结了一下,一定要将聚集索引建立在:

    1、您最频繁使用的、用以缩小查询范围的字段上;
    2、您最频繁使用的、需要排序的字段上。


    结束语:

    本篇文章汇集了笔者近段在使用数据库方面的心得,是在做“办公自动化”系统时实践经验的积累。希望这篇文章不仅能够给大家的工作带来一定的帮助,也希望能让大家能够体会到分析问题的方法;最重要的是,希望这篇文章能够抛砖引玉,掀起大家的学习和讨论的兴趣,以共同促进,共同为公安科技强警事业和金盾工程做出自己最大的努力。

    最后需要说明的是,在试验中,我发现用户在进行大数据量查询的时候,对数据库速度影响最大的不是内存大小,而是CPU。在我的P4 2.4机器上试验的时候,查看“资源管理器”,CPU经常出现持续到100%的现象,而内存用量却并没有改变或者说没有大的改变。即使在我们的HP ML 350 G3服务器上试验时,CPU峰值也能达到90%,一般持续在70%左右。

    本文的试验数据都是来自我们的HP ML 350服务器。服务器配置:双Inter Xeon 超线程 CPU 2.4G,内存1G,操作系统Windows Server 2003 Enterprise Edition,数据库SQL Server 2000 SP3。

  • 产生0-60000 之间的随机数

    2007-05-29 14:32:02

     

    //产生0-60000 之间的随机数 

    public int geneRandom(){
      int randomInt=0;
      Random rdm=new Random();
      randomInt = (rdm.nextInt()>>>1)%60000;
      return randomInt;
     }

    String temp = new Integer(random).toString();

     

  • 产生一定数值范围内的随机数的java程序

    2007-05-29 13:05:36

    产生一定数值范围内的随机数的java程序

    分类:J2SE

     

    /*
     * 下面这个程序给出在一定范围内的随机数生成方法,随机数生成对每一种编程语言来说都是十分重要的。
     */
    import java.util.*;

    public class RandomWithRangeTest {
        public RandomWithRangeTest(){

        }

        public static void main(String [] args){
            Random rdm=new Random();

     

            // 产生-160到160之间的随机数
            System.out.println("Range from -160 to + 160");
            for(int i=0;i<5;i++)
                System.out.println(rdm.nextInt()%160);

     

            // 产生0到160之间的随机数
            System.out.println("Range from 0 to 160");
            for(int i=0;i<5;i++)
                System.out.println((rdm.nextInt()>>>1)%160); //>>>是无符号右移位操作符,在高位插入0

     

            // 产生0到160之间的随机数的另一种方法
            System.out.println("Range from 0 to 160");
            for(int i=0;i<5;i++)
                System.out.println((rdm.nextInt()& 0x7fffffff)%160); // 将int数的最高位置为0,也就是排除掉负数

     

           //产生-160到0之间的随机数
           System.out.println("Range from -160 to 0");
           for(int i=0;i<5;i++)
               System.out.println(-(rdm.nextInt()>>>1)%160);

     

           //产生-160到0之间的随机数的另一种方法
           System.out.println("Range from -160 to 0");
           for(int i=0;i<5;i++)
               System.out.println((rdm.nextInt()| 0x80000000)%160); // 将int数的最高位置为1,也就是排除掉正数


        }
    }///:~

  • JUnit入门

    2007-05-29 10:15:52

    一、简介

    JUnit是一个开源的java单元测试框架。在1997年,由 Erich Gamma Kent Beck 开发完成。这两个牛人中 Erich Gamma GOF 之一;Kent Beck 则在 XP 中有重要的贡献(你觉得眼熟一点都不奇怪)。

           正如常言道:麻雀虽小,五脏俱全。” JUnit设计的非常小巧,但是功能却非常强大。

           下面是JUnit一些特性的总结:

    1)         提供的API可以让你写出测试结果明确的可重用单元测试用例

    2)       提供了三种方式来显示你的测试结果,而且还可以扩展

    3)       提供了单元测试用例成批运行的功能

    4)       超轻量级而且使用简单,没有商业性的欺骗和无用的向导

    5)       整个框架设计良好,易扩展

    对不同性质的被测对象,如ClassJspServletEjb等,Junit有不同的使用技巧。由于本文的性质,以下仅以Class测试为例。

    下面我们就叩开JUnit的大门吧!

     

    二、下载

    点击http://www.junit.org可以下载到最新版本的JUnit,本文使用的为3.8.1版。至于安装或者配置之类,你只需要轻松的将下载下来的压缩包中的jar文件,放到你工程的classpath中就可以了。

    这样,你的系统中就可以使用JUnit编写单元测试代码了(是不是很简单)!

     

    三、HelloWorld

    记得在几乎每本语言教学书上都能找到HelloWorld这个入门代码。今天在这里,我们也从一个简单到根本不用单元测试的例子入手。这是一个只会做两数加减的超级简单的计算器(小学一年级必备极品)。代码如下:

    public class SampleCalculator

    {

           public int add(int augend , int addend)

           {

                  return augend + addend ;

           }     

          

           public int subtration(int minuend , int subtrahend)

           {     

                  return minuend - subtrahend ;

           }

    }

    将上面的代码编译通过。下面就是我为上面程序写的一个单元测试用例:

    //请注意这个程序里面类名和方法名的特征

    public class TestSample extends TestCase

    {

           public void testAdd()

           {     

    SampleCalculator calculator = new SampleCalculator();   

                  int result = calculator.add(50 , 20);

                  assertEquals(70 , result);

           }

           public void testSubtration()

           {

                  SampleCalculator calculator = new SampleCalculator();

                  int result = calculator.subtration(50 , 20);

                  assertEquals(30 , result);

           }

    }

           好了,在DOS命令行里面输入javac -classpath .;junit.jar TestSample.java 将测试类编译通过。然后再输入 java -classpath .;junit.jar junit.swingui.TestRunner TestSample 运行测试类,你会看到如下的窗口。

     

     

    上图中,绿色说明单元测试通过,没有错误产生;如果是红色的,则就是说测试失败了。这样一个简单的单元测试就完成了,是不是很容易啊?

           按照框架规定:编写的所有测试类,必须继承自junit.framework.TestCase类;里面的测试方法,命名应该以Test开头,必须是public void 而且不能有参数;而且为了测试查错方便,尽量一个TestXXX方法对一个功能单一的方法进行测试;使用assertEqualsjunit.framework.TestCase中的断言方法来判断测试结果正确与否。

           你可以对比着上面测试类中的实现来体会下规定——很简单!而且你在这个测试类中有加入多少个测试方法,就会运行多少个测试方法。

     

    四、向前一步

    学完了HelloWorld,你已经可以编写标准的单元测试用例了。但是还有一些细节,这里还要说明一下。不要急,很快的!

    你在看上面的代码的时候,是不是注意到每个TestXXX方法中都有一条SampleCalculator初始化语句?这很明显不符合编码规范。你可能正要将它提取出来放到构造函数里面去。且慢!在JUnit中的初始化是建议在Setup方法中作的。JUnit提供了一对方法,一个在运行测试方法前初始化一些必备条件而另一个就是测试完毕后去掉初始化的条件(见下图)。


           另外你是否注意到,上面弹出窗口的一个细节,在绿条下面有ErrorsFailures统计。这两者有何区别呢?

           Failures作为单元测试所期望发生的错误,它预示你的代码有bug,不过也可能是你的单元测试代码有逻辑错误(注意是逻辑错误)。Errors不是你所期待的,发生了Error你可以按照下面的顺序来检查:

           检查测试所需的环境,如:数据库连接

           检查单元测试代码

           检查你的系统代码

     

    五、成批运行test case

    这是前面提到的JUnit特性之一。它方便于系统单元测试的成批运行。使用起来也是非常简单,先看下使用代码:

    import junit.framework.Test;

    import junit.framework.TestSuite;

    public class TestAll{

        public static Test suite(){

            TestSuite suite = new TestSuite("TestSuite Test");

            suite.addTestSuite( TestSample.class);

            return suite;

        }

    }

           这个测试程序的编译、运行,和上面TestSample的方式是一样的。

    javac -classpath .;junit.jar TestAll.java

    java -classpath .;junit.jar junit.swingui.TestRunner TestAll

    怎么样?这样你在suite方法里面添加几个TestCase就会运行几个,而且它也可以添加TestSuite来将小一点的集合加入大的集合中来,方便了对于不断增加的TestCase的管理和维护

    呵呵,你觉得suite方法的作用是不是于java应用程序的main很类似?并且这里的suite必须严格遵守上面的写法!

     

    六、TestRunner

    JUnit中已经给出了三种方式表示的TestRunner。你可以分别运行体验下他们的不同。

    junit.swingui.TestRunner

    junit.awtui.TestRunner

    junit.textui.TestRunner

     

    七、总结

    本文轻松简要的介绍了JUnit使用的入门知识。完全没有涉及到深入的技巧和使用规范。而这些请关注我关于JUnit高级使用、JUnit源代码分析的文章。

  • eclipse下junit快速上手

    2007-05-29 10:12:41

    step1:

    右键点击java文件A--->new-->junit test case,即可产生一个test case,默认会将A中的非私有方法前都加上test

    step2:

    编写该case,下面是个简单的例子:

    public class AirTest extends TestCase {
        private  Air air;
     /*
      * @see TestCase#setUp()
      */
     protected void setUp() throws Exception {
     
       air = new Air();
     }

     /*
      * @see TestCase#tearDown()
      */
     protected void tearDown() throws Exception {
     
     }

     /*
      * Class under test for double h(double, double)
      */
     public void testH() {
      double result=air.h(0,400);
      assertEquals(400.07,result,400.07*0.01);
     }

     /*
      * Class under test for double cp(double, double)
      */
     public void testCp() {
      double result=air.cp(0,400);
      assertEquals(1.0161,result,1.0161*0.01);
     }

     /*
      * Class under test for double cv(double, double)
      */
     public void testCv() {
      double result=air.cv(0,400);
      assertEquals(0.7291,result,0.7291*0.01);
     }

    }

    很明显,我写了个Air类,有3个函数,分别计算定压比热、焓和定容比热,AirTest 就是来测试这三个函数,注意每个函数内部的assertEquals,参数1时预定的值,参数2是程序算出的值,参数3是允许的误差范围

    step3

    点击Run...按纽----》选择junit--》点击new---》运行就会弹出junit的结果窗口,显示运行结果

    后记:

    完全可以将junit任务集成到ant中,在ant加如下片段即可

    <!-- 测试 -->
     <target name="test" depends="compile" descrīption="run junit test">
      <mkdir dir="${report.dir}" />
      <junit printsummary="on" haltonfailure="false" failureproperty="tests.failed" showoutput="true">
       <classpath refid="master-classpath" />
       <formatter type="xml" />
       <batchtest todir="${report.dir}">
        <fileset dir="${classes.dir}">
         <include name="test/**" />
        </fileset>
       </batchtest>
      </junit>
      <fail if="tests.failed">
    ***********************************************************
    **** One or more tests failed! Check the output ... ****
    ***********************************************************
    </fail>
     </target>

    运行ant即可完成测试,但里面有个恼人的问题,就是ant居然不认junit这个任务,看看ant home 里面确实有ant--junit.jar,就算再将junit.jar放在该目录也不行!郁闷,但可以通过下面的方法解决:window-->preferences-->ant-->runtime-->classpath,到入junit.jar即可,很奇怪的是classpath中ant-junit.jar真不知道是干嘛的,非要放入junit.jar才行

  • DECLARE CURSOR

    2007-05-28 19:51:31

    SQL Server 2005 联机丛书
    DECLARE CURSOR (Transact-SQL)

    更新日期: 2005 年 12 月 5 日

    定义 Transact-SQL 服务器游标的属性,例如游标的滚动行为和用于生成游标所操作的结果集的查询。DECLARE CURSOR 接受基于 SQL-92 标准的语法和使用一组 Transact-SQL 扩展插件的语法。

    主题链接图标 Transact-SQL 语法约定

    参数参数
    cursor_name

    所定义的 Transact-SQL 服务器游标的名称。cursor_name 必须符合标识符规则。有关标识符规则的详细信息,请参阅使用标识符作为对象名称

    INSENSITIVE

    定义一个游标,以创建将由该游标使用的数据的临时复本。对游标的所有请求都从 tempdb 中的这一临时表中得到应答;因此,在对该游标进行提取操作时返回的数据中不反映对基表所做的修改,并且该游标不允许修改。使用 SQL-92 语法时,如果省略 INSENSITIVE,则已提交的(任何用户)对基础表的删除和更新都反映在后面的提取中。

    SCROLL

    指定所有的提取选项(FIRST、LAST、PRIOR、NEXT、RELATIVE、ABSOLUTE)均可用。如果未在 SQL-92 DECLARE CURSOR 中指定 SCROLL,则 NEXT 是唯一支持的提取选项。如果也指定了 FAST_FORWARD,则不能指定 SCROLL。

    select_statement

    定义游标结果集的标准 SELECT 语句。在游标声明的 select_statement 内不允许使用关键字 COMPUTE、COMPUTE BY、FOR BROWSE 和 INTO。

    Microsoft 如果 select_statement 中的子句与所请求的游标类型的功能有冲突,则 SQL Server 会将游标隐式转换为其他类型。有关详细信息,请参阅使用隐式游标转换

    READ ONLY

    禁止通过该游标进行更新。在 UPDATE 或 DELETE 语句的 WHERE CURRENT OF 子句中不能引用游标。该选项优于要更新的游标的默认功能。

    UPDATE [OF column_name [,...n]]

    定义游标中可更新的列。如果指定了 OF column_name [,...n],则只允许修改列出的列。如果指定了 UPDATE,但未指定列的列表,则可以更新所有列。

    cursor_name

    所定义的 Transact-SQL 服务器游标的名称。cursor_name 必须符合标识符规则。有关标识符规则的详细信息,请参阅使用标识符作为对象名称

    LOCAL

    指定对于在其中创建的批处理、存储过程或触发器来说,该游标的作用域是局部的。该游标名称仅在这个作用域内有效。在批处理、存储过程、触发器或存储过程 OUTPUT 参数中,该游标可由局部游标变量引用。OUTPUT 参数用于将局部游标传递回调用批处理、存储过程或触发器,它们可在存储过程终止后给游标变量分配参数使其引用游标。除非 OUTPUT 参数将游标传递回来,否则游标将在批处理、存储过程或触发器终止时隐式释放。如果 OUTPUT 参数将游标传递回来,则游标在最后引用它的变量释放或离开作用域时释放。

    GLOBAL

    指定该游标的作用域对来说连接是全局的。在由连接执行的任何存储过程或批处理中,都可以引用该游标名称。该游标仅在断开连接时隐式释放。

    注意:
    如果 GLOBAL 和 LOCAL 参数都未指定,则默认值由 default to local cursor 数据库选项的设置控制。在 SQL Server 7.0 版中,该选项默认为 FALSE,以便与 SQL Server 的早期版本相匹配,在早期版本中,所有游标都是全局的。该选项的默认值在以后的 SQL Server 版本中可能会更改。有关详细信息,请参阅“设置数据库选项”。

    FORWARD_ONLY

    指定游标只能从第一行滚动到最后一行。FETCH NEXT 是唯一支持的提取选项。如果在指定 FORWARD_ONLY 时不指定 STATIC、KEYSET 和 DYNAMIC 关键字,则游标作为 DYNAMIC 游标进行操作。如果 FORWARD_ONLY 和 SCROLL 均未指定,则除非指定 STATIC、KEYSET 或 DYNAMIC 关键字,否则默认为 FORWARD_ONLY。STATIC、KEYSET 和 DYNAMIC 游标默认为 SCROLL。与 ODBC 和 ADO 这类数据库 API 不同,STATIC、KEYSET 和 DYNAMIC Transact-SQL 游标支持 FORWARD_ONLY。

    STATIC

    定义一个游标,以创建将由该游标使用的数据的临时复本。对游标的所有请求都从 tempdb 中的这一临时表中得到应答;因此,在对该游标进行提取操作时返回的数据中不反映对基表所做的修改,并且该游标不允许修改。

    KEYSET

    指定当游标打开时,游标中行的成员身份和顺序已经固定。对行进行唯一标识的键集内置在 tempdb 内一个称为 keyset 的表中。

    注意:
    如果查询引用了至少一个无唯一索引的表,则键集游标将转换为静态游标。

    对基表中的非键值所做的更改(由游标所有者更改或由其他用户提交)可以在用户滚动游标时看到。其他用户执行的插入是不可见的(不能通过 Transact-SQL 服务器游标执行插入)。如果删除行,则在尝试提取行时返回值为 -2 的 @@FETCH_STATUS。从游标以外更新键值类似于删除旧行然后再插入新行。具有新值的行是不可见的,并在尝试提取具有旧值的行时,将返回值为 -2 的 @@FETCH_STATUS。如果通过指定 WHERE CURRENT OF 子句利用游标来完成更新,则新值是可见的。

    DYNAMIC

    定义一个游标,以反映在滚动游标时对结果集内的各行所做的所有数据更改。行的数据值、顺序和成员身份在每次提取时都会更改。动态游标不支持 ABSOLUTE 提取选项。

    FAST_FORWARD

    指定启用了性能优化的 FORWARD_ONLY、READ_ONLY 游标。如果指定了 SCROLL 或 FOR_UPDATE,则不能也指定 FAST_FORWARD。

    注意:
    在 SQL Server 2000 中,FAST_FORWARD 和 FORWARD_ONLY 游标选项是互相排斥的。如果指定了二者,则会引发错误。在 SQL Server 2005 中,这两个关键字可以用在同一个 DECLARE CURSOR 语句中。

    READ_ONLY

    禁止通过该游标进行更新。在 UPDATE 或 DELETE 语句的 WHERE CURRENT OF 子句中不能引用游标。该选项优于要更新的游标的默认功能。

    SCROLL_LOCKS

    指定通过游标进行的定位更新或删除保证会成功。将行读取到游标中以确保它们对随后的修改可用时,Microsoft SQL Server 将锁定这些行。如果还指定了 FAST_FORWARD 或 STATIC,则不能指定 SCROLL_LOCKS。

    OPTIMISTIC

    指定如果行自从被读入游标以来已得到更新,则通过游标进行的定位更新或定位删除不会成功。当将行读入游标时 SQL Server 不会锁定行。相反,SQL Server 使用 timestamp 列值的比较,或者如果表没有 timestamp 列,则使用校验和值,以确定将行读入游标后是否已修改该行。如果已修改该行,则尝试进行的定位更新或删除将失败。如果还指定了 FAST_FORWARD,则不能指定 OPTIMISTIC。

    TYPE_WARNING

    指定如果游标从所请求的类型隐式转换为另一种类型,则向客户端发送警告消息。

    select_statement

    定义游标结果集的标准 SELECT 语句。在游标声明的 select_statement 内不允许使用关键字 COMPUTE、COMPUTE BY、FOR BROWSE 和 INTO。

    注意:
    您可以在游标声明中使用查询提示;但是,如果还使用 FOR UPDATE OF 子句,则请在 FOR UPDATE OF 之后指定 OPTION (query_hint)。

    如果 select_statement 中的子句与所请求的游标类型的功能有冲突,则 SQL Server 会将游标隐式转换为其他类型。有关详细信息,请参阅“隐式游标转换”。

    FOR UPDATE [OF column_name [,...n]]

    定义游标中可更新的列。如果提供了 OF column_name [,...n],则只允许修改列出的列。如果指定了 UPDATE,但未指定列的列表,则除非指定了 READ_ONLY 并发选项,否则可以更新所有的列。

    备注备注

    DECLARE CURSOR 定义 Transact-SQL 服务器游标的属性,例如游标的滚动行为和用于生成游标所操作的结果集的查询。OPEN 语句填充结果集,FETCH 从结果集返回行。CLOSE 语句释放与游标关联的当前结果集。DEALLOCATE 语句释放游标所使用的资源。

    DECLARE CURSOR 语句的第一种格式使用 SQL-92 语法声明游标行为。DECLARE CURSOR 的第二种格式使用 Transact-SQL 扩展插件,这些扩展插件允许您使用在 ODBC 或 ADO 的数据库 API 游标函数中所使用的相同游标类型来定义游标。

    不能混淆这两种格式。如果在 CURSOR 关键字的前面指定 SCROLL 或 INSENSITIVE 关键字,则不能在 CURSOR 和 FOR select_statement 关键字之间使用任何关键字。如果在 CURSOR 和 FOR select_statement 关键字之间指定任何关键字,则不能在 CURSOR 关键字的前面指定 SCROLL 或 INSENSITIVE。

    如果使用 Transact-SQL 语法的 DECLARE CURSOR 不指定 READ_ONLY、OPTIMISTIC 或 SCROLL_LOCKS,则默认值如下:

    • 如果 SELECT 语句不支持更新(由于权限不够、访问的远程表不支持更新等等),则游标为 READ_ONLY。
    • STATIC 和 FAST_FORWARD 游标默认为 READ_ONLY。
    • DYNAMIC 和 KEYSET 游标默认为 OPTIMISTIC。

    游标名称只能被其他 Transact-SQL 语句引用。它们不能被数据库 API 函数引用。例如,声明游标之后,不能通过 OLE DB、ODBC 或 ADO 函数或方法引用游标名称。不能使用提取函数或 API 的方法来提取游标行;只能通过 Transact-SQL FETCH 语句提取这些行。

    在声明游标后,可使用下列系统存储过程确定游标的特性。

    系统存储过程 说明

    sp_cursor_list

    返回当前在连接上可视的游标列表及其特性。

    sp_describe_cursor

    说明游标属性,例如是只前推的游标还是滚动游标。

    sp_describe_cursor_columns

    说明游标结果集中的列的属性。

    sp_describe_cursor_tables

    说明游标所访问的基表。

    在声明游标的 select_statement 中可以使用变量。游标变量值在声明游标后不发生更改。在 SQL Server 版本 6.5 以及早期版本中,每次重新打开游标时都会重新刷新变量值。

    示例示例

    A. 使用简单游标和语法

    在打开该游标时所生成的结果集包括表中的所有行和所有列。可以更新该游标,对该游标所做的所有更新和删除均在提取中表现出来。因为未指定 SCROLL 选项,所以 FETCH NEXT 是唯一可用的提取选项。

    DECLARE vend_cursor CURSOR
    FOR SELECT * FROM Purchasing.Vendor
    OPEN vend_cursor
    FETCH NEXT FROM vend_cursor

    B. 使用嵌套游标生成报表输出

    以下示例显示如何嵌套游标以生成复杂的报表。为每个供应商声明内部游标。

    SET NOCOUNT ON
    
    DECLARE @vendor_id int, @vendor_name nvarchar(50),
    @message varchar(80), @product nvarchar(50)
    
    PRINT '-------- Vendor Products Report --------'
    
    DECLARE vendor_cursor CURSOR FOR 
    SELECT VendorID, Name
    FROM Purchasing.Vendor
    WHERE PreferredVendorStatus = 1
    ORDER BY VendorID
    
    OPEN vendor_cursor
    
    FETCH NEXT FROM vendor_cursor 
    INTO @vendor_id, @vendor_name
    
    WHILE @@FETCH_STATUS = 0
    BEGIN
    PRINT ' '
    SELECT @message = '----- Products From Vendor: ' + 
    @vendor_name
    
    PRINT @message
    
    -- Declare an inner cursor based   
    -- on vendor_id from the outer cursor.
    
    DECLARE product_cursor CURSOR FOR 
    SELECT v.Name
    FROM Purchasing.ProductVendor pv, Production.Product v
    WHERE pv.ProductID = v.ProductID AND
    pv.VendorID = @vendor_id-- Variable value from the outer cursor
    
    OPEN product_cursor
    FETCH NEXT FROM product_cursor INTO @product
    
    IF @@FETCH_STATUS <> 0 
    PRINT '         <<None>>'     
    
    WHILE @@FETCH_STATUS = 0
    BEGIN
    
    SELECT @message = '         ' + @product
    PRINT @message
    FETCH NEXT FROM product_cursor INTO @product
    
    END
    
    CLOSE product_cursor
    DEALLOCATE product_cursor
    
    -- Get the next vendor.
    FETCH NEXT FROM vendor_cursor 
    INTO @vendor_id, @vendor_name
    END 
    CLOSE vendor_cursor
    DEALLOCATE vendor_cursor
  • Performance Tuning SQL Server Cursors

    2007-05-28 19:41:52

    Performance Tuning SQL Server Cursors




    If possible, avoid using SQL Server cursors. They generally use a lot of SQL Server resources and reduce the performance and scalability of your applications. If you need to perform row-by-row operations, try to find another method to perform the task.

    Here are some alternatives to using a cursor:

    • Use WHILE LOOPS
    • Use temp tables
    • Use derived tables
    • Use correlated sub-queries
    • Use the CASE statement
    • Perform multiple queries

    More often than not, there are non-cursor techniques that can be used to perform the same tasks as a SQL Server cursor. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    If you do find you must use a cursor, try to reduce the number of records to process.

    One way to do this is to move the records that need to be processed into a temp table first, then create the cursor to use the records in the temp table, not from the original table. This of course assumes that the subset of records to be inserted into the temp table are substantially less than those in the original table.

    The lower the number of records to process, the faster the cursor will finish. [6.5, 7.0, 2000, 2005] Updated 6-6-2005

    *****

    If the number of rows you need to return from a query is small, and you need to perform row-by-row operations on them, don't use a server-side cursor. Instead, consider returning the entire rowset to the client and have the client perform the necessary action on each row, then return any updated rows to the server. [6.5, 7.0, 2000, 2005] Updated 6-6-2005

    *****

    If you have no choice but to use a server-side cursor in your application, try to use a FORWARD-ONLY or FAST-FORWARD, READ-ONLY cursor. When working with unidirectional, read-only data, use the FAST_FORWARD option instead of the FORWARD_ONLY option, as it has some internal performance optimizations to speed performance. This type of cursor produces the least amount of overhead on SQL Server.

    If you are unable to use a fast-forward cursor, then try the following cursors, in this order, until you find one that meets your needs. They are listed in the order of their performance characteristics, from fastest to slowest: dynamic, static, and keyset. [6.5, 7.0, 2000, 2005] Updated 6-6-2005

    *****

    Avoid using static/insensitive and keyset cursors, unless you have no other choice. This is because they cause a temporary table to be created in TEMPDB, which increases overhead and can cause resource contention issues. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    If you have no choice but to use cursors in your application, try to locate the SQL Server tempdb database on its own physical device for best performance. This is because cursors use the tempdb for temporary storage of cursor data. The faster your disk array, the faster your cursor will be. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    Using cursors can reduce concurrency and lead to unnecessary locking and blocking. To help avoid this, use the READ_ONLY cursor option if applicable, or if you need to perform updates, try to use the OPTIMISTIC cursor option to reduce locking. Try to avoid the SCROLL_LOCKS cursor option, which reduces concurrency. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    When you are done using a cursor, don't just CLOSE it, you must also DEALLOCATE it. Deallocation is required to free up the SQL Server resources used by the cursor. If you only CLOSE the cursor, locks are freed, but SQL Server resources are not. If you don't DEALLOCATE your cursors, the resources used by the cursor will stay allocated, degrading the performance of your server until they are released. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    If it is appropriate for your application, try to load the cursor as soon as possible by moving to the last row of the result set. This releases the share locks created when the cursor was built, freeing up SQL Server resources. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    If you have to use a cursor because your application needs to manually scroll through records and update them, try to avoid client-side cursors, unless the number of rows is small or the data is static. If the number of rows is large, or the data is not static, consider using a server-side keyset cursor instead of a client-side cursor. Performance is usually boosted because of a reduction in network traffic between the client and the server. For optimum performance, you may have to try both types of cursors under realistic loads to determine which is best for your particular environment. [6.5, 7.0, 2000] Updated 6-27-2006

    *****

    When using a server-side cursor, always try to fetch as small a result set as possible. This includes fetching only those rows and columns the client needs immediately. The smaller the cursor, no matter what type of server-side cursor it is, the fewer resources it will use, and performance will benefit. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    If you need to perform a JOIN as part of your cursor, keyset and static cursors are generally faster than dynamic cursors, and should be used when possible. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    If a transaction you have created contains a cursor (try to avoid this if at all possible), ensure that the number of rows being modified by the cursor is small. This is because the modified rows may be locked until the transaction completes or aborts. The greater the number of rows being modified, the greater the locks, and the higher the likelihood of lock contention on the server, hurting performance. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    In earlier versions of SQL Server, Transact-SQL cursors were only global to the connection. But in SQL Server 7 and 2000, there are two options to define the scope of a cursor. LOCAL and GLOBAL keywords in the DECLARE CURSOR statement are used to specify the scope of a cursor. A GLOBAL cursor can be referenced in any stored procedure or batch executed by a connection. LOCAL cursors are more secure as they cannot be referenced outside the procedure or trigger unless they are passed back to the calling procedure or trigger, or by using an output parameter. GLOBAL cursors must be explicitly deallocated or they will be available until the connection is closed. For optimum performance, you should always explicitly deallocate a cursor when you are done using it. LOCAL cursors are implicitly deallocated when the stored procedure, the trigger, or the batch in which they were created terminates. We can use LOCAL cursors for more security and better scope of the cursor in our application, which also helps to reduce resources on the server, and boosting performance. [7.0, 2000] Contributed by Nataraj Prakash.

    *****

    Consider using asynchronous cursors if you expect your result set to be very large. This allows you to continue processing while the cursor is still being populated. While it may not actually speed up your application, it should give the appearance to your end users that something is happening sooner that if they have to wait until the entire cursor is populated. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    If you have to use a cursor, break out of the cursor loop as soon as you can. If you find that a problem has occurred, or processing has ended before the full cursor has been processed, then exit immediately. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    If you are using the same cursor more than once in a batch of work, (or within more than one stored procedure), then define the cursor as a global cursor by using the GLOBAL keyword. By not closing or deallocating the cursor until the whole process is finished, a fair amount of time will be saved, as the cursor and the data contained will already be defined, ready for you to use. [6.5, 7.0, 2000] Updated 9-4-2006

    *****

    Sometimes, it is handy to be able to perform some calculation on one or more columns of a record, and then take the result of that calculation and then add it to similar calculations performed on other related records to find a grand total.

    For example, let's say you want to find the total dollar cost of an invoice. An invoice will generally involve a header record and one or more detail records. Each detail record will represent a line item on the invoice. In order to calculate the total dollar cost of an invoice, based on two or more line items, you would need to multiply the quantity of each item sold times the price of each item. Then, you would need to add the total price of each line item together in order to get the total dollar cost of the entire invoice. To keep this example simple, let's ignore things like discounts, taxes, shipping, etc.

    One way to accomplish this task would be to use a cursor like the one we see below (we are using the Northwind database for this example code):

    DECLARE @LineTotal money      --Declare variables
    DECLARE @InvoiceTotal money
    SET @LineTotal = 0      --Set variables to 0
    SET @InvoiceTotal = 0

    DECLARE Line_Item_Cursor CURSOR FOR      --Declare the cursor

    SELECT UnitPrice*Quantity      --Multiply unit price times quantity ordered
    FROM [order details]
    WHERE ōrderid = 10248      --We are only concerned with invoice 10248

    OPEN Line_Item_Cursor      --Open the cursor
    FETCH NEXT FROM Line_Item_Cursor INTO @LineTotal      --Fetch next record
    WHILE @@FETCH_STATUS = 0

    BEGIN
    SET @InvoiceTotal = @InvoiceTotal + @LineTotal      --Summarize line items
    FETCH NEXT FROM Line_Item_Cursor INTO @LineTotal
    END

    CLOSE Line_Item_Cursor      --Close cursor
    DEALLOCATE Line_Item_Cursor      --Deallocate cursor
    SELECT @InvoiceTotal InvoiceTotal      --Display total value of invoice

    The result for invoice number 10248 is $440.00.

    What the cursor does is to select all of the line items for invoice number 10248, then multiply the quantity ordered times the price to get a line item total, and then it takes each of the line item totals for each record and then adds them all up in order to calculate the total dollar amount for the invoice.

    This all works well, but the code is long and hard to read, and performance is not great because a cursor is used. Ideally, for best performance, we need to find another way to accomplish the same goal as above, but without using a cursor.

    Instead of using a cursor, let's rewrite the above code using set-based Transact-SQL instead of a cursor. Here's what the code looks like:

    DECLARE @InvoiceTotal money
    SELECT @InvoiceTotal = sum(UnitPrice*Quantity)
    FROM [order details]
    WHERE ōrderid = 10248
    SELECT @InvoiceTotal InvoiceTotal

    The result for invoice number 10248 is $440.00.

    Right away, it is obvious that this is a lot less code and that is it more readable. What may not be obvious is that it uses less server resources and performs faster. In our example — with few rows — the time difference is very small, but if many rows are involved, the time difference between the techniques can be substantial.

    The secret here is to use the Transact-SQL "sum" function to summarize the line item totals for you, instead of relying on a cursor. You can use this same technique to help reduce your dependency on using resource-hogging cursors in much of your Transact-SQL code. [6.5, 7.0, 2000] Updated 9-4-2006

  • Cursors

    2007-05-28 19:35:40

    http://www.sqlteam.com/item.asp?ItemID=553

    Cursors: An Overview

    graz on 8/30/2000 in App Design
    We'll talk about the basics of cursors. These let you move through records one at a time and perform processing on each record.

    SQL Server is very good at handling sets of data.? For example, you can use a single SELECT statement to update many rows of data.? There are times when you want to loop through a series of records a perform processing for each record.? In this case you can use a cursor.? The basic syntax of a cursor is:

    DECLARE @AuthorID char(11)

    DECLARE c1 CURSOR FOR
    SELECT au_id
    FROM authors

    OPEN c1


    FETCH NEXT FROM c1
    INTO @AuthorID


    WHILE @@FETCH_STATUS = 0
    BEGIN

    PRINT @AuthorID

    FETCH NEXT FROM c1
    INTO @AuthorID
    END

    CLOSE c1
    DEALLOCATE c1

    The DECLARE CURSOR statement defines the SELECT statement that forms the basis of the cursor.? You can do just about anything here that you can do in a SELECT statement.? The OPEN statement statement executes the SELECT statement and populates the result set.? The FETCH statement returns a row from the result set into the variable.? You can select multiple columns and return them into multiple variables.? The variable @@FETCH_STATUS is used to determine if there are any more rows.? It will contain 0 as long as there are more rows.? We use a WHILE loop to move through each row of the result set.

    In this example, I just print the contents of the variable.? You can execute any type of statement you wish here.? In a recent scrīpt I wrote I used a cursor to move through the rows in a table and call a stored procedure for each record passing it the primary key.? Given that cursors are not very fast and calling a stored procedure for each record in a table is also very slow, my scrīpt was a resource hog.? However, the stored procedure I was calling was written by the software vendor and was a very easy solution to my problem.? In this case, I might have something like this:

    EXEC spUpdateAuthor (@AuthorID)

    instead of my Print statement. The CLOSE statement releases the record set and the DEALLOCATE statementreleases the resources associated with a cursor.

    If you are going to update the records as you go through them, you can use the UPDATE clause when you declare a cursor.

    DECLARE c1 CURSOR FOR
    SELECT au_id, au_lname
    FROM authors
    FOR UPDATE OF au_lname


    You can code your UPDATE statement to update the current record in the
    cursor like this

    UPDATE authors
    SET au_lname = UPPER(Smith)
    WHERE CURRENT OF c1


    If you have a cursor that will be read only you can speed it up by using the READ_ONLY clause:?

    DECLARE c1 CURSOR READ_ONLY FOR
    SELECT au_id
    FROM authors


    That covers the basics of cursors.? You can check Books Online for more detailed information.
221/212>

数据统计

  • 访问量: 13709
  • 日志数: 23
  • 建立时间: 2007-05-12
  • 更新时间: 2007-06-18

RSS订阅

Open Toolbar