发布新日志

  • mysql处理高并发,防止库存超卖-转

    2017-09-13 20:44:09

    今天王总又给我们上了一课,其实mysql处理高并发,防止库存超卖的问题,在去年的时候,王总已经提过;但是很可惜,即使当时大家都听懂了,但是在现实开发中,还是没这方面的意识。今天就我的一些理解,整理一下这个问题,并希望以后这样的课程能多点。

    先来就库存超卖的问题作描述:一般电子商务网站都会遇到如团购、秒杀、特价之类的活动,而这样的活动有一个共同的特点就是访问量激增、上千甚至上万人抢购一个商品。然而,作为活动商品,库存肯定是很有限的,如何控制库存不让出现超买,以防止造成不必要的损失是众多电子商务网站程序员头疼的问题,这同时也是最基本的问题。

    从技术方面剖析,很多人肯定会想到事务,但是事务是控制库存超卖的必要条件,但不是充分必要条件。

    举例:

    总库存:4个商品

    请求人:a、1个商品 b、2个商品 c、3个商品

    程序如下:

    beginTranse(开启事务)

    try{

        $result = $dbca->query('select amount from s_store where postID = 12345');

        if(result->amount > 0){

            //quantity为请求减掉的库存数量

            $dbca->query('update s_store set amount = amount - quantity where postID = 12345');

        }

    }catch($e Exception){

        rollBack(回滚)

    }

    commit(提交事务)

    以上代码就是我们平时控制库存写的代码了,大多数人都会这么写,看似问题不大,其实隐藏着巨大的漏洞。数据库的访问其实就是对磁盘文件的访问,数据库中的表其实就是保存在磁盘上的一个个文件,甚至一个文件包含了多张表。例如由于高并发,当前有三个用户a、b、c三个用户进入到了这个事务中,这个时候会产生一个共享锁,所以在select的时候,这三个用户查到的库存数量都是4个,同时还要注意,mysql innodb查到的结果是有版本控制的,再其他用户更新没有commit之前(也就是没有产生新版本之前),当前用户查到的结果依然是就版本;

    然后是update,假如这三个用户同时到达update这里,这个时候update更新语句会把并发串行化,也就是给同时到达这里的是三个用户排个序,一个一个执行,并生成排他锁,在当前这个update语句commit之前,其他用户等待执行,commit后,生成新的版本;这样执行完后,库存肯定为负数了。但是根据以上描述,我们修改一下代码就不会出现超买现象了,代码如下:

    beginTranse(开启事务)

    try{

        //quantity为请求减掉的库存数量
        $dbca->query('update s_store set amount = amount - quantity where postID = 12345');

        $result = $dbca->query('select amount from s_store where postID = 12345');

        if(result->amount < 0){

           throw new Exception('库存不足');

        }

    }catch($e Exception){

        rollBack(回滚)

    }

    commit(提交事务)


    另外,更简洁的方法:

    beginTranse(开启事务)

    try{

        //quantity为请求减掉的库存数量
        $dbca->query('update s_store set amount = amount - quantity where amount>=quantity and postID = 12345');

    }catch($e Exception){

        rollBack(回滚)

    }

    commit(提交事务)


    =====================================================================================

    1、在秒杀的情况下,肯定不能如此高频率的去读写数据库,会严重造成性能问题的
    必须使用缓存,将需要秒杀的商品放入缓存中,并使用锁来处理其并发情况。当接到用户秒杀提交订单的情况下,先将商品数量递减(加锁/解锁)后再进行其他方面的处理,处理失败在将数据递增1(加锁/解锁),否则表示交易成功。
    当商品数量递减到0时,表示商品秒杀完毕,拒绝其他用户的请求。


    2、这个肯定不能直接操作数据库的,会挂的。直接读库写库对数据库压力太大,要用缓存。
    把你要卖出的商品比如10个商品放到缓存中;然后在memcache里设置一个计数器来记录请求数,这个请求书你可以以你要秒杀卖出的商品数为基数,比如你想卖出10个商品,只允许100个请求进来。那当计数器达到100的时候,后面进来的就显示秒杀结束,这样可以减轻你的服务器的压力。然后根据这100个请求,先付款的先得后付款的提示商品以秒杀完。


    3、首先,多用户并发修改同一条记录时,肯定是后提交的用户将覆盖掉前者提交的结果了。

    这个直接可以使用加锁机制去解决,乐观锁或者悲观锁。
    乐观锁,就是在数据库设计一个版本号的字段,每次修改都使其+1,这样在提交时比对提交前的版本号就知道是不是并发提交了,但是有个缺点就是只能是应用中控制,如果有跨应用修改同一条数据乐观锁就没办法了,这个时候可以考虑悲观锁。
    悲观锁,就是直接在数据库层面将数据锁死,类似于oralce中使用select xxxxx from xxxx where xx=xx for update,这样其他线程将无法提交数据。
    除了加锁的方式也可以使用接收锁定的方式,思路是在数据库中设计一个状态标识位,用户在对数据进行修改前,将状态标识位标识为正在编辑的状态,这样其他用户要编辑此条记录时系统将发现有其他用户正在编辑,则拒绝其编辑的请求,类似于你在操作系统中某文件正在执行,然后你要修改该文件时,系统会提醒你该文件不可编辑或删除。


    4、不建议在数据库层面加锁,建议通过服务端的内存锁(锁主键)。当某个用户要修改某个id的数据时,把要修改的id存入memcache,若其他用户触发修改此id的数据时,读到memcache有这个id的值时,就阻止那个用户修改。


    5、实际应用中,并不是让mysql去直面大并发读写,会借助“外力”,比如缓存、利用主从库实现读写分离、分表、使用队列写入等方法来降低并发读写。

  • 数据库并发控制的锁机制

    2017-09-13 09:46:15

    1 前言

    数据库大并发操作要考虑死锁和锁的性能问题。看到网上大多语焉不详(尤其更新锁),所以这里做个简明解释,为下面描述方便,这里用T1代表一个数据库执行请求,T2代表另一个请求,也可以理解为T1为一个线程,T2 为另一个线程。T3,T4以此类推。下面以SQL Server(2005)为例。

    2 锁的种类

    1. 共享锁(Shared lock)。
      例1:
      ----------------------------------------
      T1:    select * from table (请想象它需要执行1个小时之久,后面的sql语句请都这么想象)
      T2:    update table set column1='hello'
      
      过程:
      
      T1运行 (加共享锁)
      T2运行
      If T1 还没执行完
          T2等......
      else
          锁被释放
          T2执行
      endif
      
      T2之所以要等,是因为T2在执行update前,试图对table表加一个排他锁,
      而数据库规定同一资源上不能同时共存共享锁和排他锁。所以T2必须等T1
      执行完,释放了共享锁,才能加上排他锁,然后才能开始执行update语句。
      
      例2:
      ----------------------------------------
      T1:    select * from table
      T2:    select * from table
      
      这里T2不用等待T1执行完,而是可以马上执行。
      
      分析:
      T1运行,则table被加锁,比如叫lockA
      T2运行,再对table加一个共享锁,比如叫lockB。
      
      两个锁是可以同时存在于同一资源上的(比如同一个表上)。这被称为共
      享锁与共享锁兼容。这意味着共享锁不阻止其它session同时读资源,但阻
      止其它session update
      
      例3:
      ----------------------------------------
      T1:    select * from table
      T2:    select * from table
      T3:    update table set column1='hello'
      
      这次,T2不用等T1运行完就能运行,T3却要等T1和T2都运行完才能运行。
      因为T3必须等T1和T2的共享锁全部释放才能进行加排他锁然后执行update
      操作。
      
      例4:(死锁的发生)
      ----------------------------------------
      T1:
      begin tran
      select * from table (holdlock) (holdlock意思是加共享锁,直到事物结束才释放)
      update table set column1='hello'
      
      T2:
      begin tran
      select * from table(holdlock)
      update table set column1='world'
      
      假设T1和T2同时达到select,T1对table加共享锁,T2也对加共享锁,当
      T1的select执行完,准备执行update时,根据锁机制,T1的共享锁需要升
      级到排他锁才能执行接下来的update.在升级排他锁前,必须等table上的
      其它共享锁释放,但因为holdlock这样的共享锁只有等事务结束后才释放,
      所以因为T2的共享锁不释放而导致T1等(等T2释放共享锁,自己好升级成排
      他锁),同理,也因为T1的共享锁不释放而导致T2等。死锁产生了。
      
      例5:
      ----------------------------------------
      T1:
      begin tran
      update table set column1='hello' where id=10
      
      T2:
      begin tran
      update table set column1='world' where id=20
      
      这种语句虽然最为常见,很多人觉得它有机会产生死锁,但实际上要看情
      况,如果id是主键上面有索引,那么T1会一下子找到该条记录(id=10的记
      录),然后对该条记录加排他锁,T2,同样,一下子通过索引定位到记录,
      然后对id=20的记录加排他锁,这样T1和T2各更新各的,互不影响。T2也不
      需要等。
      
      但如果id是普通的一列,没有索引。那么当T1对id=10这一行加排他锁后,
      T2为了找到id=20,需要对全表扫描,那么就会预先对表加上共享锁或更新
      锁或排他锁(依赖于数据库执行策略和方式,比如第一次执行和第二次执行
      数据库执行策略就会不同)。但因为T1已经为一条记录加了排他锁,导致
      T2的全表扫描进行不下去,就导致T2等待。
      
      死锁怎么解决呢?一种办法是,如下:
      例6:
      ----------------------------------------
      T1:
      begin tran
      select * from table(xlock) (xlock意思是直接对表加排他锁)
      update table set column1='hello'
      
      T2:
      begin tran
      select * from table(xlock)
      update table set column1='world'
      
      这样,当T1的select 执行时,直接对表加上了排他锁,T2在执行select时,就需要等T1事物完全执行完才能执行。排除了死锁发生。
      但当第三个user过来想执行一个查询语句时,也因为排他锁的存在而不得不等待,第四个、第五个user也会因此而等待。在大并发
      情况下,让大家等待显得性能就太友好了,所以,这里引入了更新锁。
      
    2. 更新锁(Update lock)
      为解决死锁,引入更新锁。
      
      例7:
      ----------------------------------------
      T1:
      begin tran
      select * from table(updlock) (加更新锁)
      update table set column1='hello'
      T2:
      begin tran
      select * from table(updlock)
      update table set column1='world'
      
      更新锁的意思是:“我现在只想读,你们别人也可以读,但我将来可能会做更新操作,我已经获取了从共享锁(用来读)到排他锁
      (用来更新)的资格”。一个事物只能有一个更新锁获此资格。
      
      T1执行select,加更新锁。
      T2运行,准备加更新锁,但发现已经有一个更新锁在那儿了,只好等。
      
      当后来有user3、user4...需要查询table表中的数据时,并不会因为T1的select在执行就被阻塞,照样能查询,相比起例6,这提高
      了效率。
      
      例8:
      ----------------------------------------
      T1:    select * from table(updlock)    (加更新锁)
      T2:    select * from table(updlock)    (等待,直到T1释放更新锁,因为同一时间不能在同一资源上有两个更新锁)
      T3:    select * from table (加共享锁,但不用等updlock释放,就可以读)
      
      这个例子是说明:共享锁和更新锁可以同时在同一个资源上。这被称为共享锁和更新锁是兼容的。
      
      例9:
      ----------------------------------------
      T1:
      begin
      select * from table(updlock)      (加更新锁)
      update table set column1='hello'  (重点:这里T1做update时,不需要等T2释放什么,而是直接把更新锁升级为排他锁,然后执行update)
      T2:
      begin
      select * from table               (T1加的更新锁不影响T2读取)
      update table set column1='world'  (T2的update需要等T1的update做完才能执行)
      
      我们以这个例子来加深更新锁的理解,
      
      第一种情况:T1先达,T2紧接到达;在这种情况中,T1先对表加更新锁,T2对表加共享锁,假设T2的select先执行完,准备执行update,
      发现已有更新锁存在,T2等。T1执行这时才执行完select,准备执行update,更新锁升级为排他锁,然后执行update,执行完成,事务
      结束,释放锁,T2才轮到执行update。
      
      第二种情况:T2先达,T1紧接达;在这种情况,T2先对表加共享锁,T1达后,T1对表加更新锁,假设T2 select先结束,准备
      update,发现已有更新锁,则等待,后面步骤就跟第一种情况一样了。
      
      这个例子是说明:排他锁与更新锁是不兼容的,它们不能同时加在同一子资源上。
      
      
    3. 排他锁(独占锁,Exclusive Locks)
      这个简单,即其它事务既不能读,又不能改排他锁锁定的资源。
      例10
      T1:    update table set column1='hello' where id<1000
      T2:    update table set column1='world' where id>1000
      
      假设T1先达,T2随后至,这个过程中T1会对id<1000的记录施加排他锁.但不会阻塞T2的update。
      
      例11 (假设id都是自增长且连续的)
      T1:    update table set column1='hello' where id<1000
      T2:    update table set column1='world' where id>900
      
      如同例10,T1先达,T2立刻也到,T1加的排他锁会阻塞T2的update.
      
    4. 意向锁(Intent Locks)
      意向锁就是说在屋(比如代表一个表)门口设置一个标识,说明屋子里有人(比如代表某些记录)被锁住了。另一个人想知道屋子
      里是否有人被锁,不用进屋子里一个一个的去查,直接看门口标识就行了。
      
      当一个表中的某一行被加上排他锁后,该表就不能再被加表锁。数据库程序如何知道该表不能被加表锁?一种方式是逐条的判断该
      表的每一条记录是否已经有排他锁,另一种方式是直接在表这一层级检查表本身是否有意向锁,不需要逐条判断。显然后者效率高。
      
      例12:
      ----------------------------------------
      T1:    begin tran
             select * from table (xlock) where id=10  --意思是对id=10这一行强加排他锁
      T2:    begin tran
             select * from table (tablock)     --意思是要加表级锁
             
      假设T1先执行,T2后执行,T2执行时,欲加表锁,为判断是否可以加表锁,数据库系统要逐条判断table表每行记录是否已有排他锁,
      如果发现其中一行已经有排他锁了,就不允许再加表锁了。只是这样逐条判断效率太低了。
      
      实际上,数据库系统不是这样工作的。当T1的select执行时,系统对表table的id=10的这一行加了排他锁,还同时悄悄的对整个表
      加了意向排他锁(IX),当T2执行表锁时,只需要看到这个表已经有意向排他锁存在,就直接等待,而不需要逐条检查资源了。
      
      例13:
      ----------------------------------------
      T1:    begin tran
             update table set column1='hello' where id=1
      T2:    begin tran
             update table set column1='world' where id=1
      
      这个例子和上面的例子实际效果相同,T1执行,系统对table同时对行家排他锁、对页加意向排他锁、对表加意向排他锁。
      
    5. 计划锁(Schema Locks)
      例14:
      ----------------------------------------
      alter table .... (加schema locks,称之为Schema modification (Sch-M) locks
      
      DDL语句都会加Sch-M锁
      该锁不允许任何其它session连接该表。连都连不了这个表了,当然更不用说想对该表执行什么sql语句了。
      
      例15:
      ----------------------------------------
      用jdbc向数据库发送了一条新的sql语句,数据库要先对之进行编译,在编译期间,也会加锁,称之为:Schema stability (Sch-S) locks
      
      select * from tableA
      
      编译这条语句过程中,其它session可以对表tableA做任何操作(update,delete,加排他锁等等),但不能做DDL(比如alter table)操作。
      
    6. Bulk Update Locks 主要在批量导数据时用(比如用类似于oracle中的imp/exp的bcp命令)。不难理解,程序员往往也不需要关心,不赘述了。

    3 何时加锁?

    如何加锁,何时加锁,加什么锁,你可以通过hint手工强行指定,但大多是数据库系统自动决定的。这就是为什么我们可以不懂锁也可
    以高高兴兴的写SQL。
    
    例15:
    ----------------------------------------
    T1:    begin tran
           update table set column1='hello' where id=1
    T2:    SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED  -- 事物隔离级别为允许脏读
           go
           select * from table where id=1
    这里,T2的select可以查出结果。如果事物隔离级别不设为脏读,则T2会等T1事物执行完才能读出结果。
    
    数据库如何自动加锁的?
    
    1) T1执行,数据库自动加排他锁
    2) T2执行,数据库发现事物隔离级别允许脏读,便不加共享锁。不加共享锁,则不会与已有的排他锁冲突,所以可以脏读。
    
    例16:
    ----------------------------------------
    T1:    begin tran
           update table set column1='hello' where id=1
    T2:    select * from table where id=1 --为指定隔离级别,则使用系统默认隔离级别,它不允许脏读
    
    如果事物级别不设为脏读,则:
    1) T1执行,数据库自动加排他锁
    2) T2执行,数据库发现事物隔离级别不允许脏读,便准备为此次select过程加共享锁,但发现加不上,因为已经有排他锁了,所以就
       等啊等。直到T1执行完,释放了排他锁,T2才加上了共享锁,然后开始读....
    

    4 锁的粒度

    锁的粒度就是指锁的生效范围,就是说是行锁,还是页锁,还是整表锁. 锁的粒度同样既可以由数据库自动管理,也可以通过手工指定hint来管理。

    例17:
    ----------------------------------------
    T1:    select * from table (paglock)
    T2:    update table set column1='hello' where id>10
    
    T1执行时,会先对第一页加锁,读完第一页后,释放锁,再对第二页加锁,依此类推。假设前10行记录恰好是一页(当然,一般不可能
    一页只有10行记录),那么T1执行到第一页查询时,并不会阻塞T2的更新。
    
    例18:
    ----------------------------------------
    T1:    select * from table (rowlock)
    T2:    update table set column1='hello' where id=10
    
    T1执行时,对每行加共享锁,读取,然后释放,再对下一行加锁;T2执行时,会对id=10的那一行试图加锁,只要该行没有被T1加上行锁,
    T2就可以顺利执行update操作。
    
    例19:
    ----------------------------------------
    T1:    select * from table (tablock)
    T2:    update table set column1='hello' where id = 10
    
    T1执行,对整个表加共享锁. T1必须完全查询完,T2才可以允许加锁,并开始更新。
    
    以上3例是手工指定锁的粒度,也可以通过设定事物隔离级别,让数据库自动设置锁的粒度。不同的事物隔离级别,数据库会有不同的
    加锁策略(比如加什么类型的锁,加什么粒度的锁)。具体请查联机手册。
    

    5 锁与事物隔离级别的优先级

    手工指定的锁优先,
    例20:
    ----------------------------------------
    T1:    GO
           SET TRANSACTION ISOLATION LEVEL SERIALIZABLE
           GO
           BEGIN TRANSACTION
           SELECT * FROM table (NOLOCK)
           GO
    T2:    update table set column1='hello' where id=10
    
    T1是事物隔离级别为最高级,串行锁,数据库系统本应对后面的select语句自动加表级锁,但因为手工指定了NOLOCK,所以该select
    语句不会加任何锁,所以T2也就不会有任何阻塞。
    

    6 数据库的其它重要Hint以及它们的区别

    1) holdlock 对表加共享锁,且事物不完成,共享锁不释放。
    2) tablock  对表加共享锁,只要statement不完成,共享锁不释放。
       与holdlock区别,见下例:
       例21
       ----------------------------------------
       T1:
       begin tran
       select * from table (tablock)
       T2:
       begin tran
       update table set column1='hello' where id = 10
    
       T1执行完select,就会释放共享锁,然后T2就可以执行update. 此之谓tablock. 下面我们看holdlock
       例22
       ----------------------------------------
       T1:
       begin tran
       select * from table (holdlock)
       T2:
       begin tran
       update table set column1='hello' where id = 10
       
       T1执行完select,共享锁仍然不会释放,仍然会被hold(持有),T2也因此必须等待而不能update. 当T1最后执行了commit或
       rollback说明这一个事物结束了,T2才取得执行权。
      
    3) TABLOCKX 对表加排他锁
      
       例23:
       ----------------------------------------
       T1:    select * from table(tablockx) (强行加排他锁)
       其它session就无法对这个表进行读和更新了,除非T1执行完了,就会自动释放排他锁。
       例24:
       ----------------------------------------
       T1:    begin tran
              select * from table(tablockx)
       这次,单单select执行完还不行,必须整个事物完成(执行了commit或rollback后)才会释放排他锁。
      
    4) xlock 加排他锁
       那它跟tablockx有何区别呢?
    
       它可以这样用,
       例25:
       ----------------------------------------
       select * from table(xlock paglock) 对page加排他锁
       而TABLELOCX不能这么用。
    
       xlock还可这么用:select * from table(xlock tablock) 效果等同于select * from table(tablockx)
    

    7 锁的超时等待

    例26

    SET LOCK_TIMEOUT 4000 用来设置锁等待时间,单位是毫秒,4000意味着等待
    4秒可以用select @@LOCK_TIMEOUT查看当前session的锁超时设置。-1 意味着
    永远等待。
    
    T1: begin tran
        udpate table set column1='hello' where id = 10
    T2: set lock_timeout 4000
        select * from table wehre id = 10
    

    T2执行时,会等待T1释放排他锁,等了4秒钟,如果T1还没有释放排他锁,T2就会抛出异常: Lock request time out period exceeded.

    8 附:各种锁的兼容关系表

    | Requested mode                     | IS  | S   | U   | IX  | SIX | X  |
    | Intent shared (IS)                 | Yes | Yes | Yes | Yes | Yes | No |
    | Shared (S)                         | Yes | Yes | Yes | No  | No  | No |
    | Update (U)                         | Yes | Yes | No  | No  | No  | No |
    | Intent exclusive (IX)              | Yes | No  | No  | Yes | No  | No |
    | Shared with intent exclusive (SIX) | Yes | No  | No  | No  | No  | No |
    | Exclusive (X)                      | No  | No  | No  | No  | No  | No |
    

    9 如何提高并发效率

    1. 悲观锁:利用数据库本身的锁机制实现。通过上面对数据库锁的了解,可以根据具体业务情况综合使用事务隔离级别与合理的手工指定锁的方式比如降低锁的粒度等减少并发等待。
    2. 乐观锁:利用程序处理并发。原理都比较好理解,基本一看即懂。方式大概有以下3种
      1. 对记录加版本号.
      2. 对记录加时间戳.
      3. 对将要更新的数据进行提前读取、事后对比。

    不论是数据库系统本身的锁机制,还是乐观锁这种业务数据级别上的锁机制,本质上都是对状态位的读、写、判断。

  • 数据库提高查询效率的一种实现

    2017-07-25 09:33:17

    树形结构存储方案-左右值编码可以提高数据库查询的效率
    原理:
    基于Tree(树)的前序遍历设计的无递归查询、无限分组的左右值编码,保存树的数值。
    举例:
    每个结点都有一个左值(Lft)和右值(Rgt),那么左右值是如何计算出来的呢?
    通过这个图可以知道每个结点,lft和rgt是如何计算出来的。那么这样做为什么可以提高搜索效率呢?我们先看看如何搜索。
    例如:获取Fruit节点下面的所有子孙节点,之需要如下sql即可,是否效率快能多?
    SELECT * FROM Tree WHERE Lft > 2 AND Lft < 11 ORDER BY Lft ASC


  • 浅析Oracle语句优化规则

    2011-09-20 15:33:19

    1. 选用适合的ORACLE优化器
       ORACLE的优化器共有3种:
       a. RULE (基于规则)  
       b. COST (基于成本)
       c. CHOOSE (选择性)
       设置缺省的优化器,可以通过对init.ora文件中OPTIMIZER_MODE参数的各种声明,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS . 你当然也在SQL句级或是会话(session)级对其进行覆盖。
       为了使用基于成本的优化器(CBO, Cost-Based Optimizer) , 你必须经常运行analyze 命令,以增加数据库中的对象统计信息(object statistics)的准确性。
       如果数据库的优化器模式设置为选择性(CHOOSE),那么实际的优化器模式将和是否运行过analyze命令有关。 如果table已经被analyze过, 优化器模式将自动成为CBO , 反之,数据库将采用RULE形式的优化器。
       在缺省情况下,ORACLE采用CHOOSE优化器,为了避免那些不必要的全表扫描(full table scan) , 你必须尽量避免使用CHOOSE优化器,而直接采用基于规则或者基于成本的优化器。
    2. 访问Table的方式ORACLE 采用两种访问表中记录的方式:
       a.全表扫描
       全表扫描就是顺序地访问表中每条记录。 ORACLE采用一次读入多个数据块(database block)的方式优化全表扫描。
       b.通过ROWID访问表
       你可以采用基于ROWID的访问方式情况,提高访问表的效率, ROWID包含了表中记录的物理位置信息……ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系。 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高。
    3. 共享SQL语句
       为了不重复解析相同的SQL语句,在第一次解析之后, ORACLE将SQL语句存放在内存中。这块位于系统全局区域SGA(system global area)的共享池(shared buffer pool)中的内存可以被所有的数据库用户共享。 因此,当你执行一个SQL语句(有时被称为一个游标)时,如果它和之前的执行过的语句完全相同, ORACLE就能很快获得已经被解析的语句以及最好的执行路径。 ORACLE的这个功能大大地提高了SQL的执行性能并节省了内存的使用。
       可惜的是ORACLE只对简单的表提供高速缓冲(cache buffering) ,这个功能并不适用于多表连接查询。
       数据库管理员必须在init.ora中为这个区域设置合适的参数,当这个内存区域越大,就可以保留更多的语句,当然被共享的可能性也就越大了。
       当你向ORACLE 提交一个SQL语句,ORACLE会首先在这块内存中查找相同的语句。
       这里需要注明的是,ORACLE对两者采取的是一种严格匹配,要达成共享,SQL语句必须完全相同(包括空格,换行等)。
       共享的语句必须满足三个条件:
       A.字符级的比较:
        当前被执行的语句和共享池中的语句必须完全相同。
        例如:
        SELECT * FROM EMP;
        和下列每一个都不同
        SELECT * from EMP;
        Select * From Emp;
        SELECT * FROM EMP;
       B.两个语句所指的对象必须完全相同:
        例如:
        用户     对象名           如何访问
        Jack     sal_limit          private synonym
             Work_city          public synonym
             Plant_detail       public synonym
       Jill     sal_limit          private synonym
             Work_city          public synonym
             Plant_detail       table owner
       考虑一下下列SQL语句能否在这两个用户之间共享。
    SQL 能否共享 原因
    select max(sal_cap) from sal_limit; 不能 每个用户都有一个private synonym - sal_limit , 它们是不同的对象
    select count(*0 from work_city where sdesc like 'NEW%'; 能 两个用户访问相同的对象public synonym - work_city 
    select a.sdesc,b.location from work_city a , plant_detail b where a.city_id = b.city_id 不能 用户jack 通过private synonym访问plant_detail 而jill 是表的所有者,对象不同.
        C.两个SQL语句中必须使用相同的名字的绑定变量(bind variables)
        例如:第一组的两个SQL语句是相同的(可以共享),而第二组中的两个语句是不同的(即使在运行时,赋于不同的绑定变量相同的值)
        a.
      select pin , name from people where pin = :blk1.pin;
      select pin , name from people where pin = :blk1.pin;
       b.
      select pin , name from people where pin = :blk1.ot_ind;
      select pin , name from people where pin = :blk1.ov_ind;
    4. 选择最有效率的表名顺序(只在基于规则的优化器中有效)
       ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理。 在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。当ORACLE处理多个表时, 会运用排序及合并的方式连接它们。首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。
       例如:
          表 TAB1 16,384 条记录
          表 TAB2 1      条记录
          选择TAB2作为基础表 (最好的方法)
    select count(*) from tab1,tab2   执行时间0.96秒
          选择TAB2作为基础表 (不佳的方法)
    select count(*) from tab2,tab1   执行时间26.09秒
          如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表。
        例如:EMP表描述了LOCATION表和CATEGORY表的交集。
    SELECT *
      FROM LOCATION L, CATEGORY C, EMP E
     WHERE E.EMP_NO BETWEEN 1000 AND 2000
       AND E.CAT_NO = C.CAT_NO
       AND E.LOCN = L.LOCN
       将比下列SQL更有效率
    SELECT *
      FROM EMP E, LOCATION L, CATEGORY C
     WHERE E.CAT_NO = C.CAT_NO
       AND E.LOCN = L.LOCN
       AND E.EMP_NO BETWEEN 1000 AND 2000
    5. WHERE子句中的连接顺序。
       ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。
       例如:
      (低效,执行时间156.3秒)
    SELECT *
      FROM EMP E
     WHERE SAL > 50000
       AND JOB = 'MANAGER'
       AND 25 < (SELECT COUNT(*) FROM EMP WHERE MGR = E.EMPNO);
       (高效,执行时间10.6秒)
    SELECT *
      FROM EMP E
     WHERE 25 < (SELECT COUNT(*) FROM EMP WHERE MGR = E.EMPNO)
       AND SAL > 50000
       AND JOB = 'MANAGER';
    6. SELECT子句中避免使用 '*'
      当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 '*' 是一个方便的方法。不幸的是,这是一个非常低效的方法。 实际上,ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间。
    7. 减少访问数据库的次数
      当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等。 由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量。
        例如,以下有三种方法可以检索出雇员号等于0342或0291的职员。
        方法1 (最低效)
    SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = 342;
    SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = 291;
        方法2 (次低效)
    DECLARE
      CURSOR C1(E_NO NUMBER) IS
        SELECT EMP_NAME, SALARY, GRADE FROM EMP WHERE EMP_NO = E_NO;
    BEGIN
      OPEN C1(342);
      FETCH C1
        INTO …,..,..;
      OPEN C1(291);
      FETCH C1
        INTO …,..,..;
      CLOSE C1;
    END;
        方法3 (高效)
    SELECT A.EMP_NAME, A.SALARY, A.GRADE, B.EMP_NAME, B.SALARY, B.GRADE
      FROM EMP A, EMP B
     WHERE A.EMP_NO = 342
       AND B.EMP_NO = 291;
       注意:
       在SQL*Plus , SQL*Forms和Pro*C中重新设置ARRAYSIZE参数, 可以增加每次数据库访问的检索数据量 ,建议值为200.
    8. 使用DECODE函数来减少处理时间
      使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表。
       例如:
    SELECT COUNT(*),
           SUM(SAL) FROM EMP WHERE DEPT_NO = 0020 AND ENAME LIKE  'SMITH%';
    SELECT COUNT(*),
           SUM(SAL) FROM EMP WHERE DEPT_NO = 0030 AND ENAME LIKE  'SMITH%';
      可以用DECODE函数高效地得到相同结果
    SELECT COUNT(DECODE(DEPT_NO, 0020, 'X', NULL)) D0020_COUNT,
           COUNT(DECODE(DEPT_NO, 0030, 'X', NULL)) D0030_COUNT,
           SUM(DECODE(DEPT_NO, 0020, SAL, NULL)) D0020_SAL,
           SUM(DECODE(DEPT_NO, 0030, SAL, NULL)) D0030_SAL
      FROM EMP
     WHERE ENAME LIKE 'SMITH%';
      类似的,DECODE函数也可以运用于GROUP BY 和ORDER BY子句中。
    9. 整合简单,无关联的数据库访问
      如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
       例如:
    SELECT NAME FROM EMP WHERE EMP_NO = 1234;
    SELECT NAME FROM DPT WHERE DPT_NO = 10;
    SELECT NAME FROM CAT WHERE CAT_TYPE = 'RD';
      上面的3个查询可以被合并成一个:
    SELECT E.NAME, D.NAME, C.NAME
      FROM CAT C, DPT D, EMP E, DUAL X
     WHERE NVL('X', X.DUMMY) = NVL('X', E.ROWID(+))
       AND NVL('X', X.DUMMY) = NVL('X', D.ROWID(+))
       AND NVL('X', X.DUMMY) = NVL('X', C.ROWID(+))
       AND E.EMP_NO(+) = 1234
       AND D.DEPT_NO(+) = 10
       AND C.CAT_TYPE(+) = 'RD';
        虽然采取这种方法,效率得到提高,但是程序的可读性大大降低,所以读者还是要权衡之间的利弊)
    10. 删除重复记录
       最高效的删除重复记录方法 ( 因为使用了ROWID)
    DELETE FROM EMP E
     WHERE E.ROWID > (SELECT MIN(X.ROWID) FROM EMP X WHERE X.EMP_NO = E.EMP_NO);

     11. 用TRUNCATE替代DELETE
       当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息。 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)
        而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息。当命令运行后,数据不能被恢复。因此很少的资源被调用,执行时间也会很短。
        TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML
    12. 尽量多使用COMMIT
       只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:COMMIT所释放的资源:
       a.回滚段上用于恢复数据的信息。
        b.被程序语句获得的锁
       c.redo log buffer 中的空间
       d.ORACLE为管理上述3种资源中的内部花费
       在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼
    13. 计算记录条数
       和一般的观点相反, count(*) 比count(1)稍快 , 当然如果可以通过索引检索,对索引列的计数仍旧是最快的。 例如 COUNT(EMPNO)
        在CSDN论坛中,曾经对此有过相当热烈的讨论, 作者的观点并不十分准确,通过实际的测试,上述三种方法并没有显著的性能差别
    14. 用Where子句替换HAVING子句
       避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤。 这个处理需要排序,总计等操作。 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销。
        例如:
     低效:
         SELECT REGION, AVG(LOG_SIZE)
           FROM LOCATION
          GROUP BY REGION
         HAVING REGION REGION != 'SYDNEY' AND REGION != 'PERTH'
     高效
         SELECT REGION, AVG(LOG_SIZE)
           FROM LOCATION
          WHERE REGION REGION != 'SYDNEY'
            AND REGION != 'PERTH'
          GROUP BY REGION
        HAVING 中的条件一般用于对一些集合函数的比较,如COUNT() 等等。 除此而外,一般的条件应该写在WHERE子句中
    15. 减少对表的查询
       在含有子查询的SQL语句中,要特别注意减少对表的查询。
        例如:
     低效
          SELECT TAB_NAME
            FROM TABLES
           WHERE TAB_NAME =
                 (SELECT TAB_NAME FROM TAB_COLUMNS WHERE VERSION = 604)
           AND DB_VER =
                 (SELECT DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
        高效
          SELECT TAB_NAME
            FROM TABLES
           WHERE (TAB_NAME, DB_VER) = (SELECT TAB_NAME, DB_VER) FROM
           TAB_COLUMNS
           WHERE VERSION = 604)
          Update 多个Column 例子:
     低效:
               UPDATE EMP
                  SET EMP_CAT  =
                      (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES),
                      SAL_RANGE =
                      (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES)
                WHERE EMP_DEPT = 0020;
     高效:
              UPDATE EMP
                 SET (EMP_CAT, SAL_RANGE) =
                     (SELECT MAX(CATEGORY), MAX(SAL_RANGE) FROM EMP_CATEGORIES)
               WHERE EMP_DEPT = 0020;
    16. 通过内部函数提高SQL效率。
    SELECT H.EMPNO, E.ENAME, H.HIST_TYPE, T.TYPE_DESC, COUNT(*)
      FROM HISTORY_TYPE T, EMP E, EMP_HISTORY H
     WHERE H.EMPNO = E.EMPNO
       AND H.HIST_TYPE = T.HIST_TYPE
     GROUP BY H.EMPNO, E.ENAME, H.HIST_TYPE, T.TYPE_DESC;
       通过调用下面的函数可以提高效率。
    FUNCTION LOOKUP_HIST_TYPE(TYP IN NUMBER) RETURN VARCHAR2 AS
      TDESC VARCHAR2(30);
      CURSOR C1 IS
        SELECT TYPE_DESC FROM HISTORY_TYPE WHERE HIST_TYPE = TYP;
    BEGIN
      OPEN C1;
      FETCH C1
        INTO TDESC;
      CLOSE C1;
      RETURN(NVL(TDESC, '?'));
    END;
    FUNCTION LOOKUP_EMP(EMP IN NUMBER) RETURN VARCHAR2 AS
      ENAME VARCHAR2(30);
      CURSOR C1 IS
        SELECT ENAME FROM EMP WHERE EMPNO = EMP;
    BEGIN
      OPEN C1;
      FETCH C1
        INTO ENAME;
      CLOSE C1;
      RETURN(NVL(ENAME, '?'));
    END;
    SELECT H.EMPNO,
           LOOKUP_EMP(H.EMPNO),
           H.HIST_TYPE,
           LOOKUP_HIST_TYPE(H.HIST_TYPE),
           COUNT(*)
      FROM EMP_HISTORY H
     GROUP BY H.EMPNO, H.HIST_TYPE;
        经常在论坛中看到如 '能不能用一个SQL写出…。' 的贴子, 殊不知复杂的SQL往往牺牲了执行效率。 能够掌握上面的运用函数解决问题的方法在实际工作中是非常有意义的
    17. 使用表的别名(Alias)
        当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上。这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。
        Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属
    18. 用EXISTS替代IN
       在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接。在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率。
        低效:
    SELECT *
      FROM EMP(基础表)
     WHERE EMPNO > 0
       AND DEPTNO IN (SELECT DEPTNO FROM DEPT WHERE LOC = 'MELB')
        高效:
    SELECT *
      FROM EMP(基础表)
     WHERE EMPNO > 0
       AND EXISTS (SELECT 'X'
              FROM DEPT
             WHERE DEPT.DEPTNO = EMP.DEPTNO
               AND LOC = 'MELB')
        相对来说,用NOT EXISTS替换NOT IN 将更显著地提高效率,下一节中将指出
    19. 用NOT EXISTS替代NOT IN
       在子查询中,NOT IN子句将执行一个内部的排序和合并。 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历)。  为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.
     例如:
    SELECT *
      FROM EMP
     WHERE DEPT_NO NOT IN (SELECT DEPT_NO FROM DEPT WHERE DEPT_CAT = 'A');
       为了提高效率。改写为:
     (方法一: 高效)
    SELECT *
      FROM EMP A, DEPT B
     WHERE A.DEPT_NO = B.DEPT(+)
       AND B.DEPT_NO IS NULL
       AND B.DEPT_CAT(+) = 'A'
     (方法二: 最高效)
    SELECT *
      FROM EMP E
     WHERE NOT EXISTS (SELECT 'X'
              FROM DEPT D
             WHERE D.DEPT_NO = E.DEPT_NO
               AND DEPT_CAT = 'A');
    20. 用表连接替换EXISTS
       通常来说 , 采用表连接的方式比EXISTS更有效率
          SELECT ENAME
            FROM EMP E
           WHERE EXISTS (SELECT 'X'
                    FROM DEPT
                   WHERE DEPT_NO = E.DEPT_NO
                     AND DEPT_CAT = 'A');
       (更高效)
          SELECT ENAME
            FROM DEPT D, EMP E
           WHERE E.DEPT_NO = D.DEPT_NO
             AND DEPT_CAT = 'A';
       在RBO的情况下,前者的执行路径包括FILTER,后者使用NESTED LOOP
    21. 用EXISTS替换DISTINCT
       当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换
     例如:
     低效:
       SELECT DISTINCT DEPT_NO, DEPT_NAME
         FROM DEPT D, EMP E
        WHERE D.DEPT_NO = E.DEPT_NO
     高效:
        SELECT DEPT_NO, DEPT_NAME
          FROM DEPT D
         WHERE EXISTS (SELECT 'X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);
     EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。
    22. 识别'低效执行'的SQL语句
       用下列SQL工具找出低效SQL:
    SELECT EXECUTIONS,
           DISK_READS,
           BUFFER_GETS,
           ROUND((BUFFER_GETS - DISK_READS) / BUFFER_GETS, 2) Hit_radio,
           ROUND(DISK_READS / EXECUTIONS, 2) Reads_per_run,
           SQL_TEXT
      FROM V$SQLAREA
     WHERE EXECUTIONS > 0
       AND BUFFER_GETS > 0
       AND (BUFFER_GETS - DISK_READS) / BUFFER_GETS < 0.8
     ORDER BY 4 DESC;
        虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法
    23. 使用TKPROF 工具来查询SQL性能状态
       SQL trace 工具收集正在执行的SQL的性能状态数据并记录到一个跟踪文件中。 这个跟踪文件提供了许多有用的信息,例如解析次数。执行次数,CPU使用时间等。这些数据将可以用来优化你的系统。
        设置SQL TRACE在会话级别:
     有效
     ALTER SESSION SET SQL_TRACE TRUE
     设置SQL TRACE 在整个数据库有效仿, 你必须将SQL_TRACE参数在init.ora中设为TRUE, USER_DUMP_DEST参数说明了生成跟踪文件的目录
     这一节中,作者并没有提到TKPROF的用法, 对SQL TRACE的用法也不够准确, 设置SQL TRACE首先要在init.ora中设定TIMED_STATISTICS, 这样才能得到那些重要的时间状态。 生成的trace文件是不可读的,所以要用TKPROF工具对其进行转换,TKPROF有许多执行参数。 大家可以参考ORACLE手册来了解具体的配置。
    24.用EXPLAIN PLAN 分析SQL语句
     EXPLAIN PLAN 是一个很好的分析SQL语句的工具,它甚至可以在不执行SQL的情况下分析语句。 通过分析,我们就可以知道ORACLE是怎么样连接表,使用什么方式扫描表(索引扫描或全表扫描)以及使用到的索引名称。
        你需要按照从里到外,从上到下的次序解读分析的结果。 EXPLAIN PLAN分析的结果是用缩进的格式排列的, 最内部的操作将被最先解读, 如果两个操作处于同一层中,带有最小操作号的将被首先执行。
        NESTED LOOP是少数不按照上述规则处理的操作, 正确的执行路径是检查对NESTED LOOP提供数据的操作,其中操作号最小的将被最先处理。
        译者按:通过实践, 感到还是用SQLPLUS中的SET TRACE 功能比较方便。
        举例:
     SQL> list
     1 SELECT *
     2 FROM dept, emp
     3* WHERE emp.deptno = dept.deptno
    SQL> set autotrace traceonly /*traceonly 可以不显示执行结果*/
    SQL> /
    14 rows selected.
    Execution Plan
    ----------------------------------------------------------
       0      SELECT STATEMENT ptimizer=CHOOSE
       1    0   NESTED LOOPS
       2    1     TABLE ACCESS (FULL) OF 'EMP'
       3    1     TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
       4    3       INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)
    Statistics
    ----------------------------------------------------------
              0 recursive calls
              2 db block gets
             30 consistent gets
              0 physical reads
              0 redo size
           2598 bytes sent via SQL*Net to client
            503 bytes received via SQL*Net from client
              2 SQL*Net roundtrips to/from client
              0 sorts (memory)
              0 sorts (disk)
             14 rows processed
     通过以上分析,可以得出实际的执行步骤是:
     1.       TABLE ACCESS (FULL) OF 'EMP'
     2.       INDEX (UNIQUE SCAN) OF 'PK_DEPT' (UNIQUE)
      3.       TABLE ACCESS (BY INDEX ROWID) OF 'DEPT'
     4.       NESTED LOOPS (JOINING 1 AND 3)
        注: 目前许多第三方的工具如TOAD和ORACLE本身提供的工具如OMS的SQL Analyze都提供了极其方便的EXPLAIN PLAN工具。也许喜欢图形化界面的朋友们可以选用它们。
    25. 用索引提高效率
        索引是表的一个概念部分,用来提高检索数据的效率。 实际上,ORACLE使用了一个复杂的自平衡B-tree结构。 通常,通过索引查询数据比全表扫描要快。 当ORACLE找出执行查询和Update语句的最佳路径时, ORACLE优化器将使用索引。 同样在联结多个表时使用索引也可以提高效率。 另一个使用索引的好处是,它提供了主键(primary key)的唯一性验证。
        除了那些LONG或LONG RAW数据类型, 你可以索引几乎所有的列。 通常, 在大型表中使用索引特别有效。 当然,你也会发现, 在扫描小表时,使用索引同样能提高效率。
        虽然使用索引能得到查询效率的提高,但是我们也必须注意到它的代价。 索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时, 索引本身也会被修改。 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢。
        译者按:定期的重构索引是有必要的。
        ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>
    26. 索引的操作
        ORACLE对索引有两种访问模式。
        索引唯一扫描 ( INDEX UNIQUE SCAN)
        大多数情况下, 优化器通过WHERE子句访问INDEX.
        例如:
     表LODGING有两个索引 : 建立在LODGING列上的唯一性索引LODGING_PK和建立在MANAGER列上的非唯一性索引LODGING$MANAGER.
    SELECT * FROM LODGING WHERE LODGING = 'ROSE HILL';
        在内部 , 上述SQL将被分成两步执行, 首先 , LODGING_PK 索引将通过索引唯一扫描的方式被访问 , 获得相对应的ROWID, 通过ROWID访问表的方式执行下一步检索。
        如果被检索返回的列包括在INDEX列中,ORACLE将不执行第二步的处理(通过ROWID访问表)。 因为检索数据保存在索引中, 单单访问索引就可以完全满足查询结果。
        下面SQL只需要INDEX UNIQUE SCAN 操作。
    SELECT LODGING FROM LODGING WHERE LODGING = 'ROSE HILL';
        索引范围查询(INDEX RANGE SCAN)
        适用于两种情况:
     1.基于一个范围的检索
     2.基于非唯一性索引的检索
        例1:
        SELECT LODGING FROM LODGING WHERE LODGING LIKE 'M%';
        WHERE子句条件包括一系列值, ORACLE将通过索引范围查询的方式查询LODGING_PK . 由于索引范围查询将返回一组值, 它的效率就要比索引唯一扫描低一些。
        例2:
        SELECT LODGING FROM LODGING WHERE MANAGER = 'BILL GATES';
        这个SQL的执行分两步, LODGING$MANAGER的索引范围查询(得到所有符合条件记录的ROWID) 和下一步同过ROWID访问表得到LODGING列的值。 由于LODGING$MANAGER是一个非唯一性的索引,数据库不能对它执行索引唯一扫描。
        由于SQL返回LODGING列,而它并不存在于LODGING$MANAGER索引中, 所以在索引范围查询后会执行一个通过ROWID访问表的操作。
        WHERE子句中, 如果索引列所对应的值的第一个字符由通配符(WILDCARD)开始, 索引将不被采用。在这种情况下,ORACLE将使用全表扫描。
        SELECT LODGING FROM LODGING WHERE MANAGER LIKE '%HANMAN';
    27. 基础表的选择
        基础表(Driving Table)是指被最先访问的表(通常以全表扫描的方式被访问)。 根据优化器的不同, SQL语句中基础表的选择是不一样的。
        如果你使用的是CBO (COST BASED OPTIMIZER),优化器会检查SQL语句中的每个表的物理大小,索引的状态,然后选用花费最低的执行路径。
        如果你用RBO (RULE BASED OPTIMIZER) , 并且所有的连接条件都有索引对应, 在这种情况下, 基础表就是FROM 子句中列在最后的那个表。
        举例:
     SELECT A.NAME , B.MANAGER
     FROM WORKER A,
         LODGING B
     WHERE A.LODGING = B.LODING;
       由于LODGING表的LODING列上有一个索引, 而且WORKER表中没有相比较的索引, WORKER表将被作为查询中的基础表。
    28. 多个平等的索引
       当SQL语句的执行路径可以使用分布在多个表上的多个索引时, ORACLE会同时使用多个索引并在运行时对它们的记录进行合并, 检索出仅对全部索引有效的记录。
        在ORACLE选择执行路径时,唯一性索引的等级高于非唯一性索引。 然而这个规则只有当WHERE子句中索引列和常量比较才有效。如果索引列和其他表的索引类相比较。 这种子句在优化器中的等级是非常低的。
        如果不同表中两个想同等级的索引将被引用, FROM子句中表的顺序将决定哪个会被率先使用。 FROM子句中最后的表的索引将有最高的优先级。
        如果相同表中两个想同等级的索引将被引用, WHERE子句中最先被引用的索引将有最高的优先级。
        举例:
     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引。
      SELECT ENAME
        FROM EMP
       WHERE DEPT_NO = 20
         AND EMP_CAT = 'A';
     这里,DEPTNO索引将被最先检索,然后同EMP_CAT索引检索出的记录进行合并。 执行路径如下:
        TABLE ACCESS BY ROWID ON EMP
      AND-EQUAL
      INDEX RANGE SCAN ON DEPT_IDX
      INDEX RANGE SCAN ON CAT_IDX
    29. 等式比较和范围比较
       当WHERE子句中有索引列, ORACLE不能合并它们,ORACLE将用范围比较。
        举例:
     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引。
      SELECT ENAME
        FROM EMP
       WHERE DEPTNO > 20
         AND EMP_CAT = 'A';
        这里只有EMP_CAT索引被用到,然后所有的记录将逐条与DEPTNO条件进行比较。 执行路径如下:
     TABLE ACCESS BY ROWID ON EMP
      INDEX RANGE SCAN ON CAT_IDX
    30. 不明确的索引等级
        当ORACLE无法判断索引的等级高低差别,优化器将只使用一个索引,它就是在WHERE子句中被列在最前面的。
        举例:
     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引。
    SELECT ENAME
      FROM EMP
     WHERE DEPTNO > 20
       AND EMP_CAT > 'A';
        这里, ORACLE只用到了DEPT_NO索引。 执行路径如下:
        TABLE ACCESS BY ROWID ON EMP
      INDEX RANGE SCAN ON DEPT_IDX
        我们来试一下以下这种情况:
     SQL> select index_name, uniqueness from user_indexes where table_name = 'EMP';
        INDEX_NAME                     UNIQUENES
     ------------------------------ ---------
        EMPNO                          UNIQUE
     EMPTYPE                        NONUNIQUE
        SQL> select * from emp where empno >= 2 and emp_type = 'A' ;
        no rows selected
        Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
       1    0   TABLE ACCESS (BY INDEX ROWID) OF 'EMP'
       2    1     INDEX (RANGE SCAN) OF 'EMPTYPE' (NON-UNIQUE)
    虽然EMPNO是唯一性索引,但是由于它所做的是范围比较, 等级要比非唯一性索引的等式比较低!
    31. 强制索引失效
        如果两个或以上索引具有相同的等级,你可以强制命令ORACLE优化器使用其中的一个(通过它,检索出的记录数量少) .
        举例:
    SELECT ENAME
      FROM EMP
     WHERE EMPNO = 7935
       AND DEPTNO + 0 = 10 /*DEPTNO上的索引将失效*/
       AND EMP_TYPE || '' = 'A' /*EMP_TYPE上的索引将失效*/
        这是一种相当直接的提高查询效率的办法。 但是你必须谨慎考虑这种策略,一般来说,只有在你希望单独优化几个SQL时才能采用它。
        这里有一个例子关于何时采用这种策略,假设在EMP表的EMP_TYPE列上有一个非唯一性的索引而EMP_CLASS上没有索引。
    SELECT ENAME
      FROM EMP
     WHERE EMP_TYPE = 'A'
       AND EMP_CLASS = 'X';
        优化器会注意到EMP_TYPE上的索引并使用它。 这是目前唯一的选择。 如果,一段时间以后, 另一个非唯一性建立在EMP_CLASS上,优化器必须对两个索引进行选择,在通常情况下,优化器将使用两个索引并在他们的结果集合上执行排序及合并。 然而,如果其中一个索引(EMP_TYPE)接近于唯一性而另一个索引(EMP_CLASS)上有几千个重复的值。 排序及合并就会成为一种不必要的负担。 在这种情况下,你希望使优化器屏蔽掉EMP_CLASS索引。
        用下面的方案就可以解决问题。
    SELECT ENAME
      FROM EMP
     WHERE EMP_TYPE = 'A'
       AND EMP_CLASS || '' = 'X';
    32. 避免在索引列上使用计算。
        WHERE子句中,如果索引列是函数的一部分。优化器将不使用索引而使用全表扫描。
        举例:
        低效:
    SELECT *
      FROM DEPT
    WHERE SAL * 12 > 25000;
        高效:
     SELECT *
        FROM DEPT
     WHERE SAL > 25000/12;
        这是一个非常实用的规则,请务必牢记
    33. 自动选择索引
       如果表中有两个以上(包括两个)索引,其中有一个唯一性索引,而其他是非唯一性。
        在这种情况下,ORACLE将使用唯一性索引而完全忽略非唯一性索引。
        举例:
    SELECT ENAME
      FROM EMP
     WHERE EMPNO = 2326
       AND DEPTNO = 20;
        这里,只有EMPNO上的索引是唯一性的,所以EMPNO索引将用来检索记录。
        TABLE ACCESS BY ROWID ON EMP
      INDEX UNIQUE SCAN ON EMP_NO_IDX
    34. 避免在索引列上使用NOT
       通常,我们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的影响。 当ORACLE“遇到”NOT,他就会停止使用索引转而执行全表扫描。
        举例:
        低效:(这里,不使用索引)
    SELECT * FROM DEPT WHERE DEPT_CODE NOT = 0;
        高效:(这里,使用了索引)
    SELECT * FROM DEPT WHERE DEPT_CODE > 0;
        需要注意的是,在某些时候, ORACLE优化器会自动将NOT转化成相对应的关系操作符。
      NOT > to <=
     NOT >= to <
     NOT < to >=
     NOT <= to >
        在这个例子中,作者犯了一些错误。 例子中的低效率SQL是不能被执行的。
        测试:
        SQL> select * from emp where NOT empno > 1;
     no rows selected
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   TABLE ACCESS (BY INDEX ROWID) OF 'EMP'
     2    1     INDEX (RANGE SCAN) OF 'EMPNO' (UNIQUE)

        SQL> select * from emp where empno <= 1;
     no rows selected
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   TABLE ACCESS (BY INDEX ROWID) OF 'EMP'
     2    1     INDEX (RANGE SCAN) OF 'EMPNO' (UNIQUE)
        两者的效率完全一样,也许这符合作者关于“ 在某些时候, ORACLE优化器会自动将NOT转化成相对应的关系操作符” 的观点。
    35. 用>=替代>
        如果DEPTNO上有一个索引,
        高效:
    SELECT *
      FROM EMP
     WHERE DEPTNO >= 4
        低效: 
    SELECT * FROM EMP WHERE DEPTNO > 3
        两者的区别在于, 前者DBMS将直接跳到第一个DEPT等于4的记录而后者将首先定位到DEPTNO=3的记录并且向前扫描到第一个DEPT大于3的记录。
    36. 用UNION替换OR (适用于索引列)
        通常情况下, 用UNION替换WHERE子句中的OR将会起到较好的效果。 对索引列使用OR将造成全表扫描。注意, 以上规则只针对多个索引列有效。 如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低。
        在下面的例子中, LOC_ID 和REGION上都建有索引。
        高效:
    SELECT LOC_ID, LOC_DESC, REGION
      FROM LOCATION
     WHERE LOC_ID = 10
    UNION
    SELECT LOC_ID, LOC_DESC, REGION FROM LOCATION WHERE REGION = 'MELBOURNE'
        低效:
    SELECT LOC_ID, LOC_DESC, REGION
      FROM LOCATION
     WHERE LOC_ID = 10
        OR REGION = 'MELBOURNE'
        如果你坚持要用OR, 那就需要返回记录最少的索引列写在最前面。
        注意:
        WHERE KEY1 = 10   (返回最少记录)
        OR KEY2 = 20        (返回最多记录)
        ORACLE 内部将以上转换为
     WHERE KEY1 = 10 AND((NOT KEY1 = 10) AND KEY2 = 20)
        下面的测试数据仅供参考: (a = 1003 返回一条记录 , b = 1 返回1003条记录)
    SQL> select * from unionvsor /*1st test*/
     2   where a = 1003 or b = 1;
     1003 rows selected.
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   CONCATENATION
     2    1     TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     3    2       INDEX (RANGE SCAN) OF 'UB' (NON-UNIQUE)
        4    1     TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     5    4       INDEX (RANGE SCAN) OF 'UA' (NON-UNIQUE)
      Statistics
     ----------------------------------------------------------
      0 recursive calls
     0 db block gets
     144 consistent gets
     0 physical reads
     0 redo size
     63749 bytes sent via SQL*Net to client
     7751 bytes received via SQL*Net from client
     68 SQL*Net roundtrips to/from client
     0 sorts (memory)
        0 sorts (disk)
    1003 rows processed
     SQL> select * from unionvsor /*2nd test*/
     2 where b = 1 or a = 1003 ;
     1003 rows selected.
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   CONCATENATION
     2    1     TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     3    2       INDEX (RANGE SCAN) OF 'UA' (NON-UNIQUE)
        4    1     TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     5    4       INDEX (RANGE SCAN) OF 'UB' (NON-UNIQUE)
        Statistics
     ----------------------------------------------------------
        0 recursive calls
     0 db block gets
     143 consistent gets
     0 physical reads
     0 redo size
     63749 bytes sent via SQL*Net to client
     7751 bytes received via SQL*Net from client
     68 SQL*Net roundtrips to/from client 0 sorts (memory)
        0 sorts (disk)
    1003 rows processed

       SQL> select * from unionvsor /*3rd test*/
     2 where a = 1003
     3 union
     4   select * from unionvsor
     5   where b = 1;
     1003 rows selected. Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   SORT (UNIQUE)
        2    1     UNION-ALL
     3    2       TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     4    3         INDEX (RANGE SCAN) OF 'UA' (NON-UNIQUE)
        5    2       TABLE ACCESS (BY INDEX ROWID) OF 'UNIONVSOR'
     6    5         INDEX (RANGE SCAN) OF 'UB' (NON-UNIQUE)
       Statistics
     ----------------------------------------------------------
        0 recursive calls
     0 db block gets
     10 consistent gets
     0 physical reads
     0 redo size
     63735 bytes sent via SQL*Net to client
     7751 bytes received via SQL*Net from client
     68 SQL*Net roundtrips to/from client 1 sorts (memory)
        0 sorts (disk)
        1003 rows processed
       用UNION的效果可以从consistent gets和 SQL*NET的数据交换量的减少看出
    37. 用IN来替换OR
        下面的查询可以被更有效率的语句替换:
        低效:
    SELECT *
      FROM LOCATION
     WHERE LOC_ID = 10
        OR LOC_ID = 20
        OR LOC_ID = 30
        高效:
    SELECT *
        FROM LOCATION
     WHERE LOC_IN IN (10,20,30);
        这是一条简单易记的规则,但是实际的执行效果还须检验,在ORACLE8i下,两者的执行路径似乎是相同的。
    38. 避免在索引列上使用IS NULL和IS NOT NULL
       避免在索引中使用任何可以为空的列,ORACLE将无法使用该索引。对于单列索引,如果列包含空值,索引中将不存在此记录。 对于复合索引,如果每个列都为空,索引中同样不存在此记录。 如果至少有一个列不为空,则记录存在于索引中。
        举例:
       如果唯一性索引建立在表的A列和B列上, 并且表中存在一条记录的A,B值为(123,null) , ORACLE将不接受下一条具有相同A,B值(123,null)的记录(插入)。 然而如果所有的索引列都为空,ORACLE将认为整个键值为空而空不等于空。 因此你可以插入1000条具有相同键值的记录,当然它们都是空!
        因为空值不存在于索引列中,所以WHERE子句中对索引列进行空值比较将使ORACLE停用该索引。
        举例:
        低效: (索引失效)
      SELECT *
        FROM DEPARTMENT
     WHERE DEPT_CODE IS NOT NULL;
        高效: (索引有效)
    SELECT *
        FROM DEPARTMENT
     WHERE DEPT_CODE >=0;
    39. 总是使用索引的第一个列
       如果索引是建立在多个列上, 只有在它的第一个列(leading column)被where子句引用时,优化器才会选择使用该索引。
        这也是一条简单而重要的规则。 见以下实例。
        SQL> create table multiindexusage (inda number,indb number descr varchar2910));
     Table created.
     SQL> create index multindex on multiindexusage(inda,indb);
     Index created.
     SQL> set autotrace traceonly
        SQL> select * from multiindexusage where inda = 1;
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   TABLE ACCESS (BY INDEX ROWID) OF 'MULTIINDEXUSAGE'
     2    1     INDEX (RANGE SCAN) OF 'MULTINDEX' (NON-UNIQUE)
        SQL> select * from multiindexusage where indb = 1;
     Execution Plan
     ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   TABLE ACCESS (FULL) OF 'MULTIINDEXUSAGE'
        很明显, 当仅引用索引的第二个列时,优化器使用了全表扫描而忽略了索引
    40. ORACLE内部操作
       当执行查询时,ORACLE采用了内部的操作。 下表显示了几种重要的内部操作。
    ORACLE Clause 内部操作
    ORDER BY SORT ORDER BY
    UNION UNION-ALL
    MINUS MINUS
    INTERSECT INTERSECT
    DISTINCT,MINUS,INTERSECT,UNION SORT UNIQUE
    MIN,MAX,COUNT SORT AGGREGATE
    GROUP BY SORT GROUP BY
    ROWNUM COUNT or COUNT STOPKEY
    Queries involving Joins SORT JOIN,MERGE JOIN,NESTED LOOPS
    CONNECT BY CONNECT BY
    41. 用UNION-ALL 替换UNION ( 如果有可能的话)
        当SQL语句需要UNION两个查询结果集合时,这两个结果集合会以UNION-ALL的方式被合并, 然后在输出最终结果前进行排序。
        如果用UNION ALL替代UNION, 这样排序就不是必要了。 效率就会因此得到提高。
        举例:
       低效:
    SELECT ACCT_NUM, BALANCE_AMT
      FROM DEBIT_TRANSACTIONS
     WHERE TRAN_DATE = '31-DEC-95'
    UNION
    SELECT ACCT_NUM, BALANCE_AMT
      FROM DEBIT_TRANSACTIONS
     WHERE TRAN_DATE = '31-DEC-95'
       高效:
    SELECT ACCT_NUM, BALANCE_AMT
      FROM DEBIT_TRANSACTIONS
     WHERE TRAN_DATE = '31 - DEC - 95'
    UNION ALL
    SELECT ACCT_NUM, BALANCE_AMT
      FROM DEBIT_TRANSACTIONS
     WHERE TRAN_DATE = '31 - DEC - 95'
        需要注意的是,UNION ALL 将重复输出两个结果集合中相同记录。 因此各位还是要从业务需求分析使用UNION ALL的可行性。
        UNION 将对结果集合排序,这个操作会使用到SORT_AREA_SIZE这块内存。 对于这块内存的优化也是相当重要的。 下面的SQL可以用来查询排序的消耗量
    Select substr(name, 1, 25) "Sort Area Name", substr(value, 1, 15) "Value"
      from v$sysstat
     where name like 'sort%';
    42. 使用提示(Hints)
        对于表的访问,可以使用两种Hints.
     FULL 和 ROWID
        FULL hint 告诉ORACLE使用全表扫描的方式访问指定表。
        例如:
    SELECT /*+ FULL(EMP) */* FROM EMP WHERE EMPNO = 7893;
        ROWID hint 告诉ORACLE使用TABLE ACCESS BY ROWID的操作访问表。
        通常, 你需要采用TABLE ACCESS BY ROWID的方式特别是当访问大表的时候, 使用这种方式, 你需要知道ROIWD的值或者使用索引。
        如果一个大表没有被设定为缓存(CACHED)表而你希望它的数据在查询结束是仍然停留在SGA中,你就可以使用CACHE hint 来告诉优化器把数据保留在SGA中。 通常CACHE hint 和 FULL hint 一起使用。
        例如:
    SELECT /*+ FULL(WORKER) CACHE(WORKER)*/* FROM WORK;
        索引hint 告诉ORACLE使用基于索引的扫描方式。 你不必说明具体的索引名称
       例如:
    SELECT /*+ INDEX(LODGING) */
     LODGING
      FROM LODGING
     WHERE MANAGER = 'BILL GATES';
        在不使用hint的情况下, 以上的查询应该也会使用索引,然而,如果该索引的重复值过多而你的优化器是CBO, 优化器就可能忽略索引。 在这种情况下, 你可以用INDEX hint强制ORACLE使用该索引。
        ORACLE hints 还包括ALL_ROWS, FIRST_ROWS, RULE,USE_NL, USE_MERGE, USE_HASH 等等。
        使用hint , 表示我们对ORACLE优化器缺省的执行路径不满意,需要手工修改。这是一个很有技巧性的工作。 我建议只针对特定的,少数的SQL进行hint的优化。对ORACLE的优化器还是要有信心(特别是CBO)
    43. 用WHERE替代ORDER BY
        ORDER BY 子句只在两种严格的条件下使用索引。
           ORDER BY中所有的列必须包含在相同的索引中并保持在索引中的排列顺序。
           ORDER BY中所有的列必须定义为非空。
           WHERE子句使用的索引和ORDER BY子句中所使用的索引不能并列。
        例如:
       表DEPT包含以下列:
      DEPT_CODE    PK    NOT NULL
     DEPT_DESC           NOT NULL
     DEPT_TYPE           NULL
        非唯一性的索引(DEPT_TYPE)
        低效: (索引不被使用)
    SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE;
       EXPLAIN PLAN:
      SORT ORDER BY
      TABLE ACCESS FULL
       高效: (使用索引)
    SELECT DEPT_CODE FROM DEPT WHERE DEPT_TYPE > 0
     EXPLAIN PLAN:
      TABLE ACCESS BY ROWID ON EMP
       INDEX RANGE SCAN ON DEPT_IDX
       ORDER BY 也能使用索引! 这的确是个容易被忽视的知识点。 我们来验证一下:
    SQL> select * from emp order by empno;

    EXPLAIN PLAN
    ----------------------------------------------------------
        0      SELECT STATEMENT ptimizer=CHOOSE
     1    0   TABLE ACCESS (BY INDEX ROWID) OF 'EMP'
     2    1     INDEX (FULL SCAN) OF 'EMPNO' (UNIQUE)
    44. 避免改变索引列的类型。
        当比较不同数据类型的数据时, ORACLE自动对列进行简单的类型转换。
        假设 EMPNO是一个数值类型的索引列。
    SELECT * FROM EMP WHERE EMPNO = '123';
       实际上,经过ORACLE类型转换, 语句转化为:
    SELECT * FROM EMP WHERE EMPNO = TO_NUMBER('123');
        幸运的是,类型转换没有发生在索引列上,索引的用途没有被改变。
        现在,假设EMP_TYPE是一个字符类型的索引列。
    SELECT * FROM EMP WHERE EMP_TYPE = 123
       这个语句被ORACLE转换为:
    SELECT * FROM EMP WHERE TO_NUMBER(EMP_TYPE) = 123
       因为内部发生的类型转换, 这个索引将不会被用到!
        为了避免ORACLE对你的SQL进行隐式的类型转换, 最好把类型转换用显式表现出来。 注意当字符和数值比较时, ORACLE会优先转换数值类型到字符类型。
    45. 需要当心的WHERE子句
       某些SELECT 语句中的WHERE子句不使用索引。 这里有一些例子。
        在下面的例子里, ‘!=’ 将不使用索引。 记住, 索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中。
        不使用索引:
    SELECT ACCOUNT_NAME FROM TRANSACTION WHERE AMOUNT != 0;
       使用索引:
    SELECT ACCOUNT_NAME FROM TRANSACTION WHERE AMOUNT > 0;
       下面的例子中, ‘||’是字符连接函数。 就象其他函数那样, 停用了索引。
        不使用索引:
    SELECT ACCOUNT_NAME,AMOUNT
      FROM TRANSACTION
     WHERE ACCOUNT_NAME || ACCOUNT_TYPE = 'AMEXA';
       使用索引:
    SELECT ACCOUNT_NAME,AMOUNT
      FROM TRANSACTION
     WHERE ACCOUNT_NAME = 'AMEX'
       AND ACCOUNT_TYPE = 'A';
       下面的例子中, ‘+’是数学函数。 就象其他数学函数那样, 停用了索引。
        不使用索引:
    SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT + 3000 > 5000;
       使用索引:
    SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT > 2000;
       下面的例子中,相同的索引列不能互相比较,这将会启用全表扫描。
        不使用索引:
    SELECT ACCOUNT_NAME, AMOUNT
      FROM TRANSACTION
     WHERE ACCOUNT_NAME = NVL(:ACC_NAME, ACCOUNT_NAME);
       使用索引:
    SELECT ACCOUNT_NAME, AMOUNT
      FROM TRANSACTION
     WHERE ACCOUNT_NAME LIKE NVL(:ACC_NAME, '%');
       如果一定要对使用函数的列启用索引, ORACLE新的功能: 基于函数的索(Function-Based Index) 也许是一个较好的方案。
       CREATE INDEX EMP_I ON EMP (UPPER(ename)); /*建立基于函数的索引*/
     SELECT * FROM emp WHERE UPPER(ename) = 'BLACKSNAIL'; /*将使用索引*/
    46. 连接多个扫描
       如果你对一个列和一组有限的值进行比较, 优化器可能执行多次扫描并对结果进行合并连接。
        举例:
    SELECT * FROM LODGING WHERE MANAGER IN ('BILL GATES' , 'KEN MULLER');
       优化器可能将它转换成以下形式
    SELECT *
      FROM LODGING
     WHERE MANAGER = 'BILL GATES'
        OR MANAGER = 'KEN MULLER';
       当选择执行路径时, 优化器可能对每个条件采用LODGING$MANAGER上的索引范围扫描。 返回的ROWID用来访问LODGING表的记录 (通过TABLE ACCESS BY ROWID 的方式)。 最后两组记录以连接(CONCATENATION)的形式被组合成一个单一的集合。
       EXPLAIN PLAN:
    SELECT STATEMENT ptimizer=CHOOSE
    CONCATENATION
      TABLE ACCESS (BY INDEX ROWID) OF LODGING
        INDEX (RANGE SCAN ) OF LODGING$MANAGER (NON-UNIQUE)
      TABLE ACCESS (BY INDEX ROWID) OF LODGING
        INDEX (RANGE SCAN) OF LODGING$MANAGER (NON-UNIQUE)
          本节和第37节似乎有矛盾之处。
    47. CBO下使用更具选择性的索引
       基于成本的优化器(CBO, Cost-Based Optimizer)对索引的选择性进行判断来决定索引的使用是否能提高效率。
        如果索引有很高的选择性, 那就是说对于每个不重复的索引键值,只对应数量很少的记录。
        比如, 表中共有100条记录而其中有80个不重复的索引键值。 这个索引的选择性就是80/100 = 0.8 . 选择性越高, 通过索引键值检索出的记录就越少。
        如果索引的选择性很低, 检索数据就需要大量的索引范围查询操作和ROWID 访问表的操作。 也许会比全表扫描的效率更低。
       下列经验请参阅:
        a.如果检索数据量超过30%的表中记录数。使用索引将没有显著的效率提高。
         b.在特定情况下, 使用索引也许会比全表扫描慢, 但这是同一个数量级上的区别。 而通常情况下,使用索引比全表扫描要快几倍乃至几千倍!
    48. 避免使用耗费资源的操作
       带有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能。 DISTINCT需要一次排序操作, 而其他的至少需要执行两次排序。
        例如,一个UNION查询,其中每个查询都带有GROUP BY子句, GROUP BY会触发嵌入排序(NESTED SORT) ; 这样, 每个查询需要执行一次排序, 然后在执行UNION时, 又一个唯一排序(SORT UNIQUE)操作被执行而且它只能在前面的嵌入排序结束后才能开始执行。 嵌入的排序的深度会大大影响查询的效率。
        通常, 带有UNION, MINUS , INTERSECT的SQL语句都可以用其他方式重写。
        如果你的数据库的SORT_AREA_SIZE调配得好, 使用UNION , MINUS, INTERSECT也是可以考虑的, 毕竟它们的可读性很强
    49. 优化GROUP BY
       提高GROUP BY 语句的效率, 可以通过将不需要的记录在GROUP BY 之前过滤掉。下面两个查询返回相同结果但第二个明显就快了许多。
        低效:
    SELECT JOB, AVG(sal)
      FROM EMP
     GROUP by JOB
    HAVING JOB = 'PRESIDENT' OR JOB = 'MANAGER'
       高效:
    SELECT JOB, AVG(sal)
      FROM EMP
     WHERE JOB = 'PRESIDENT'
        OR JOB = 'MANAGER'
     GROUP by JOB
       本节和14节相同。 可略过。
    50. 使用日期
        当使用日期时,需要注意如果有超过5位小数加到日期上, 这个日期会进到下一天!
        例如:
     1.
    SELECT TO_DATE('01 - JAN - 93' + .99999) FROM DUAL;
     Returns:“01-JAN-93 23:59:59‘
     2.
    SELECT TO_DATE('01 - JAN - 93' + .999999) FROM DUAL;
        Returns:“02-JAN-93 00:00:00‘
       虽然本节和SQL性能优化没有关系, 但是作者的功力可见一斑
    51. 使用显式的游标(CURSORs)
        使用隐式的游标,将会执行两次操作。 第一次检索记录, 第二次检查TOO MANY ROWS 这个exception . 而显式游标不执行第二次操作。
    52. 优化EXPORT和IMPORT
       使用较大的BUFFER(比如10MB , 10,240,000)可以提高EXPORT和IMPORT的速度。
        ORACLE将尽可能地获取你所指定的内存大小,即使在内存不满足,也不会报错。这个值至少要和表中最大的列相当,否则列值会被截断。
        可以肯定的是, 增加BUFFER会大大提高EXPORT , IMPORT的效率。 (曾经碰到过一个CASE, 增加BUFFER后,IMPORT/EXPORT快了10倍!)
        可能犯了一个错误: “这个值至少要和表中最大的列相当,否则列值会被截断。 ”其中最大的列也许是指最大的记录大小。
        关于EXPORT/IMPORT的优化,CSDN论坛中有一些总结性的贴子,比如关于BUFFER参数, COMMIT参数等等, 详情请查。
    53. 分离表和索引
       总是将你的表和索引建立在不同的表空间内(TABLESPACES)。 决不要将不属于ORACLE内部系统的对象存放到SYSTEM表空间里。 同时,确保数据表空间和索引表空间置于不同的硬盘上。
        “同时,确保数据表空间和索引表空间置与不同的硬盘上。”可能改为如下更为准确 “同时,确保数据表空间和索引表空间置与不同的硬盘控制卡控制的硬盘上。”

  • inner join,outer join,left join,right join的区别

    2011-09-20 14:49:00

    inner join,outer join,left join,right join的区别

    外联接
    外联接可以是左向外联接、右向外联接或完整外部联接。
    在 FROM 子句中指定外联接时,可以由下列几组关键字中的一组指定:

    LEFT JOIN 或 LEFT OUTER JOIN。
    左向外联接的结果集包括 LEFT OUTER 子句中指定的左表的所有行,而不仅仅是联接列所匹配的行。如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为空值。

    RIGHT JOIN 或 RIGHT OUTER JOIN。
    右向外联接是左向外联接的反向联接。将返回右表的所有行。如果右表的某行在左表中没有匹配行,则将为左表返回空值。

    FULL JOIN 或 FULL OUTER JOIN。
    完整外部联接返回左表和右表中的所有行。当某行在另一个表中没有匹配行时,则另一个表的选择列表列包含空值。如果表之间有匹配行,则整个结果集行包含基表的数据值。
    例如:
    表a
    id              name
    1               a
    2               b
    3               c
    表b
    id              store
    1              15
    2              10
    4              67
    inner join :
    select * from a inner join b on a.id=b.id
    结果:(只显示id匹配的选项)
    id            name id store
    1              a                 1             15
    2              b                 2             10
    内连接还有以下写法:
    select * from a inner join b where a.id=b.id
    select * from a,b where a.id=b.id(连接查询的另一种写法)
    select * from a as e,b as r where e.id=r.id(使用as定义别名,当表名很长时有用)
    select * from a e,b r where e.id=r.id(定义别名时可以省掉as)
    外连接分左外连接和右外连接
    左外连接:
    select * from a left outer join b on a.id=b.id
    或:
    select * from a left join b on a.id=b.id
    结果:(除了显示匹配记录,还显示a表中所有的记录)
    id            name            id            stroe
    1              a                 1             15
    2              b                 2             10
    3              c                \N             \N
    右外连接:
    select * from a right outer join b on a.id=b.id
    或:
    select * from a right join b on a.id=b.id
    结果:(除了显示匹配的记录,还显示右表中所有的记录)
    id            name            id            store
    1              a                1              15
    2              b                2              10
    \N            \N               4              67

  • oracle利用现有表创建新表

    2011-09-20 14:10:26

    CREATE TABLE <newtable> AS SELECT {* | column(s)} FROM <oldtable> [WHERE <condition>];
    exp:
        SQL> CREATE TABLE yonghu_bak AS SELECT * FROM yonghul;
        SQL> CREATE TABLE yonghu_bak AS SELECT id, name,sex FROM yonghu;
        SQL> CREATE TABLE yonghu_bak AS SELECT * FROM yonghu WHERE 1=2;

    当遇到一个部门有多个员工记录,需要去取出每个部门薪水最少的那笔时,就可以用到分析函数row_number()
    select * from(

            select manager_id,employee_id,first_name,salary,row_number()
            over(partition by manager_id order by salary) as currowid
           from hr.employees)
    where currowid = 1

    PS:

    (1)建一个新表,架构、字段属性、约束条件、数据记录跟旧表完全一样:

    Create Table print_his_0013 as Select * from print_his_0007

    (2)建一个新表,架构跟旧表完全一样,但没有内容:

    Create Table print_his_0013 as Select * from print_his_0007 where 1=2

    google_protectAndRun("render_ads.js::google_render_ad", google_handleError, google_render_ad);
  • ORACLE中添加删除主键、外键

    2011-09-20 13:22:22

    1、创建表的同时创建主键约束

    (1)无命名 create table student ( studentid int primary key not null, studentname varchar(8), age int);

    (2)有命名 create table students ( studentid int , studentname varchar(8), age int, constraint yy primary key(studentid));

    2、删除表中已有的主键约束

    (1)无命名可用 SELECT * from user_cons_columns; 查找表中主键名称得student表中的主键名为SYS_C002715 alter table student drop constraint SYS_C002715;

    (2)有命名 alter table students drop constraint yy;

    3、向表中添加主键约束 alter table student add constraint pk_student primary key(studentid);

    4、向表中添加外键约束 ALTER TABLE table_A ADD CONSTRAINT FK_name FOREIGN KEY(id) REFERENCES table_B(id);

    5.

    oracle 多表删除 同时删除多表中关联数据

    1、从数据表t1中把那些id值在数据表t2里有匹配的记录全删除掉

    DELETE t1 FROM t1,t2 WHERE t1.id=t2.id 或DELETE FROM t1 USING t1,t2 WHERE t1.id=t2.id

    2、从数据表t1里在数据表t2里没有匹配的记录查找出来并删除掉

    DELETE t1 FROM t1 LEFT JOIN T2 ON t1.id=t2.id WHERE t2.id IS NULL 或

    DELETE FROM t1,USING t1 LEFT JOIN T2 ON t1.id=t2.id WHERE t2.id IS NULL

    3、从两个表中找出相同记录的数据并把两个表中的数据都删除掉

    DELETE t1,t2 from t1 LEFT JOIN t2 ON t1.id=t2.id WHERE t1.id=25

    注意此处的delete t1,t2 from 中的t1,t2不能是别名

    如:delete t1,t2 from table_name as t1 left join table2_name as t2 on t1.id=t2.id where table_name.id=25 在数据里面执行是错误的(MYSQL 版本不小于5.0在5.0中是可以的)

    上述语句改写成

    delete table_name,table2_name from table_name as t1 left join table2_name as t2 on t1.id=t2.id where table_name.id=25 在数据里面执行是错误的(MYSQL 版本小于5.0在5.0中是可以的)

  • oracle中"cascade"的用法总结

    2011-09-20 13:20:50

    级联删除,比如你删除某个表的时候后面加这个关键字,会在删除这个表的同时删除和该表有关系的其他对象

    1.级联删除表中的信息,当表A中的字段引用了表B中的字段时,一旦删除B中该字段的信息,表A的信息也自动删除。(当父表的信息删除,子表的信息也自动删除)

    例如下面这两个表中分别存的时员工的基本信息和公司的部门信息。我们为
    create table dept
    (deptno number(10) not null,
    deptname varchar2(30) not null,
    constraint pk_dept primary key(deptno));

    create table emp
    ( empno number(10) not null,
    fname varchar2(20) ,
    lname varchar2(20) ,
    dept number(10) ,
    constraint pk_emp primary key(empno));

    然后我们现在增加外键试一下on delete cascade

    alter table emp
    add constraint fk_emp_dept foreign key(dept) references dept(deptno) on delete cascade;
    先增加外键。然后插入数据。
    insert into dept values(1,’销售部’);
    insert into dept values(2,’财务部’);
    insert into emp values (2,’Mary’,'Song’,1);
    insert into emp values (3,’Linda’,'Liu’,2);
    insert into emp values (4,’Linlin’,'Zhang’,1);
    然后现在我要删除销售部,会有什么后果呢?
    delete from dept where deptno = 1;
    我们发现除了dept中的一条数据被删除了,emp中两条数据也被删除了,其中emp中的两条数据是参照了销售部的这条数据的,这就很容易理解on delete cascade了。

     

    接下来我们再来看on delete set null,顾名思义了,这种方式建立的外键约束,当被参照的数据被删除是,参照该数据的那些数据的对应值将会变为空值,下面我们还是通过试验来证明on delete set null作用:
    首先恢复刚才的那几条数据,然后更改约束:
    alter table emp
    add constraint fk_emp_dept foreign key(dept) references dept(deptno) on delete set null;
    然后我们在执行删除操作:
    delete from dept where deptno = 1;
    你也会发现除了dept中的销售部被删除以外,emp中参照这条数据的两条数据的dept的值被自动赋空了,这就是on delete set null的作用了。

    使用on delete set null有一点需要注意的是,被参参照其他表的那一列必须能够被赋空,不能有not null约束,对于上面的例子来说是emp中dept列一定不能有not null约束,如果已经定义了not null约束,又使用了on delete set null来删除被参照的数据时,将会发生:ORA-01407: 无法更新 (”DD”.”EMP”.”DEPT”) 为 NULL的错误。

    总的来讲on delete cascade和on delete set null的作用是用来处理级联删除问题的,如果你需要删除的数据被其他数据所参照,那么你应该决定到底希望oracle怎么处理那些参照这些即将要删除数据的数据的,你可以有三种方式:
    禁止删除,这也是oracle默认的
    将那些参照本值的数据的对应列赋空,这个需要使用on delete set null关键字
    将那些参照本值的数据一并删除,这个需要使用on delete cascade关键字

     

    2。Oracle 删除用户时报“必须指定 CASCADE 以删除 'SE'”

    这说明你要删除的oracle 用户"SE" 下面还有数据库对象,如 table, view 等,这样你删除用户时必须加选项 cascade: drop user se cascade; 表示删除用户SE,同时删除 SE 用户下的所有数据对象。还有一个办法就是先删除 se 下的所有数据对象,使 se 变成一个啥也没有的空用户,再 drop user se;3.ORACLE中Drop table cascade constraints之后果当你要drop一个table时,如果删除table的动作会造成trigger或constraint产生矛盾,系统会出现错误警告的讯息而不会允许执行.。一个极简单的例子,例如你有一个员工基本资料表,上面可能有员工编号和员工姓名等字段,另外有一个员工销售表,上面有员工编号和员工销售额两个字段,员工薪资表的员工编号字段为一个foreign key参照到员工基本资料表的员工编号:
    SQL> drop table t;
    Table dropped.
    SQL> drop table t1;
    Table dropped.
    SQL> create table t (id number,name varchar2(20));
    Table created.
    SQL> create table t1 (id number,sal number);

    Table created.
    SQL> alter table t add constraint t_pk primary key (id);
    Table altered.
    SQL> alter table t1 add constraint t_fk foreign key (id) references t (id);
    Table altered.
    SQL> insert into t values (1,#39;JACK&#39;);
    1 row created.
    SQL> insert into t values (2,#39;MARY&#39;);
    1 row created.
    SQL> COMMIT;
    Commit complete.
    SQL> insert into t1 values (1,1000);
    1 row created.
    SQL> insert into t1 values (2,1500);
    1 row created.
    SQL> commit;
    SQL> insert into t1 values (3,200);
    insert into t1 values (3,200)
    *
    ERROR at line 1:
    ORA-02291: integrity constraint (SYS.T_FK) violated - parent key not found
    (違反了constraint,員工基本資料表根本沒有3號這個員工,何來的銷售紀錄。)

    SQL> drop table t;
    drop table t
    *
    ERROR at line 1:
    ORA-02449: unique/primary keys in table referenced by foreign keys
    (违反了constraint,员工销售表t1有參照到table t,这个reference relation不允许你drop table t)
    SQL> drop table t cascade constraints;
    Table dropped.
    SQL> select * from t1;
    ID SAL
    ---------- ----------
    1 1000
    2 1500
    SQL> select CONSTRAINT_NAME,TABLE_NAME from dba_constraints where wner = #39;SYS&#39; and TABLE_NAME = &#39;T1&#39;
    no rows selected
    SQL>
    我们可以发现利用Drop table cascade constraints可以以刪除关联table t的constraint來达成你drop table t的目的,原來属于t1的foreign key constraint已经跟随着被删除掉了,但是,储存在table t1的资料可不会被删除,也就是说Drop table cascade constraints 是不影响到存储于objec里的row data
  • 为什么要用数据库连接池以及其原理

    2009-08-18 17:46:47

       为了避免每次访问数据库的时候都需要重新建立新的连接而影响运行速度,在实际的项目中必须使用数据库连接池来提高数据库的访问效率。
      
    在Web服务器端,建立连接池类DBConnPool,可以提供数据库的连接供其他的类使用,那么DBConnPool就应该在Web服务器启动的时候就被创建一个实例,然后等待别人来调用它,那么调用它的类如何在“内存”中找到这个唯一的DBConnPool实例呢?还有,怎样保证这个唯一的DBConnPool实例不被java的垃圾回收机制回收呢?
       答案是这样的:一般在web服务器端的连接池程序都是在一个容器中的,所以可以被其他的对象见到,也就是其他对象和连接池对象是在一个进程中的,这样就可以被另外的对象引用了,而如何保持唯一性就可用上面的单子模式,返回引用就可以了。而为什么不被回收是因为有引用在上面,而引用为什么一直有效,该类对象是在web服务器初始化时有的,所以直到web服务器关闭才消失。 
      单子模式: public   class   DBConnPool   {  
              private   static   DBConnPool   db   ;  
              private   DBConnPool(){}  
              public   static   void   getInstance()   {  
                    return   db;  
              }    
      }
      JDBC数据库连接池的实现及原理如下:

    1.前言
    数据库应用,在许多软件系统中经常用到,是开发中大型系统不可缺少的辅助。但如果对数据库资源没有很好地管理(如:没有及时回收数据库的游标(ResultSet)、Statement、连接 (Connection)等资源),往往会直接导致系统的稳定。这类不稳定因素,不单单由数据库或者系统本身一方引起,只有系统正式使用后,随着流量、用户的增加,才会逐步显露。
    在基于Java开发的系统中,JDBC是程序员和数据库打交道的主要途径,提供了完备的数据库操作方法接口。但考虑到规范的适用性,JDBC只提供了最直接的数据库操作规范,对数据库资源管理,如:对物理连接的管理及缓冲,期望第三方应用服务器(Application Server)的提供。
    本文,以JDBC规范为基础,介绍相关的数据库连接池机制,并就如果以简单的方式,实现有效地管理数据库资源介绍相关实现技术。

    2.连接池技术背景
    2.1 JDBC
    JDBC是一个规范,遵循JDBC接口规范,各个数据库厂家各自实现自己的驱动程序(Driver),如下图所示:

    应用在获取数据库连接时,需要以URL的方式指定是那种类型的Driver,在获得特定的连接后,可按照固定的接口操作不同类型的数据库,如: 分别获取Statement、执行SQL获得ResultSet等,如下面的例子 :

    import java.sql.*;

    DriverManager.registerDriver(new oracle.jdbc.driver.OracleDriver());
    Connection dbConn = DriverManager.getConnection("jdbc:oracle:thin:@127.0.0.1:1521:oracle","username","password");
    Statement st = dbConn.createStatement();
    ResultSet rs = st.executeQuery("select * from demo_table");

    …some data source operation in here

    rs.close();
    st.close();
    dbConn.close();

    在完成数据操作后,还一定要关闭所有涉及到的数据库资源。这虽然对应用程序的逻辑没有任何影响,但是关键的操作。上面是个简单的例子,如果搀和众多的if-else、exception,资源的管理也难免百密一疏。如同C中的内存泄漏问题,Java系统也同样会面临崩溃的恶运。所以数据库资源的管理依赖于应用系统本身,是不安全、不稳定的一种隐患。

    2.2 JDBC连接池
    在标准JDBC对应用的接口中,并没有提供资源的管理方法。所以,缺省的资源管理由应用自己负责。虽然在JDBC规范中,多次提及资源的关闭/回收及其他的合理运用。但最稳妥的方式,还是为应用提供有效的管理手段。所以,JDBC为第三方应用服务器(Application Server)提供了一个由数据库厂家实现的管理标准接口:连接缓冲(connection pooling)。引入了连接池( Connection Pool )的概念 ,也就是以缓冲池的机制管理数据库的资源。

    JDBC最常用的资源有三类:
    — Connection: 数据库连接。
    — Statement: 会话声明。
    — ResultSet: 结果集游标。

    分别存在以下的关系 :


    这是一种“爷—父—子”的关系,对Connection的管理,就是对数据库资源的管理。举个例子: 如果想确定某个数据库连接(Connection)是否超时,则需要确定其(所有的)子Statement是否超时,同样,需要确定所有相关的 ResultSet是否超时;在关闭Connection前,需要关闭所有相关的Statement和ResultSet。
    因此,连接池(Connection Pool)所起到的作用,不仅仅简单地管理Connection,还涉及到 Statement和ResultSet。

    2.3 连接池(ConnectionPool)与资源管理
    ConnectionPool以缓冲池的机制,在一定数量上限范围内,控制管理Connection,Statement和ResultSet。任何数据库的资源是有限的,如果被耗尽,则无法获得更多的数据服务。
    在大多数情况下,资源的耗尽不是由于应用的正常负载过高,而是程序原因。
    在实际工作中,数据资源往往是瓶颈资源,不同的应用都会访问同一数据源。其中某个应用耗尽了数据库资源后,意味其他的应用也无法正常运行。因此,ConnectionPool的第一个任务是限制:每个应用或系统可以拥有的最大资源。也就是确定连接池的大小(PoolSize)。
    ConnectionPool的第二个任务:在连接池的大小(PoolSize)范围内,最大限度地使用资源,缩短数据库访问的使用周期。许多数据库中,连接(Connection)并不是资源的最小单元,控制Statement资源比Connection更重要。以Oracle为例:
    每申请一个连接(Connection)会在物理网络(如 TCP/IP网络)上建立一个用于通讯的连接,在此连接上还可以申请一定数量的Statement。同一连接可提供的活跃Statement数量可以达到几百。在节约网络资源的同时,缩短了每次会话周期(物理连接的建立是个费时的操作)。但在一般的应用中,多数按照2.1范例操作,这样有10个程序调用,则会产生10次物理连接,每个Statement单独占用一个物理连接,这是极大的资源浪费。 ConnectionPool可以解决这个问题,让几十、几百个Statement只占用同一个物理连接, 发挥数据库原有的优点。
    通过ConnectionPool对资源的有效管理,应用可以获得的Statement总数到达 :

    (并发物理连接数)×(每个连接可提供的Statement数量)

    例如某种数据库可同时建立的物理连接数为 200个,每个连接可同时提供250个Statement,那么ConnectionPool最终为应用提供的并发Statement总数为: 200 × 250 = 50,000个。这是个并发数字,很少有系统会突破这个量级。所以在本节的开始,指出资源的耗尽与应用程序直接管理有关。
    对资源的优化管理,很大程度上依靠数据库自身的JDBC Driver是否具备。有些数据库的JDBC Driver并不支持Connection与Statement之间的逻辑连接功能,如SQLServer,我们只能等待她自身的更新版本了。
    对资源的申请、释放、回收、共享和同步,这些管理是复杂精密的。所以,ConnectionPool另一个功能就是,封装这些操作,为应用提供简单的,甚至是不改变应用风格的调用接口。

    3.简单JDBC连接池的实现
    根据第二章中原理机制,Snap-ConnectionPool(一种简单快速的连接池工具,可在www.snapbug.net下载)按照部分的JDBC规范,实现了连接池所具备的对数据库资源有效管理功能。
    3.1 体系描述
    在JDBC规范中,应用通过驱动接口(Driver Interface)直接方法数据库的资源。为了有效、合理地管理资源,在应用与JDBC Driver之间,增加了连接池: Snap-ConnectionPool。并且通过面向对象的机制,使连接池的大部分操作是透明的。参见下图,Snap-ConnectionPool的体系:

    图中所示,通过实现JDBC的部分资源对象接口( Connection, Statement, ResultSet ),在 Snap-ConnectionPool内部分别产生三种逻辑资源对象: PooledConnection, PooledStatement和 PooledResultSet。它们也是连接池主要的管理操作对象,并且继承了JDBC中相应的从属关系。这样的体系有以下几个特点:
    — 透明性。在不改变应用原有的使用JDBC驱动接口的前提下,提供资源管理的服务。应用系统,如同原有的 JDBC,使用连接池提供的逻辑对象资源。简化了应用程序的连接池改造。
    — 资源封装。复杂的资源管理被封装在 Snap-ConnectionPool内部,不需要应用系统过多的干涉。管理操作的可靠性、安全性由连接池保证。应用的干涉(如:主动关闭资源),只起到优化系统性能的作用,遗漏操作不会带来负面影响。
    — 资源合理应用。按照JDBC中资源的从属关系,Snap-ConnectionPool不仅对Connection进行缓冲处理,对Statement也有相应的机制处理。在2.3已描述,合理运用Connection和Statement之间的关系,可以更大限度地使用资源。所以,Snap- ConnectionPool封装了Connection资源,通过内部管理PooledConnection,为应用系统提供更多的Statement 资源。
    — 资源连锁管理。Snap-ConnectionPool包含的三种逻辑对象,继承了JDBC中相应对象之间的从属关系。在内部管理中,也依照从属关系进行连锁管理。例如:判断一个Connection是否超时,需要根据所包含的Statement是否活跃;判断Statement也要根据 ResultSet的活跃程度。

    3.2 连接池集中管理ConnectionManager
    ConnectionPool是Snap-ConnectionPool的连接池对象。在Snap-ConnectionPool内部,可以指定多个不同的连接池(ConnectionPool)为应用服务。ConnectionManager管理所有的连接池,每个连接池以不同的名称区别。通过配置文件适应不同的数据库种类。如下图所示:

      通过ConnectionManager,可以同时管理多个不同的连接池,提供通一的管理界面。在应用系统中通过 ConnectionManager和相关的配置文件,可以将凌乱散落在各自应用程序中的数据库配置信息(包括:数据库名、用户、密码等信息),集中在一个文件中。便于系统的维护工作。

      3.3 连接池使用范例

      对2.1的标准JDBC的使用范例,改为使用连接池,结果如下:

    import java.sql.*;
    import net.snapbug.util.dbtool.*;

    ..ConnectionPool dbConn = ConnectionManager
    .getConnectionPool("testOracle" );
    Statement st = dbConn.createStatement();
    ResultSet rs = st.executeQuery(
    “select * from demo_table” );

    some data source operation
    in herers.close();st.close();

      在例子中,Snap-ConnectionPool封装了应用对Connection的管理。只要改变JDBC获取Connection的方法,为获取连接池(ConnectionPool)(粗体部分),其他的数据操作都可以不做修改。按照这样的方式,Snap- ConnectionPool可帮助应用有效地管理数据库资源。如果应用忽视了最后资源的释放: rs.close() 和 st.close(),连接池会通过超时(time-out)机制,自动回收。

      4.小结

      无论是Snap-ConnectionPool还是其他的数据库连接池,都应当具备一下基本功能:

      -对源数据库资源的保护

      -充分利用发挥数据库的有效资源

      -简化应用的数据库接口,封闭资源管理。

      -对应用遗留资源的自动回收和整理,提高资源的再次利用率。

      在这个前提下,应用程序才能投入更多的精力于各自的业务逻辑中。数据库资源也不再成为系统的瓶颈。

Open Toolbar