在SQL中删除重复记录(多种方法)

上一篇 / 下一篇  2008-04-02 09:48:47 / 个人分类:SQL

文章出处:http://www.pconline.com.cn/pcjob/other/data/others/0508/693592_1.html

学习sql有一段时间了,发现在我建了一个用来测试的表(没有建索引)中出现了许多的重复记录。后来总结了一些删除重复记录的方法,在Oracle中,可以通过唯一rowid实现删除重复记录;还可以建临时表来实现...这个只提到其中的几种简单实用的方法,希望可以和大家分享(以表employee为例)。

SQL>descemployee

 Name                                      Null?    Type
 ----------------------------------------- -------- ------------------

emp_id                                                NUMBER(10)
emp_name                                           VARCHAR2(20)

salary                                                 NUMBER(10,2)

 

可以通过下面的语句查询重复的记录:

SQL>select*fromemployee;

   EMP_ID EMP_NAME                                 SALARY

---------- ---------------------------------------- ----------

        1 sunshine                                     10000

        1 sunshine                                     10000

        2 semon                                        20000

        2 semon                                        20000

        3 xyz                                          30000

        2 semon                                        20000


SQL>
selectdistinct*fromemployee;

   EMP_ID EMP_NAME                                    SALARY

---------- ---------------------------------------- ----------

        1 sunshine                                     10000

        2 semon                                        20000

        3 xyz                                            30000

SQL> select*fromemployeegroupbyemp_id,emp_name,salaryhavingcount(*)>1

   EMP_ID EMP_NAME                                    SALARY

---------- ---------------------------------------- ----------

        1 sunshine                                     10000

        2 semon                                         20000


SQL>
select*fromemployee e1

whererowidin(selectmax(rowid)fromemploye e2
 
wheree1.emp_id=e2.emp_idand

 e1.emp_name=e2.emp_nameande1.salary=e2.salary);

 

   EMP_ID EMP_NAME                                    SALARY

---------- ---------------------------------------- ----------

        1 sunshine                                     10000

        3 xyz                                           30000

        2 semon                                        20000

2.删除的几种方法:

1)通过建立临时表来实现

SQL>create table temp_emp as (select distinct * from employee) 

SQL>truncatetableemployee;(清空employee表的数据)

SQL>insertintoemployeeselect*fromtemp_emp; (再将临时表里的内容插回来)

( 2)通过唯一rowid实现删除重复记录.Oracle中,每一条记录都有一个rowidrowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、块、行上。在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大或最小rowid的就可以了,其余全部删除。

SQL>deletefromemployee e2whererowidnotin(
       
selectmax(e1.rowid)fromemployee e1 where

       e1.emp_id=e2.emp_idande1.emp_name=e2.emp_nameande1.salary=e2.salary);--这里用min(rowid)也可以。

SQL>deletefromemployee e2whererowid<(
       
selectmax(e1.rowid)fromemployee e1where
       e1.emp_id
=e2.emp_idande1.emp_name=e2.emp_nameand

                 e1.salary=e2.salary);

3)也是通过rowid,但效率更高。

SQL>deletefromemployeewhererowidnotin(
       
selectmax(t1.rowid)fromemployee t1groupby

        t1.emp_id,t1.emp_name,t1.salary);--这里用min(rowid)也可以。

   EMP_ID EMP_NAME                                    SALARY

---------- ---------------------------------------- ----------

        1 sunshine                                     10000

        3 xyz                                           30000

        2 semon                                        20000

 

SQL>descemployee

 Name                                      Null?    Type
 ----------------------------------------- -------- ------------------

emp_id                                                NUMBER(10)
emp_name                                           VARCHAR2(20)

salary                                                 NUMBER(10,2)


TAG: SQL

 

评分:0

我来说两句

Open Toolbar