Como encontro valores duplicados em uma tabela no Oracle?

277

Qual é a instrução SQL mais simples que retornará os valores duplicados para uma determinada coluna e a contagem de ocorrências em uma tabela de banco de dados Oracle?

Por exemplo: eu tenho uma JOBStabela com a coluna JOB_NUMBER. Como posso descobrir se tenho duplicados se JOB_NUMBERquantas vezes eles são duplicados?

Andrew
fonte
1
outras soluções stackoverflow.com/questions/4522431/…
zloctb

Respostas:

610
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;
Bill the Lizard
fonte
1
Obrigado - essa é a resposta que acabei de encontrar e você me venceu em publicá-la aqui! : o)
Andrew
3
De nada. Agora estou prestes a postar minha própria pergunta sobre as diferenças entre count (coluna) e count (*). :)
Bill the Lizard
44
1 mais de 4 anos mais tarde, ainda funciona bem, e pode ser ajustado para a selecção de várias colunas, desde que aqueles também são no group by, tal como em: select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1;etc
Amos M. Carpenter
4
ou mesmo having count(*) > 1: D
Stanislav Mamontov 23/03
3
+1 mais de 8 anos depois, ainda funciona bem para as versões mais recentes do Oracle e MySQL (remova o espaço após a função de contagem na linha).
PhatHV
58

Outra maneira:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Funciona bem (rápido o suficiente) quando o índice está ativado column_name. E é a melhor maneira de excluir ou atualizar linhas duplicadas.

Grrey
fonte
3
O +1 funciona bem para duplicatas com várias colunas (por exemplo, quando você deseja adicionar uma restrição UNIQUE em várias colunas), achei essa abordagem menos "rígida" que a GROUP BY para listar os valores dos campos duplicados + outros campos, se necessário.
Frosty Z
3
Apenas para esclarecer, (isso não me era óbvio a princípio), essa consulta retorna apenas as duplicatas, não retorna a primeira entrada original, e é por isso que funciona bem para excluir as duplicatas, com base em uma restrição única em mais de 1 coluna. Você pode selecionar os IDs duplicados com esta consulta e usá-los para excluir os duplicados.
matthewb
1
se você alterar <para! =, receberá todos os registros duplicados. não apenas o 2º ou o 3º registro
moore1emu
33

Mais simples que consigo pensar:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;
JosephStyons
fonte
1
Como posso obter todas as colunas?
Asif Mushtaq
2
Selecione * de postos de trabalho onde número_da_tarefa em (número_da_tarefa seleto de grupo empregos pela contagem número_da_tarefa ter (*)> 1)
JosephStyons
17

Você nem precisa ter a contagem nas colunas retornadas se não precisar saber o número real de duplicatas. por exemplo

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1
Evan
fonte
7

E se:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Para responder o exemplo acima, seria semelhante a:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;
Andrew
fonte
5

No caso de várias colunas identificarem uma linha exclusiva (por exemplo, tabela de relações), você poderá usar as seguintes

Use o ID da linha, por exemplo, emp_dept (empid, deptid, startdate, enddate) suponha que empid e deptid sejam exclusivos e identifiquem a linha nesse caso

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

e se essa tabela tiver chave primária, use chave primária em vez de rowid, por exemplo, id é pk,

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
Jitendra Vispute
fonte
4

Fazendo

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

fornecerá os IDs das linhas duplicadas.

agnul
fonte
4
SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 
Wahid Haidari
fonte
2

Eu costumo usar a função Oracle Analytic ROW_NUMBER () .

Digamos que você queira verificar as duplicatas que você tem sobre um índice exclusivo ou chave primária construído sobre colunas ( c1, c2, c3). Então você seguirá esse caminho, exibindo ROWIDs de linhas onde o número de linhas trazidas ROW_NUMBER()é >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)
J. Chomel
fonte
1

Aqui está uma solicitação SQL para fazer isso:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;
Chaminda Dilshan
fonte
1

Eu sei que é um tópico antigo, mas isso pode ajudar alguém.

Se você precisar imprimir outras colunas da tabela enquanto verifica o uso duplicado abaixo:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

também pode adicionar alguns filtros adicionais na cláusula where, se necessário.

Parth Kansara
fonte
0

1. solução

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);
Faz ou morre
fonte
Este pôster original nunca mencionou a exclusão, apenas a contagem #
1010 Jeff Jeff
-1

Também você pode tentar algo assim para listar todos os valores duplicados em uma tabela, digamos reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;
Stacker
fonte