Existe alguma diferença entre GROUP BY e DISTINCT

310

Aprendi algo simples sobre SQL outro dia:

SELECT c FROM myTbl GROUP BY C

Tem o mesmo resultado que:

SELECT DISTINCT C FROM myTbl

O que eu estou curioso é que existe algo diferente na maneira como um mecanismo SQL processa o comando, ou eles são realmente a mesma coisa?

Pessoalmente, prefiro a sintaxe distinta, mas tenho certeza de que é mais um hábito do que qualquer outra coisa.

EDIT: Esta não é uma pergunta sobre agregados. O uso de GROUP BYcom funções agregadas é entendido.

Brettski
fonte
11
Isto não é uma questão sobre os agregados, é um GROUP BY funcionamento o mesmo que uma distinta quando nenhuma função agregada está presente
Brettski
2
Você também pode SELECT c FROM myTbl UNION SELECT c FROM myTblobter e obter o mesmo resultado ... Mas por que complicar as coisas quando SELECT DISTINCT é tão fácil?
jarlh
A 'ordem lógica de execução' de GROUP BYé muito anterior a 'SELECT' e DISTINCTsegue a seleção.
Used_By_Already
Uma diferença muito pequena que não vi mencionada é que DISTINCTresulta na seleção do campo - ou seja, o valor aparecerá no conjunto de resultados. GROUP BYpode efetivamente remover duplicatas sem realmente selecionar o campo. Isso é um tanto irrelevante na maioria dos casos, mas pode ser exatamente o que você deseja nos outros. Se você acabar usando GROUP BYno lugar de DISTINCT, provavelmente é necessário um comentário explicativo no código.
Rinogo 1/05/19
A conclusão é que, como a remoção duplicada ocorre em diferentes pontos do plano de execução, uma pode ser mais eficiente que a outra, porque a remoção dup exige uma classificação ou talvez o uso desse índice sobre esse índice. Portanto, pode haver uma vantagem na remoção precoce de dup ou a vantagem pode advir do uso de um índice diferente no início e de uma classificação mais tarde, quando houver poucas linhas restantes e a classificação for insignificante.
Bielawski

Respostas:

246

A resposta da MusiGenesis é funcionalmente a correta em relação à sua pergunta, conforme indicado; o SQL Server é inteligente o suficiente para perceber que, se você estiver usando "Agrupar por" e não usar nenhuma função agregada, o que você realmente quer dizer é "Distinto" - e, portanto, gera um plano de execução como se você tivesse simplesmente usado "Distinct . "

No entanto, acho importante observar a resposta de Hank - o tratamento descuidado de "Group By" e "Distinct" pode levar a algumas dicas perniciosas, se você não tomar cuidado. Não é totalmente correto dizer que "essa não é uma pergunta sobre agregados", porque você está perguntando sobre a diferença funcional entre duas palavras-chave de consulta SQL, uma das quais deve ser usada com agregados e a outra não.

Um martelo pode funcionar para parafusar algumas vezes, mas se você tem uma chave de fenda à mão, por que se preocupar?

(para os fins desta analogia, Hammer : Screwdriver :: GroupBy : Distincte screw => get list of unique values in a table column)

Skeolan
fonte
Estou de pleno acordo com você, Skeolan. Fiquei bastante surpreso quando me deparei com essa funcionalidade. Não é algo que pretendo usar, mas uma maneira de fazer as coisas neste novo local em que estou trabalhando.
Brettski 2/10/08
Pelo menos no Oracle 12, parece haver casos em que DISTINCT, obtendo valores distintos por UNION e GROUP BY, funciona de maneira diferente. Acabei de ter um caso hoje cedo em que DISTINCT e distinto por UNION causa um erro do oracle, mas GROUP BY funcionou; Eu selecionava apenas uma coluna de uma visualização e não usava nenhuma agregação; Ainda estou confuso por que isso exigia, mas confirma que há alguma diferença na execução. Como outros apontam, ele também permite que você agrupe colunas que não estão no select, embora isso raramente seja necessário sem agregação.
ZeroK
1
Quando se trata de SQL, você sempre tem uma chave de fenda e um martelo disponíveis. Por que usar um martelo para acionar um parafuso?
Julio
Só para esclarecer sua analogia - o seu martelo == GroupBy e a chave de fenda == são distintos neste caso?
HopeKing
Uau, essa pergunta de dez anos ainda tem pernas! "Distinta" é a chave de fenda, se "lista de valores únicos" for o parafuso. Vou atualizar a resposta para tornar a analogia mais clara.
Skeolan
136

GROUP BYpermite usar funções agregadas, como AVG, MAX, MIN, SUM, e COUNT. Por outro lado, DISTINCTapenas remove duplicatas.

Por exemplo, se você possui vários registros de compras e deseja saber quanto foi gasto por cada departamento, faça algo como:

SELECT department, SUM(amount) FROM purchases GROUP BY department

Isso fornecerá uma linha por departamento, contendo o nome do departamento e a soma de todos os amountvalores em todas as linhas para esse departamento.

Andru Luvisi
fonte
2
O uso de GROUP BY, eu entendo, A questão é baseada no fato de que ele retorna um conjunto de dados distinto quando nenhuma função agregada está presente.
Brettski 2/10/08
2
Porque GROUP BY faz implicitamente um DISTINCT sobre os valores da coluna pela qual você está agrupando (desculpe a cacofonia).
Joe Pineda
Não é possível usar DISTINCT+ funções agregadas? assim:select distinct department, SUM(amount) from ...
Shafizadeh
@ Saraj, você pode fazer isso sim, mas ainda precisa ter o GROUP BY, para que o DISTINCT não faça nada por você.
ZeroK 17/09/2015
40

Qual é a diferença de um mero ponto de vista da funcionalidade de remoção duplicada

Além do fato de que DISTINCT, diferentemente , GROUP BYpermite agregar dados por grupo (que já foi mencionado por muitas outras respostas), a diferença mais importante na minha opinião é o fato de as duas operações "acontecerem" em duas etapas muito diferentes na ordem lógica. de operações que são executadas em uma SELECTinstrução .

Aqui estão as operações mais importantes:

  • FROM(incluindo JOIN, APPLYetc.)
  • WHERE
  • GROUP BY (pode remover duplicatas)
  • Agregações
  • HAVING
  • Funções da janela
  • SELECT
  • DISTINCT (pode remover duplicatas)
  • UNION, INTERSECT, EXCEPT (Pode remover duplicados)
  • ORDER BY
  • OFFSET
  • LIMIT

Como você pode ver, a ordem lógica de cada operação influencia o que pode ser feito com ela e como ela influencia as operações subseqüentes. Em particular, o fato de a GROUP BYoperação "acontecer antes" da SELECToperação (a projeção) significa que:

  1. Não depende da projeção (o que pode ser uma vantagem)
  2. Ele não pode usar nenhum valor da projeção (o que pode ser uma desvantagem)

1. Não depende da projeção

Um exemplo em que não é útil depender da projeção é se você deseja calcular as funções da janela em valores distintos:

SELECT rating, row_number() OVER (ORDER BY rating) AS rn
FROM film
GROUP BY rating

Quando executado no banco de dados Sakila , isso gera:

rating   rn
-----------
G        1
NC-17    2
PG       3
PG-13    4
R        5

O mesmo não poderia ser alcançado com DISTINCTfacilidade:

SELECT DISTINCT rating, row_number() OVER (ORDER BY rating) AS rn
FROM film

Essa consulta está "errada" e produz algo como:

rating   rn
------------
G        1
G        2
G        3
...
G        178
NC-17    179
NC-17    180
...

Não é isso que queríamos. A DISTINCToperação "acontece depois" da projeção, portanto não podemos mais remover DISTINCTclassificações porque a função da janela já foi calculada e projetada. Para usar DISTINCT, teríamos que aninhar essa parte da consulta:

SELECT rating, row_number() OVER (ORDER BY rating) AS rn
FROM (
  SELECT DISTINCT rating FROM film
) f

Nota lateral: Nesse caso em particular, também poderíamos usarDENSE_RANK()

SELECT DISTINCT rating, dense_rank() OVER (ORDER BY rating) AS rn
FROM film

2. Ele não pode usar nenhum valor da projeção

Uma das desvantagens do SQL é sua verbosidade às vezes. Pelo mesmo motivo que vimos antes (a ordem lógica das operações), não podemos "facilmente" agrupar por algo que estamos projetando.

Este é SQL inválido:

SELECT first_name || ' ' || last_name AS name
FROM customer
GROUP BY name

Isso é válido (repetindo a expressão)

SELECT first_name || ' ' || last_name AS name
FROM customer
GROUP BY first_name || ' ' || last_name

Isso também é válido (aninhando a expressão)

SELECT name
FROM (
  SELECT first_name || ' ' || last_name AS name
  FROM customer
) c
GROUP BY name

Eu escrevi sobre esse tópico com mais profundidade em uma postagem no blog

Lukas Eder
fonte
Fiquei sinceramente surpreso ao ver que a ordem de execução não foi discutida imediatamente sobre essa questão. Obrigado, muito bem explicado também. No seu ponto 2. alguns (um?) Banco de dados permitem o uso de aliases selecionados em toda a consulta (o que eu conheço é o Teradata, mas é uma exceção).
Used_By_Already
@Used_By_Already: Claro, alguns bancos de dados fazem isso. Muitos bancos de dados permitem o uso desses aliases apenas em partes (por exemplo, não WHEREmas talvez GROUP BY). De qualquer forma, acho uma péssima idéia e sugiro nunca usar esse recurso por motivos de portabilidade e manutenção. "De repente", não funcionará mais, por exemplo, ao criar um atalho para uma função agregada ou função de janela.
Lukas Eder #
never using that feature for portability and maintenance reasons!! concordou 100% ... e agora estou curtindo seu blog também, ótimo trabalho. Felicidades.
Used_By_Already
32

Use DISTINCTse você quiser apenas remover duplicatas. Use GROUPY BYse você deseja aplicar operadores de agregação ( MAX, SUM, GROUP_CONCAT, ..., ou de uma HAVINGcláusula).

jkramer
fonte
19

Espero que exista a possibilidade de diferenças sutis em sua execução. Eu verifiquei os planos de execução para duas consultas funcionalmente equivalentes ao longo destas linhas no Oracle 10g:

core> select sta from zip group by sta;

---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |    58 |   174 |    44  (19)| 00:00:01 |
|   1 |  HASH GROUP BY     |      |    58 |   174 |    44  (19)| 00:00:01 |
|   2 |   TABLE ACCESS FULL| ZIP  | 42303 |   123K|    38   (6)| 00:00:01 |
---------------------------------------------------------------------------

core> select distinct sta from zip;

---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |    58 |   174 |    44  (19)| 00:00:01 |
|   1 |  HASH UNIQUE       |      |    58 |   174 |    44  (19)| 00:00:01 |
|   2 |   TABLE ACCESS FULL| ZIP  | 42303 |   123K|    38   (6)| 00:00:01 |
---------------------------------------------------------------------------

A operação intermediária é um pouco diferente: "HASH GROUP BY" vs. "HASH UNIQUE", mas os custos estimados etc. são idênticos. Em seguida, eu os executei com o rastreamento ativado e a contagem real de operações foi a mesma para ambos (exceto que o segundo não precisou fazer nenhuma leitura física devido ao armazenamento em cache).

Mas acho que, como os nomes das operações são diferentes, a execução seguiria caminhos de código um tanto diferentes e isso abre a possibilidade de diferenças mais significativas.

Eu acho que você deve preferir a sintaxe DISTINCT para esse fim. Não é apenas um hábito, indica mais claramente o objetivo da consulta.

Dave Costa
fonte
14

Para a consulta que você postou, eles são idênticos. Mas para outras consultas que podem não ser verdadeiras.

Por exemplo, não é o mesmo que:

SELECT C FROM myTbl GROUP BY C, D
Joel Coehoorn
fonte
14

Li todos os comentários acima, mas não vi ninguém apontar para a principal diferença entre Agrupar por e Distinto além do bit de agregação.

Distinct retorna todas as linhas e as desduplica, enquanto Group By desduplicata as linhas conforme elas são lidas pelo algoritmo, uma a uma.

Isso significa que eles podem produzir resultados diferentes!

Por exemplo, os códigos abaixo geram resultados diferentes:

SELECT distinct ROW_NUMBER() OVER (ORDER BY Name), Name FROM NamesTable

 SELECT ROW_NUMBER() OVER (ORDER BY Name), Name FROM NamesTable
GROUP BY Name

Se houver 10 nomes na tabela em que 1 deles é uma duplicata de outro, a primeira consulta retornará 10 linhas, enquanto a segunda consulta retornará 9 linhas.

A razão é o que eu disse acima para que eles possam se comportar de maneira diferente!

A luz
fonte
11
Isso ocorre porque, embora você esteja apenas agrupando Namena segunda consulta, a distinctpalavra - chave se aplica às colunas Namee à sua ROW_NUMBER()coluna na selectcláusula da primeira consulta. Se você também agrupasse a primeira coluna na segunda consulta, as consultas teriam retornado os mesmos resultados.
Este é um resultado da order of executiondas cláusulas SQL que é (de um modo geral) FROM and ON (joins), WHERE, GROUP BY, HAVING, SELECT, DISTINCT, ORDER BY, LIMIT / OFFSET / TOPde modo que a segunda consulta os nomes são reduzidos em número por grupo e mais tarde o row_number () é aplicada, resultando em uma fileira por nome exclusivo. Na primeira consulta, row_number () é aplicado antes que o distinto seja aplicado e, devido à natureza da função row_number (), cada linha obtém um número inteiro exclusivo; portanto, cada linha é retornada, mesmo que haja valores de nome repetidos.
Used_By_Already
12

Se você usar DISTINCT com várias colunas, o conjunto de resultados não será agrupado como em GROUP BY e você não poderá usar funções agregadas com DISTINCT.

Bill the Lizard
fonte
11

Eles têm semânticas diferentes, mesmo que tenham resultados equivalentes em seus dados específicos.

Hank Gay
fonte
6

GROUP BY tem um significado muito específico que é distinto (heh) da função DISTINCT.

GROUP BY faz com que os resultados da consulta sejam agrupados usando a expressão escolhida, as funções agregadas podem ser aplicadas e elas atuarão em cada grupo, e não no conjunto de resultados inteiro.

Aqui está um exemplo que pode ajudar:

Dada uma tabela que se parece com isso:

name
------
barry
dave
bill
dave
dave
barry
john

Esta consulta:

SELECT name, count(*) AS count FROM table GROUP BY name;

Produzirá resultados como este:

name    count
-------------
barry   2
dave    3
bill    1
john    1

O que é obviamente muito diferente do uso do DISTINCT. Se você deseja agrupar seus resultados, use GROUP BY, se você quiser apenas uma lista exclusiva de uma coluna específica, use DISTINCT. Isso dará ao seu banco de dados a chance de otimizar a consulta para suas necessidades.

Dan
fonte
6

Por favor, não use GROUP BY quando você quer dizer DISTINCT, mesmo que funcione da mesma forma. Suponho que você esteja tentando economizar milissegundos de consultas e preciso ressaltar que o tempo do desenvolvedor é de magnitude superior ao do computador.

Andy Lester
fonte
5

Se você estiver usando um GROUP BY sem nenhuma função agregada, internamente ele será tratado como DISTINCT, portanto, neste caso, não haverá diferença entre GROUP BY e DISTINCT.

Mas quando você recebe a cláusula DISTINCT, é melhor usá-la para encontrar seus registros exclusivos, porque o objetivo do GROUP BY é obter agregação.

Vikram Mahapatra
fonte
4

agrupar por é usado em operações agregadas - como quando você deseja obter uma contagem de Bs discriminada pela coluna C

select C, count(B) from myTbl group by C

distinto é o que parece - você obtém linhas únicas.

No sql server 2005, parece que o otimizador de consultas é capaz de otimizar a diferença nos exemplos simplistas que eu executei. Não sei se você pode contar com isso em todas as situações.

Danimal
fonte
3

Nessa consulta em particular, não há diferença. Mas, é claro, se você adicionar alguma coluna agregada, precisará usar o agrupar por.

Jeffrey L Whitledge
fonte
3

Na perspectiva do Teradata :

Do ponto de vista do conjunto de resultados, não importa se você usa DISTINCT ou GROUP BY no Teradata. O conjunto de respostas será o mesmo.

Do ponto de vista do desempenho, não é o mesmo.

Para entender o que afeta o desempenho, você precisa saber o que acontece no Teradata ao executar uma instrução com DISTINCT ou GROUP BY.

No caso de DISTINCT, as linhas são redistribuídas imediatamente sem que ocorra qualquer pré-agregação, enquanto no caso de GROUP BY, em uma primeira etapa, é feita uma pré-agregação e somente então os valores exclusivos são redistribuídos nos AMPs.

Não pense agora que o GROUP BY é sempre melhor do ponto de vista do desempenho. Quando você tem muitos valores diferentes, a etapa de pré-agregação do GROUP BY não é muito eficiente. O Teradata precisa classificar os dados para remover duplicatas. Nesse caso, pode ser melhor primeiro a redistribuição, ou seja, use a instrução DISTINCT. Somente se houver muitos valores duplicados, a instrução GROUP BY provavelmente será a melhor escolha, pois somente quando a etapa de deduplicação ocorrer, após a redistribuição.

Em resumo, DISTINCT x GROUP BY em Teradata significa:

GRUPO POR -> para muitas duplicatas DISTINCT -> nenhuma ou apenas algumas duplicatas. Às vezes, ao usar DISTINCT, você fica sem espaço em spool em um AMP. O motivo é que a redistribuição ocorre imediatamente, e a inclinação pode fazer com que os AMPs fiquem sem espaço.

Se isso acontecer, você provavelmente terá uma chance melhor com o GROUP BY, pois as duplicatas já foram removidas em uma primeira etapa e menos dados são movidos pelos AMPs.

Ram Ghadiyaram
fonte
O que é Teradata?
precisa
O Teradata é um Sistema de Gerenciamento de Banco de Dados Relacional (RDBMS), capaz de suportar muitos usuários simultâneos de várias plataformas de clientes. O Teradata é compatível com o padrão ANSI e construído completamente na arquitetura paralela.
Ram Ghadiyaram
2

Do ponto de vista do 'SQL the language', as duas construções são equivalentes e qual delas você escolhe é uma daquelas escolhas de 'estilo de vida' que todos temos que fazer. Eu acho que há um bom argumento para DISTINCT ser mais explícito (e, portanto, é mais atencioso com a pessoa que herdará seu código etc.), mas isso não significa que a construção GROUP BY seja uma opção inválida.

Eu acho que esse 'GROUP BY é para agregados' é a ênfase errada. As pessoas devem estar cientes de que a função definida (MAX, MIN, COUNT, etc) pode ser omitida para que eles possam entender a intenção do codificador quando isso ocorre.

O otimizador ideal reconhecerá construções SQL equivalentes e sempre escolherá o plano ideal de acordo. Para o mecanismo SQL de sua escolha na vida real, você deve testar :)

PS observe que a posição da palavra-chave DISTINCT na cláusula select pode produzir resultados diferentes, por exemplo, contraste:

SELECT COUNT(DISTINCT C) FROM myTbl;

SELECT DISTINCT COUNT(C) FROM myTbl;
um dia quando
fonte
1

Você só percebe isso porque está selecionando uma única coluna.

Tente selecionar dois campos e veja o que acontece.

O Group By deve ser usado assim:

SELECT name, SUM(transaction) FROM myTbl GROUP BY name

O que mostraria a soma de todas as transações para cada pessoa.

Chris Cudmore
fonte
Esta não é uma questão de agregados. No seu exemplo, SELECT c, d FROM mytbl GROUP BY C, D; de fato, retornará o mesmo conjunto de dados que SELECT DISTINCT C, D FROM mytbl; Este é os fundamentos da questão
Brettski
1

Eu sei que é um post antigo. Mas acontece que eu tive uma consulta que usou group apenas para retornar valores distintos ao usar essa consulta nos relatórios do toad e do oracle tudo funcionou bem, quero dizer um bom tempo de resposta. Quando migramos do Oracle 9i para 11g, o tempo de resposta no Toad foi excelente, mas, no relato, demorou cerca de 35 minutos para concluir o relatório ao usar a versão anterior, demorou cerca de 5 minutos.

A solução foi alterar o grupo e usar DISTINCT e agora o relatório é executado em cerca de 30 segundos.

Espero que isso seja útil para alguém com a mesma situação.

Gabriel
fonte
1

Em termos de uso, GROUP BY é usado para agrupar as linhas que você deseja calcular. DISTINCT não fará nenhum cálculo. Não mostrará linhas duplicadas.

Eu sempre usei DISTINCT se quiser apresentar dados sem duplicatas.

Se eu quiser fazer cálculos como resumir a quantidade total de mangas, usarei GROUP BY

Felix Labayen
fonte
0

A maneira como eu sempre entendi é que usar o distinto é o mesmo que agrupar por todos os campos selecionados na ordem em que foram selecionados.

ou seja:

select distinct a, b, c from table;

é o mesmo que:

select a, b, c from table group by a, b, c
Zenshai
fonte
Concordou, mas seria mesmo que selecione c, b, um grupo da tabela por a, b, c
Dheer
Sim, seria o mesmo
Caio Jard
0

A eficiência funcional é totalmente diferente. Se você deseja selecionar apenas "valor de retorno", exceto o duplicado, usar distinto é melhor do que agrupar por. Como "agrupar por" inclui (classificação + remoção), "distinto" inclui (remoção)

Jun
fonte
0

Às vezes, eles podem fornecer os mesmos resultados, mas devem ser usados ​​em diferentes sentidos / casos. A principal diferença está na sintaxe.

Observe minuciosamente o exemplo abaixo. DISTINCTé usado para filtrar o conjunto duplicado de valores. (6, cs, 9.1) e (1, cs, 5.5) são dois conjuntos diferentes. Então, DISTINCTele exibirá as duas linhas enquanto GROUP BY Branchexibirá apenas um conjunto.

 SELECT * FROM student; 
+------+--------+------+
| Id   | Branch | CGPA |
+------+--------+------+
|    3 | civil  |  7.2 |
|    2 | mech   |  6.3 |
|    6 | cs     |  9.1 |
|    4 | eee    |  8.2 |
|    1 | cs     |  5.5 |
+------+--------+------+
5 rows in set (0.001 sec)

SELECT DISTINCT * FROM student; 
+------+--------+------+
| Id   | Branch | CGPA |
+------+--------+------+
|    3 | civil  |  7.2 |
|    2 | mech   |  6.3 |
|    6 | cs     |  9.1 |
|    4 | eee    |  8.2 |
|    1 | cs     |  5.5 |
+------+--------+------+
5 rows in set (0.001 sec)

SELECT * FROM student GROUP BY Branch;
+------+--------+------+
| Id   | Branch | CGPA |
+------+--------+------+
|    3 | civil  |  7.2 |
|    6 | cs     |  9.1 |
|    4 | eee    |  8.2 |
|    2 | mech   |  6.3 |
+------+--------+------+
4 rows in set (0.001 sec)

Às vezes, os resultados que podem ser alcançados por GROUP BYcláusula não são possíveis comDISTINCT sem a utilização de cláusulas ou condições extras. Por exemplo, no caso acima.

Para obter o mesmo resultado, DISTINCTvocê deve passar todos os nomes de coluna na GROUP BYcláusula como abaixo. Então veja a diferença sintática. Você deve ter conhecimento sobre todos os nomes de colunas para usar a GROUP BYcláusula nesse caso.

SELECT * FROM student GROUP BY Id, Branch, CGPA;
+------+--------+------+
| Id   | Branch | CGPA |
+------+--------+------+
|    1 | cs     |  5.5 |
|    2 | mech   |  6.3 |
|    3 | civil  |  7.2 |
|    4 | eee    |  8.2 |
|    6 | cs     |  9.1 |
+------+--------+------+

Também notei GROUP BYexibe os resultados em ordem crescente por padrão, o que DISTINCTnão ocorre. Mas não tenho certeza disso. Pode ser diferente em relação ao fornecedor.

Fonte: https://dbjpanda.me/dbms/languages/sql/sql-syntax-with-examples#group-by

SkyRar
fonte
0

Geralmente, podemos usar DISTINCTpara eliminar as duplicatas na coluna específica da tabela.

Em caso de 'GROUP BY' Podemos aplicar as funções de agregação, como AVG, MAX, MIN, SUM, e COUNTna coluna específica e buscar o nome da coluna e agregação resultado da função na mesma coluna.

Exemplo:

select  specialColumn,sum(specialColumn) from yourTableName group by specialColumn;
Lova Chittumuri
fonte
-1

Não há diferença significativa entre agrupar por e cláusula distinta, exceto o uso de funções agregadas. Ambos podem ser usados ​​para distinguir os valores, mas se no ponto de vista do desempenho, agrupar por é melhor. Quando uma palavra-chave distinta é usada, internamente, é usada uma operação de classificação que pode ser visualizada no plano de execução.

Experimente um exemplo simples

Declarar @tmpresult table (ID tinyint)

Inserir em @tmpresult Selecionar 5 União tudo Selecionar 2 União tudo Selecionar 3 União tudo Selecionar 4

Selecionar ID diferente de @tmpresult

Vinod Narwal
fonte
distinto e grupo por ambos vontade
vignesh