PostgreSQL unnest () com número de elemento

90

Quando tenho uma coluna com valores separados, posso usar a unnest()função:

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

Como posso incluir números de elemento? Ie:

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

Eu quero a posição original de cada elemento na string de origem. Eu tentei com funções de janela ( row_number(), rank()etc.), mas sempre consigo 1. Talvez porque eles estão na mesma linha da tabela de origem?

Eu sei que é um projeto de mesa ruim. Não é meu, só estou tentando consertar.

BartekR
fonte

Respostas:

184

Postgres 9.4 ou posterior

Use WITH ORDINALITYpara funções de retorno de conjunto:

Quando uma função na FROMcláusula é sufixada por WITH ORDINALITY, uma bigintcoluna é anexada à saída que começa em 1 e aumenta em 1 para cada linha da saída da função. Isso é mais útil no caso de funções de retorno de conjunto, como unnest().

Em combinação com o LATERALrecurso da página 9.3+ e de acordo com este tópico em pgsql-hackers , a consulta acima agora pode ser escrita como:

SELECT t.id, a.elem, a.nr
FROM   tbl AS t
LEFT   JOIN LATERAL unnest(string_to_array(t.elements, ','))
                    WITH ORDINALITY AS a(elem, nr) ON TRUE;

LEFT JOIN ... ON TRUEpreserva todas as linhas da tabela à esquerda, mesmo se a expressão da tabela à direita não retornar nenhuma linha. Se isso não for preocupante, você pode usar esta forma menos detalhada e equivalente com um implícito CROSS JOIN LATERAL:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

Ou mais simples se baseado em uma matriz real ( arrsendo uma coluna de matriz):

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

Ou ainda, com sintaxe mínima:

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

aé automaticamente um alias de tabela e coluna. O nome padrão da coluna de ordinalidade adicionada é ordinality. Mas é melhor (mais seguro, mais limpo) adicionar aliases de coluna explícitos e colunas de qualificação de tabela.

Postgres 8.4 - 9.3

Com row_number() OVER (PARTITION BY id ORDER BY elem)você obtém os números de acordo com a ordem de classificação, não o número ordinal da posição ordinal original na string.

Você pode simplesmente omitir ORDER BY:

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

Embora isso normalmente funcione e eu nunca tenha visto falha em consultas simples, o PostgreSQL não afirma nada sobre a ordem das linhas externas ORDER BY. Acontece que funciona devido a um detalhe de implementação.

Para garantir números ordinais de elementos na string separada por espaços em branco :

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

Ou mais simples se baseado em uma matriz real :

SELECT id, arr[nr] AS elem, nr
FROM  (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;

Resposta relacionada em dba.SE:

Postgres 8.1 - 8.4

Nenhum desses recursos estão disponíveis, ainda: RETURNS TABLE, generate_subscripts(), unnest(), array_length(). Mas isso funciona:

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

Observe em particular que o índice do array pode diferir das posições ordinais dos elementos. Considere esta demonstração com uma função estendida :

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
               , (2, '[5:7]={a,b,c}')
               , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

Comparar:

Erwin Brandstetter
fonte
10
Esta resposta é uma das respostas mais abrangentes em SO, em relação ao PostgreSQL. Obrigado Erwin.
Alexandros
Podemos adaptar a função unnest2 abaixo para um retorno de tabela real (não linhas falsas), nas novas versões da pg?
Peter Krauss
@ erwin-brandstetter, poderia explicar por que / se WITH ORDINALITYé preferível generate_subscripts()? Parece-me generate_subscripts()melhor, pois mostra a localização real do elemento no array. Isso é útil, por exemplo, ao atualizar a matriz ... devo usar no WITH ORDINALITYlugar?
losthorse
1
@losthorse: Eu gostaria de resumir assim: WITH ORDINALITYé a solução geral para obter números de linha para qualquer função de retorno de conjunto em uma consulta SQL. É a maneira mais rápida e confiável e também funciona perfeitamente para arrays 1-dimensionais e baseados em 1 (o padrão para arrays Postgres, considere isso ). Se você trabalha com qualquer outro tipo de arrays (a maioria das pessoas não trabalha) e realmente precisa preservar / trabalhar com os subscritos originais, esse generate_subscripts()é o caminho a seguir. Mas unnest()nivela tudo para começar ...
Erwin Brandstetter
1
@ z0r_ O manual: Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Erwin Brandstetter
9

Experimentar:

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

fonte
6

Use funções de geração de subscrito .
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

Por exemplo:

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

Mais simplesmente:

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;
YujiSoftware
fonte
3

Se a ordem do elemento não for importante, você pode

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a
Florin Ghita
fonte
0

unnest2() como exercício

Versões mais antigas antes da pg v8.4 precisam ser definidas pelo usuário unnest(). Podemos adaptar esta função antiga para retornar elementos com um índice:

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;
Peter Krauss
fonte
2
Isso não funcionaria antes da página v8.4, porque ainda não existe RETURNS TABLE. Acrescentei um capítulo à minha resposta discutindo uma solução.
Erwin Brandstetter
1
@ErwinBrandstetter, suas respostas são muito didáticas, e você está lapidando um texto de 4 anos atrás (!) ... Você está escrevendo um livro de PostgreSQL usando seus textos de SO? :-)
Peter Krauss de
Olá a todos, é um Wiki, vocês podem editar (!) ... Mas ok, corrigi setof record.
Peter Krauss