Remover elementos duplicados da matriz no Ruby

325

Eu tenho uma matriz Ruby que contém elementos duplicados.

array = [1,2,2,1,4,4,5,6,7,8,5,6]

Como posso remover todos os elementos duplicados dessa matriz, mantendo todos os elementos exclusivos sem usar for-loops e iteração?

Mithun Sasidharan
fonte

Respostas:

722
array = array.uniq

uniq remove todos os elementos duplicados e mantém todos os elementos exclusivos na matriz.

Essa é uma das muitas belezas da linguagem Ruby.

Mithun Sasidharan
fonte
50
não, o uniq! O método retornará nulo se a matriz ainda fosse única. Ex: a = [1,2,3,4] a.uniq -> [1,2,3,4] mas a.uniq! -> nil
duykhoa
15
eu realmente não veria isso como uma beleza da linguagem ruby ​​... é apenas a beleza da biblioteca padrão de ruby? não me interpretem mal, há muitas coisas bonitas sobre o idioma.
Justin L.
7
escreva o mesmo em Objective-C, Javascript e PHP. Então nos diga que Ruby não é uma linguagem bonita!
Adam Waite
3
Isso também funciona para tipos complexos: [{how: "are"}, {u:"doing"}, {how: "are"}].uniq => [{:how=>"are"}, {:u=>"doing"}]
Blaskovicz
5
sobre o que @duykhoa diz, o uniq! método retorna nulo, mas você geralmente não se preocupam com o retorno de um .uniq!que faz o trabalho no próprio objeto
carpinchosaurio
82

Você pode retornar o cruzamento.

a = [1,1,2,3]
a & a

Isso também excluirá duplicatas.

jaredsmith
fonte
12
Funcionalmente, esta resposta está correta, mas acho que isso é notavelmente menos legível do que apenas usar o uniq.
Fiona T
21
Eu estava colocando aqui para que quem visita esta página também veja outras maneiras de fazê-lo, eu não estava tentando dizer que é melhor de alguma maneira.
jaredsmith
3
O motivo disso funcionar é porque, ao usar operações de conjunto, a matriz resultante é tratada como um conjunto, que é uma estrutura de dados que geralmente não possui valores de repetição. Usar a | a(união) faria o mesmo truque.
Cezar
47

Você pode remover os elementos duplicados com o método uniq:

array.uniq  # => [1, 2, 4, 5, 6, 7, 8]

O que também pode ser útil saber é que é uniqnecessário um bloco; portanto, se você tiver um conjunto de chaves:

["bucket1:file1", "bucket2:file1", "bucket3:file2", "bucket4:file2"]

e você deseja saber quais são os arquivos exclusivos, pode descobrir com:

a.uniq { |f| f[/\d+$/] }.map { |p| p.split(':').last }
Marek Příhoda
fonte
5
Estou um pouco confuso com isso. O bloco é usado se você precisar de sua própria função de comparação - no seu exemplo, enviar uniqpara essa matriz sem um bloco retornaria o mesmo valor que o seu bloco.
precisa saber é o seguinte
18

Apenas outra alternativa, se alguém se importa.

Você também pode usar o to_setmétodo de uma matriz que converte a matriz em um conjunto e, por definição, os elementos do conjunto são exclusivos.

[1,2,3,4,5,5,5,6].to_set => [1,2,3,4,5,6]
Finks
fonte
4
Se você se preocupa com a memória, to_setalocará 4 objetos, enquanto uniqaloca um.
Jan Klimo
18

Se alguém estava procurando uma maneira de remover todas as instâncias de valores repetidos, consulte " Como posso extrair eficientemente elementos repetidos em uma matriz Ruby? ".

a = [1, 2, 2, 3]
counts = Hash.new(0)
a.each { |v| counts[v] += 1 }
p counts.select { |v, count| count == 1 }.keys # [1, 3]
Lri
fonte
3
Ou poderia simplesmente fazer a = [1, 2, 2, 3] a.find_all { |x| a.count(x) == 1 } # [1, 3]
Tim Wright
A questão vinculada não é a mesma; Ele está perguntando como encontrar valores duplicados e devolvê-los. O OP deseja remover duplicatas.
o homem de lata
0

Apenas para fornecer algumas dicas:

require 'fruity'
require 'set'

array = [1,2,2,1,4,4,5,6,7,8,5,6] * 1_000

def mithun_sasidharan(ary)
  ary.uniq
end

def jaredsmith(ary)
  ary & ary
end

def lri(ary)
  counts = Hash.new(0)
  ary.each { |v| counts[v] += 1 }
  counts.select { |v, count| count == 1 }.keys 
end

def finks(ary)
  ary.to_set
end

def santosh_mohanty(ary)
    result = ary.reject.with_index do |ele,index|
      res = (ary[index+1] ^ ele)
      res == 0
    end
end

SHORT_ARRAY = [1,1,2,2,3,1]
mithun_sasidharan(SHORT_ARRAY) # => [1, 2, 3]
jaredsmith(SHORT_ARRAY) # => [1, 2, 3]
lri(SHORT_ARRAY) # => [3]
finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

puts 'Ruby v%s' % RUBY_VERSION

compare do
  _mithun_sasidharan { mithun_sasidharan(array) }
  _jaredsmith { jaredsmith(array) }
  _lri { lri(array) }
  _finks { finks(array) }
  _santosh_mohanty { santosh_mohanty(array) }
end

Que, quando executado, resulta em:

# >> Ruby v2.7.1
# >> Running each test 16 times. Test will take about 2 seconds.
# >> _mithun_sasidharan is faster than _jaredsmith by 2x ± 0.1
# >> _jaredsmith is faster than _santosh_mohanty by 4x ± 0.1 (results differ: [1, 2, 4, 5, 6, 7, 8] vs [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, ...
# >> _santosh_mohanty is similar to _lri (results differ: [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, ...
# >> _lri is similar to _finks (results differ: [] vs #<Set: {1, 2, 4, 5, 6, 7, 8}>)

Nota: estes retornaram resultados ruins:

  • lri(SHORT_ARRAY) # => [3]
  • finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
  • santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]
o homem de lata
fonte
-4

Tente usar o operador XOR, sem usar funções internas:

a = [3,2,3,2,3,5,6,7].sort!

result = a.reject.with_index do |ele,index|
  res = (a[index+1] ^ ele)
  res == 0
end

print result

Com funções integradas:

a = [3,2,3,2,3,5,6,7]

a.uniq
Santosh Mohanty
fonte
2
Não diminuí a votação e não sei quase nada sobre Ruby, mas .sort!também não é uma função embutida?
Carolus