Subseqüências envolventes

11

Introdução

Nesse desafio, sua tarefa é encontrar subsequências generalizadas de cadeias. As subsequências não são necessariamente contíguas e também podem "envolver" a cadeia, passando pelo final e iniciando novamente desde o início. Você vai querer minimizar o número de envoltórios.

Mais formalmente, deixe ue vseja duas cordas e k ≥ 0um número inteiro. Dizemos que ué uma ksubsequência de empacotamento de v, se houver índices distintos tais que , e na maioria dos índices, satisfaçam . Isso significa que pode ser encontrado no interior , indo da esquerda para a direita, escolhendo alguns de seus personagens no caminho e dando voltas na maioria das vezes (equivalentemente, fazendo na maioria das varreduras ). Observe que nenhum caractere pode ser escolhido mais de uma vez, mesmo após uma volta, e que as subsequências de empacotamento são exatamente as subsequências comuns com as quais todos estamos familiarizados.i1, i2, ..., ilen(u)u == v[i1] v[i2] ... v[ilen(u)]kijij > ij+1uvkk+1v0

A tarefa

Suas entradas são duas seqüências alfanuméricas não vazias ue v, e sua saída é o menor número inteiro, de kmodo que ué uma ksubsequência de empacotamento v. Se não kexistir, a saída será -1.

Exemplo

Considere as entradas u := xyzyxzzxyxe v := yxzzazzyxxxyz. Se começarmos a procurar os personagens de uin vde uma maneira gananciosa, faremos 3 vezes:

 yxzzazzyxxxyz
>─x─────y────z┐
┌─────────────┘
└y───────x────┐
┌─────────────┘
└──zz─────x─y─┐
┌─────────────┘
└──────────x──>

Portanto, a saída correta é no máximo 3. Observe como o caractere mais à esquerda xé selecionado uma vez e depois ignorado na segunda varredura, pois não pode ser reutilizado. No entanto, existe um método mais curto com apenas 2 wrap-arounds:

 yxzzazzyxxxyz
>──────────xyz┐
┌─────────────┘
└yxzz────x────┐
┌─────────────┘
└───────y─x───>

Acontece que uma volta (ou seja, duas varreduras) não é suficiente, portanto a saída correta é 2.

Regras e Bônus

Você pode escrever uma função ou um programa completo e também pode alterar a ordem das entradas, se necessário. A contagem de bytes mais baixa vence e as brechas padrão não são permitidas.

Há um bônus de -10% para calcular todos os casos de teste em menos de 10 segundos no total. Testarei casos pouco claros na minha máquina; minha implementação de referência em Python leva cerca de 0,6 segundos. Eu tenho um laptop de 7 anos com CPU dual core de 1,86 GHz, que você pode levar em consideração.

Casos de teste

"me" "moe" -> 0
"meet" "metro" -> -1
"ababa" "abaab" -> 1
"abaab" "baabaa" -> 1
"1c1C1C2B" "1111CCCcB2" -> 3
"reverse" "reserved" -> 2
"abcdefg" "gfedcba" -> 6
"xyzyxzzxyx" "yxzzazzyxxxyz" -> 2
"aasdffdaasdf" "asdfddasdfsdaafsds" -> 2
Zgarb
fonte
1
Isso também seria uma solução válida para o exemplo? É uma abordagem gananciosa.
orlp
@orlp Não é válido, porque o primeiro xé usado em três varreduras distintas. Só pode ser usado uma vez.
Zgarb
Ahhh, eu vejo agora.
orlp

Respostas:

4

Pitão, 34 bytes

Mh+Smssm>.ukC,[email protected]_1

Isso define uma função g, que aceita duas strings como parâmetro. Experimente on-line: Compilador / Executor Pyth

Este código é muito ineficiente. Tem uma complexidade de tempo e memória de len(v)!/(len(v)-len(u))!. Não é possível resolver os casos de teste mais longos em menos de 10 segundos. (Ele também travará muito provavelmente, pois ficará sem memória.)

M                                    define g(G, H): return _
                          .PUHlG        all permutations of [0, 1, ..., len(H)-1] of length len(G)
                 fqGsm@HkT              filter the permutations which form the string G
    mssm>.ukC,dtd                       compute the number of wraps for each of the remaining permutations
  +S                            _1      sort the numbers and append -1
 h                                      return the first element
Jakube
fonte
4

Haskell, 160 * 0,9 = 144 bytes

a#(-1)=a
a#b=min a b
f y=w(y++" ")0$length y
w _ n _[]=n
w(c:d)n o g@(a:b)|n>o=(-1)|a==c=z#w y n z g|c==' '=w y(n+1)o g|1<2=w y n o g where z=w d n o b;y=d++[c]

Tempo para todos os casos de teste (nota: os argumentos são invertidos):

*Main> map (uncurry f) [
             ("moe", "me"),
             ("metro", "meet"),
             ("abaab", "ababa"),
             ("baabaa", "abaab"),
             ("1111CCCcB2", "1c1C1C2B"),
             ("reserved", "reverse"),
             ("gfedcba", "abcdefg"),
             ("yxzzazzyxxxyz", "xyzyxzzxyx"),
             ("asdfddasdfsdaafsds", "aasdffdaasdf")]
[0,-1,1,1,3,2,6,2,2]
(0.08 secs, 25794240 bytes)

Como funciona (versão curta): força bruta simples que utiliza o mínimo de um caractere correspondente e o ignora. Paro a pesquisa quando terminar (retornando o número de ciclos) ou quando o ciclo for maior que o mínimo até agora (retornando -1).

Salvei muitos bytes em comparação com a minha primeira versão, principalmente porque mudei de um programa completo para uma função.

Com alguns comentários e espaçamento adequado, Haskell é bastante legível:

-- a minimum function that ignores a -1 in the right argument to prevent
-- "not solvable" cases in parts of the recursive search to dominate low numbers
-- of solvable parts. If the case isn't solvabale at all, both arguments are
-- -1 and are carried on.
a # (-1) = a
a # b    = min a b

-- the main function f calls the worker funktion w with arguments
-- * the string to search in (STSI), appended by a space to detect cycles
-- * the number of cycles so far
-- * the minimum of cycles needed so far, starting with the length of STSI
-- * the string to search for (STSF) (partial applied away and therefore invisible)
f y = w (y++" ") 0 (length y)

-- the worker function 
w _ n _ [] = n          -- base case: if STSF is empty the work is done and the 
                        -- number of cycles is returned

w (c:d) n o g@(a:b)     -- "c" is first char of STSI, "d" the rest
                        -- "n" number of cycles, "o" minimum of cycles so far
                        -- "g" is the whole STSF, "a" the 1st char, "b" the rest
  | n>o    = (-1)             -- if current cycle is more than a previous result,
                              -- indicate failure
  | a==c   = z # w y n z g    -- if there's a character match, take the min of
                              -- using it and skipping it
  | c==' ' = w y (n+1) o g    -- cycle detected, repeat and adjust n
  | 1<2    = w y n o g        -- otherwise try next char in STSI

  where                 -- just some golfing: short names for common subexpressions
  z = w d n o b;        -- number of cycles if a matching char is used
  y = d ++ [c]          -- rotated STSI

Para referência: versão antiga, programa completo, 187 bytes

main=interact$show.f.lines
a#(-1)=a
a#b=min a b
f[x,y]=w x(y++" ")0 0
w[]_ n _=n
w g@(a:b)(c:d)n m|a==c=w b d n 1#y|c==' '&&m==1=w g(d++" ")(n+1)0|c==' '=(-1)|1<2=y where y=w g(d++[c])n m
nimi
fonte
@ Zgarb: reformulou minha solução. Agora é mais rápido e mais curto.
N
Executa em 0.6s quando interpretado, 0.01s quando compilado.
Zgarb 13/04
2

JavaScript (ES6) 174 (193 - 10%)

Pesquisa recursiva, como a resposta do @ nimi, mantendo o mínimo de envolvimentos. O espaço das soluções é grande (sobretudo no último exemplo), mas reduzir a pesquisa nos mínimos encontrados atualmente mantém o tempo baixo. Edit 1 Adicione um caso de teste ausente, encurtado um pouco Edit 2 Não há necessidade de passar os parâmetros, é corrigido

K=(w,s,x)=>
  ~-(R=(r,l,p=0,q=1,z=w[p],i=0)=>
  {
    if(z&&!(q>x)){
      if(~(r+l).indexOf(z))
        for(t=l?R(l+r,'',p,q+1):x;x<t?0:x=t,i=~r.indexOf(z,-i);)
          t=R(r.slice(-i),l+r.slice(0,~i),p+1,q);
      q=x
    }
    return q
  })(s,'')

Ungolfed

K=(word, astring)=>
{
  var minWraps // undefined at first. All numeric comparison with undefined give false 
  var R=(right, left, pos, wraps)=>
  {
    var cur = word[pos]
    var i,t;
    if (! cur) // when all chars of word are managed
      return wraps;
    if (wraps > minWraps) // over the minimum wrap count already found, stop search
      return wraps; 
    if ( (right+left).indexOf(cur) < 0 ) // if the current char is not found in the remaining part of the string
      return minWraps; // return the current min, could still be undefined (that means 'no way')
    if ( left ) // if there is a left part, try a wrapping search with the current char
    {
      t = R(left+right, '', pos, wraps+1)
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    // find all occurrences of current char in the remaining part
    // for each occurrence, start a recursive search for the next char
    for(i = 0; (i = right.indexOf(cur, i)) >= 0; i++)
    {
      var passed = right.slice(0,i) // the passed chars go in the left part
      var rest = right.slice(i+1) 
      t = R(rest, left+passed, pos+1, wraps) // try next char in the remaining part, no wrap
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    return minWraps
  }
  var result = R(astring, '', 0, 1) // start with right=string and left empty
  return ~-result; // decrement. convert undefined to -1
}

Teste no console Firefox / FireBug

time=~new Date;
[['me','moe']
,['meet','metro']
,['ababa','abaab']
,['abaab','baabaa']
,['1c1C1C2B','1111CCCcB2']
,['reverse','reserved']
,['abcdefg','gfedcba']
,['xyzyxzzxyx','yxzzazzyxxxyz']
,['aasdffdaasdf','asdfddasdfsdaafsds']]
.forEach(s=>console.log(s,r=K(...s)))
time-=~new Date

Saída (última linha é o tempo de execução em ms)

["me", "moe"] 0
["meet", "metro"] -1
["ababa
", "abaab"] 1
["abaab", "baabaa"] 1 ["1c1C1C2B", "1111CCCcB2"] 3
["reverso", "reservado"] 2
["abcdefg", "gfedcba"] 6
["xyzyxzzxyx", "yxzzazzyxxxyz"] 2
["aasdffdaasdf", "asdfddasdfsdaafsds"] 2
116

edc65
fonte
Testado com Firebug, roda em 175ms na minha máquina.
Zgarb 13/04
@Zgarb então há espaço para melhorias: Eu vou tentar torná-lo mais lento e mais curto
edc65