Encontre o caractere ímpar em um padrão

20

Entrada

A primeira linha será uma determinada sequência repetida várias vezes. Por exemplo, poderia ser abcabcabcabc, [];[];[];etc. Pode ser cortado; por exemplo: 1231231231. Sempre encontre a corda mais curta; por exemplo, se a linha é 22222, então a string é 2, not 22or 22222ou qualquer outra coisa. A corda sempre será repetida pelo menos 2 vezes.

Todas as linhas subsequentes terão esse padrão compensado por qualquer número. Por exemplo, poderia ser:

abcabcabc
cabcabcab
bcabcabca

(deslocamento por 1) ou pode ser:

abcdefabcdefabcdefabc
cdefabcdefabcdefabcde
efabcdefabcdefabcdefa

(compensado por 4).

Um dos caracteres da entrada estará errado. (É garantido que não esteja na primeira linha.) Por exemplo, nesta entrada:

a=1a=1a=1
=1a=1a=1a
1a=11=1a=
a=1a=1a=1
=1a=1a=1a

o 1na linha 3 é o ímpar.

Saída

Você deve gerar as coordenadas (com base em zero, começando no canto superior esquerdo) da ímpar. Por exemplo, na entrada acima, a saída correspondente é 4,2. Você também pode enviar 4 2, ou "4""2", ou mesmo [[4],[2]], ou qualquer outro formato, desde que saiba qual deve ser a saída.

Casos de teste

Entrada:

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

Saída: 16,2

Entrada:

][[][][[][][[][][[][][[
[][][[][][[][][[][][[][
[][[][][[][][[][][[][][
[[][][[]]][[][][[][][[]

Saída: 8,3

Entrada:

...
. .
...

Saída: 1,1

Entrada:

ababa
babab
ababb
babab

Saída: 4,2

Vai!

Maçaneta da porta
fonte
Quais caracteres podem estar contidos na string? ASCII imprimível? ASCII? Unicode?
Dennis
@ Dennis Apenas em ASCII (que basicamente pode ser assumida por qualquer desafio que envolve cordas, caso contrário, teríamos de especificar que para quase todos os desafios: P)
Doorknob
Calculei que sim. Estou pensando em uma abordagem que exigiria um caracter não utilizado, então pensei em perguntar.
Dennis
Devemos verificar casos como este: abc/cab/abc- e saída 0 2aqui?
precisa saber é o seguinte
@VadimR Não, pois apenas um caractere estará errado.
Maçaneta

Respostas:

7

Bash Perl, 231 229 218 178 164 166 138 106 74 bytes

/^(((.*).*)\2+)\3$/;$_.=$1x2;$.--,die$+[1]if/^(.*)(.)(.*)
.*\1(?!\2).\3/

O script requer o uso da -nopção, que responde por dois dos bytes.

A idéia de anexar duas cópias de todas as repetições completas do padrão foi retirada da resposta do MT0 .

Em contraste com todas as outras respostas, essa abordagem tenta extrair o padrão da linha de entrada atual em cada iteração; ele falhará na linha que contém o caractere ímpar (e use o padrão da linha anterior). Isso é feito para incluir a extração de padrões no loop, que consegue salvar alguns bytes.

Versão ungolfed

#!/usr/bin/perl -n

# The `-n' switch makes Perl execute the entire script once for each input line, just like
# wrapping `while(<>){…}' around the script would do.

/^(((.*).*)\2+)\3$/;

# This regular expression matches if `((.*).*)' - accessible via the backreference `\2' -
# is repeated at least once, followed by a single repetition of `\3" - zero or more of the
# leftmost characters of `\2' - followed by the end of line. This means `\1' will contain
# all full repetitions of the pattern. Even in the next loop, the contents of `\1' will be
# available in the variable `$1'.

$_.=$1x2;

# Append two copies of `$1' to the current line. For the line, containing the odd
# character, the regular expression will not have matched and the pattern of the previous
# line will get appended.
#
# Since the pattern is repeated at least two full times, the partial pattern repetition at
# the end of the previous line will be shorter than the string before it. This means that
# the entire line will the shorter than 1.5 times the full repetitions of the pattern, 
# making the two copies of the full repetitions of the pattern at least three times as 
# long as the input lines.

$.-- , die $+[1] if

# If the regular expression below matches, do the following:
#
#   1. Decrement the variable `$.', which contains the input line number.
#
#      This is done to obtain zero-based coordinates.
#
#   2. Print `$+[1]' - the position of the last character of the first subpattern of the
#      regular expression - plus some additional information to STDERR and exit.
#
#      Notably, `die' prints the (decremented) current line number.

/^(.*)(.)(.*)
.*\1(?!\2).\3/;

# `(.*)(.)(.*)', enclosed by `^' and a newline, divides the current input line into three
# parts, which will be accesible via the backreferences `\1' to `\3'. Note that `\2'
# contains a single character.
#
# `.*\1(?!\2).\3' matches the current input line, except for the single character between
# `\1' and `\3' which has to be different from that in `\2', at any position of the line
# containing the pattern repetitions. Since this line is at least thrice as long as
# `\1(?!\2).\3', it will be matched regardless of by how many characters the line has been
# rotated.

Exemplo

Para o caso de teste

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

a saída da versão golfed é

16 at script.pl line 1, <> line 2.

significando que o caractere ímpar tem as coordenadas 16,2.

Esse abuso flagrante tira proveito do formato de saída liberal.

Antes de sair, o conteúdo de algumas das variáveis ​​especiais do Perl são:

$_  = lfcodegolfcodegoff\ncodegolfcodegolfcodegolfcodegolf
$1  = lfcodegolfcodego
$2  = f
$3  = f

( $ncontém a correspondência do subpadrão acessível por referência anterior \n.)

Dennis
fonte
Captura inteligente da unidade de resposta. Pode ser otimizado por um byte:^((.*?)(.*?))(?=\1+\2$)
Heiko Oberdiek 21/03
Mudei para o idioma que as crianças populares estão usando. Provavelmente pode ser jogado mais para baixo; este é meu primeiro script Perl em mais de uma década ...
Dennis
2
... e você está mais de uma década tarde se você acha perl é o que as crianças populares estão usando
ardnew
esta resposta não está recebendo o amor que merece. Parece-me que o @Doorknob vencedor
ardnew
8

Perl, 212 191 181 168 bytes

$_=<>;/^(((.*?)(.*?))\2+)\3$/;$x=$1x4;while(<>){chop;$x=~/\Q$_\E/&&next;for$i(0..y///c-1){for$r(split//,$x){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&die$i,$",$.-1,$/}}}
  • Esta versão usa um truque otimizado para capturar a unidade de resposta, aprendida na resposta de Dennis .
  • Otimização usando a propriedade de que todas as linhas têm comprimentos iguais.
  • O fim da linha também é necessário para a última linha, caso contrário, em chompvez de chopdeve ser usado.
  • Otimizações do comentário de ardnew adicionado.

Versão antiga, 212 bytes:

$_=<>;chop;/^(.+?)\1+(??{".{0,".(-1+length$1).'}'})$/;$;=$1;while(<>){$x=$;x length;chop;$x=~/\Q$_\E/&&next;for$i(0..-1+length$_){for$r(split//,$;){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&exit print$i,$",$.-1}}}

Versão não destruída:

$_ = <>;  # read first line
/^(((.*?)(.*?))\2+)\3$/;
# The repeat unit \2 consists of \3 and \4,
# and the start part \2 can be added at the end (as partial or even full unit).
$x = $1 x 4; # $x is long enough to cover each following line

# Old version:
# /^(.+?)\1+(??{ ".{0," . (-1 + length $1) . '}' })$/;
# $a = $1; # $a is the repeat unit.
# The unit is caught by a non-greedy pattern (.+?) that is
# repeated at least once: \1+
# The remaining characters must be less than the unit length.
# The unit length is known at run-time, therefore a "postponed"
# regular expression is used for the remainder.

# process the following lines until the error is found
while (<>) {
    # old version:
    # $x = $a x length;
    # $x contains the repeated string unit, by at least one unit longer
    # than the string in the current line
    chop; # remove line end of current line
    $x =~ /\Q$_\E/ && next;
          # go to next line, if current string is a substring of the repeated units;
          # \Q...\E prevents the interpretation of special characters
    # now each string position $x is checked, if it contains the wrong character:
    for $i (0 .. y///c - 1) {  # y///c yields the length of $_
        for $r (split //, $x) { #/ (old version uses $a)
            # replace the character at position $i with a
            # character from the repeat unit
            $b = $_;
            $b =~ s/(.{$i})./$1$r/;
            $x =~ /\Q$b\E/
               && die $i, $", $. - 1, $/;
               # $" sets a space and the newline is added by $/;
               # the newline prevents "die" from outputting line numbers
        }
    }
}
Heiko Oberdiek
fonte
Grande solução e comentários, eu preciso saber mais regex;)
Newbrict
1
o primeiro chopé desnecessário - deve ser removido. a final exit printpode ser substituída por die(adicione ,$/para ocultar o material extra (se necessário)). também length$_pode ser substituído pory///c
ardnew 25/03
@ardnew: Muito obrigado, eu removi o primeiro chop, porque $corresponde antes da nova linha no final da string. Ocultar o material extra da dienova linha adicionada parece necessário para mim. Também y///cé muito menor length$_e um byte menor que lengtho desnecessário $_.
Heiko Oberdiek
1
@ardnew: Eu tinha esquecido die verbosidade 's. Inclusive inclui impressões do número da linha! Vou usar isso na minha próxima atualização.
Dennis
3

C, 187 bytes

Limitações

  • Não use seqüências de caracteres com mais de 98 caracteres :)

Versão Golfed

char s[99],z[99],*k,p,i,I,o,a;c(){for(i=0;k[i]==s[(i+o)%p];i++);return k[i];}main(){for(gets(k=s);c(p++););for(;!(o=o>p&&printf("%d,%d\n",I,a))&&gets(k=z);a++)while(o++<p&&c())I=I<i?i:I;}

Versão ungolfed

char s[99],z[99],*k,p,i,I,o,a;

c()
{
    for(i=0
       ;k[i]==s[(i+o)%p]
       ;i++)
       ;
    return k[i];
}

main()
{
    for(gets(k=s);c(p++);)
         ;
    for(;!(o=o>p&&printf("%d,%d\n",I,a)) && gets(k=z);a++)
           while(o++ < p && c())
            I=I<i?i:I;
}
asr
fonte
2

Python, 303 292

r=raw_input
R=range
s=r()
l=len(s)
m=1
g=s[:[all((lambda x:x[1:]==x[:-1])(s[n::k])for n in R(k))for k in R(1,l)].index(True)+1]*l*2
while 1:
 t=r()
 z=[map(lambda p:p[0]==p[1],zip(t,g[n:l+n]))for n in R(l)]
 any(all(y)for y in z)or exit("%d,%d"%(max(map(lambda b:b.index(False),z)),m))
 m+=1

A entrada passa por stdin. Vou explicar se houver alguma demanda, mas não parece que eu vou ganhar de qualquer maneira.

Fraxtil
fonte
1

Perl, 157 154

Edit : -3 graças à sugestão do ardnew.

<>=~/^(((.*?).*?)\2+)\3$/;$p=$2;$n=$+[1];while(<>){s/.{$n}/$&$&/;/(\Q$p\E)+/g;$s=$p;1while/./g*$s=~/\G\Q$&/g;print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos}

Levei algum tempo (ligado e desligado, é claro, não 5 dias ;-)), e a idéia sobre algoritmo era inicialmente ilusória (embora eu sentisse que estava lá), mas finalmente (e de repente) tudo ficou claro.

Se o comprimento da string for múltiplo do comprimento do padrão, e mesmo que a string não comece com o início do padrão, a concatenação de uma string produzirá um padrão no lugar da concatenação (imagine a repetição infinita de uma palavra na fita circular - o lugar de soldagem não é importante). Portanto, a idéia é aparar a linha em vários comprimentos de unidade e concatenar o original. O resultado, mesmo para a sequência que contém o caractere errado, é garantido para corresponder ao padrão pelo menos uma vez. A partir daí, é fácil encontrar a posição do personagem ofensivo.

A primeira linha é descaradamente emprestada da resposta de Heiko Oberdiek :-)

<>=~/^(((.*?).*?)\2+)\3$/;      # Read first line, find the repeating unit
$p=$2;                          # and length of whole number of units.
$n=$+[1];                       # Store as $p and $n.
while(<>){                      # Repeat for each line.
    s/.{$n}/$&$&/;              # Extract first $n chars and
                                # append original line to them.
    /(\Q$p\E)+/g;               # Match until failure (not necessarily from the
                                # beginning - doesn't matter).
    $s=$p;                      # This is just to reset global match position
                                # for $s (which is $p) - we could do without $s,
                                # $p.=''; but it's one char longer.
                                # From here, whole pattern doesn't match -
    1while/./g*$s=~/\G\Q$&/g;   # check by single char.
                                # Extract next char (if possible), match to 
                                # appropriate position in a pattern (position 
                                # maintained by \G assertion and g modifier).
                                # We either exhaust the string (then pos is 
                                # undefined and this was not the string we're
                                # looking for) or find offending char position.

    print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos
}
user2846289
fonte
1
bom trabalho. Eu acho que você pode substituir /.{$n}/;$_=$&.$_;coms/.{$n}/$&$&/;
ardnew
1

JavaScript (ES6) - 147 133 136 caracteres

s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Espera que a sequência a ser testada esteja na variável se gera o resultado para o console.

var repetitionRE = /^(((.*).*)\2+)\3\n/;
                                        // Regular expression to find repeating sequence
                                        // without any trailing sub-string of the sequence.
var sequence = repetitionRE.exec(s)[1]; // Find the sequence string.
s.split('\n')                           // Split the input into an array.
 .map(
   ( row, index ) =>                    // Anonymous function using ES6 arrow syntax
   {
     var testStr = row + '᛫'+ sequence + sequence;
                                        // Concatenate the current row, a character which won't
                                        // appear in the input and two copies of the repetitions
                                        // of the sequence from the first line.
     var match = /^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(testStr);
                                        // Left of the ᛫ finds sub-matches for a single
                                        // character and the sub-strings before and after.
                                        // Right of the ᛫ looks for any number of characters
                                        // then the before and after sub-matches with a
                                        // different character between.
      if ( match )
       console.log( match[1].length, index );
                                        // Output the index of the non-matching character
                                        // and the row.
   }         
 );

Caso de teste 1

s="codegolfcodegolfco\negolfcodegolfcodeg\nlfcodegolfcodegoff\nodegolfcodegolfcod\ngolfcodegolfcodego\nfcodegolfcodegolfc"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

16 2

Caso de teste 2

s="][[][][[][][[][][[][][[\n[][][[][][[][][[][][[][\n[][[][][[][][[][][[][][\n[[][][[]]][[][][[][][[]"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

8 3

Caso de teste 3

s="...\n. .\n..."
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

1 1

Caso de teste 4

s="ababa\nbabab\nababb\nbabab"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

4 2

Caso de teste 5

s="xyxy\nyyxy"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

0 1

Caso de teste 6

s="ababaababa\nababaaaaba"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Saídas

6 1
MT0
fonte
Infelizmente, essa abordagem falha se, por exemplo s="xyxy\nyyxy",. Para a segunda linha, match[4]será yy; deveria ser justo y.
Dennis
Re-trabalhado e reduzido por 14 caracteres.
MT0 27/03
Muito agradável! Eu já havia tentado o mesmo segundo regex em algum momento, mas anexei o padrão mínimo duas vezes em vez do máximo (e, portanto, falhei miseravelmente). Uma questão menor: o primeiro regex relatará ababo padrão de ababaababa; você precisa usar ^…$.
Dennis
/^…\n/funciona ou/^…$/m
MT0 28/03
1
Pode não precisar da liderança ^(pelo menos não para nenhum dos seis casos de teste que listei - mas provavelmente há um exemplo de contrário em que isso ocorre, então deixei aqui).
MT0 28/03