Assintóticos do número de palavras em um idioma regular de comprimento determinado

28

Para um idioma regular , seja c n ( L ) o número de palavras em L de comprimento n . Utilizando a forma canônica de Jordan (aplicada à matriz de transição não anotada de alguns DFA para L ), pode-se mostrar que, para números grandes o suficiente n , c n ( L ) = k i = 1 P i ( n ) λ n i , em que P i são polinômios complexos e λ iLcn(L)LnLn

cn(L)=i=1kPi(n)λin,
Piλisão "autovalores" complexos. (Para pequenas , que pode ter termos adicionais da forma C k [ n = k ] , onde [ n = k ] é 1 se n = k e 0 de outro modo. Estes correspondem a blocos Jordan de tamanho pelo menos k + 1 com autovalor 0. )nCk[n=k][n=k]1n=k0k+10 0

Essa representação parece implicar que, se é infinito, então assintoticamente, c n ( L ) C n k λ n para alguns C , λ > 0 . No entanto, isso é claramente falso: para o idioma L acima de { 0 , 1 } de todas as palavras de mesmo comprimento, c 2 n ( L ) = 2 2 n, mas c 2 n + 1 ( L ) =eucn(eu)CnkλnC,λ>0 0eu{0,1}c2n(L)=22n . Isso sugere que para alguns de d e para todos a { 0 , , d - 1 } , c d m + a ( L ) = 0 para m suficientemente grandeou c d m + aC a ( d m + a ) k a λ d m + a a . Isso é comprovado emFlajolet & Sedgewickc2n+1(L)=0da{0,,d1}cdm+a(L)=0mcdm+aCa(dm+a)kaλadm+a (Teorema V.3), que atribuem a prova a Berstel.

A prova fornecida por Flajolet e Sedgewick é um tanto técnica; tão técnico, de fato, que eles apenas o esboçam. Tentei uma prova mais elementar usando a teoria de Perron-Frobenius. Podemos considerar o gráfico de transição do DFA como um dígrafo. Se o dígrafo é primitivo, o resultado segue quase diretamente o teorema de Perron-Frobenius. Se o dígrafo é irredutível, mas imprimitivo com o índice , então, considerando a " r- ésima potência" do DFA (cada transição corresponde a r símbolos), obtemos o mesmo resultado. O caso difícil é quando o dígrafo é redutível. Podemos reduzir para o caso de um caminho de componentes fortemente conectados e, em seguida, obtemos o resultado estimando somas da forma m 1 +rrr (Cada uma dessas somas corresponde a uma maneira particular de aceitar uma palavra, passando pelos diferentes componentes de uma certa maneira.) Essa soma, por sua vez, pode ser estimada identificando o maior termo, que corresponde amilogλi. Para cada valor próprio que é repetidorvezes, obtemos um fator extra deΘ(m r - 1 ).

m1++mk=mi=1kλimi.
milogλirΘ(mr1)

A prova tem as suas arestas: no caso redutível, que necessita de passar a partir termos assimptóticas para à soma mencionado acima, e, em seguida, é necessário estimar a soma.Cλim

A prova de Flajolet e Sedgewick é talvez mais simples, mas menos elementar. Seu ponto de partida é a função geradora racional de , e envolve a indução do número de magnitudes dos polos (!). A idéia básica é que todos os autovalores do módulo máximo são raízes da unidade (se normalizados pelo módulo), devido a um teorema (moderadamente fácil) de Berstel. Escolhendo um d apropriado e olhando para as palavras de comprimento d m + a , todos esses autovalores se tornam reais. Considerando a expansão da fração parcial, obtemos que, se o autovalor do módulo máximo "sobreviver", ele determinará os assintóticos, que são da forma C n kcn(L)ddm+a . Caso contrário, encontramos uma nova função geradora racional que corresponde apenas a palavras desse tamanho (usando um produto Hadamard) e repetimos o argumento. A quantidade mencionada continua diminuindo e, por fim, encontramos os assintóticos desejados; d pode ter que crescer no processo, para refletir tudo o que acontece nas etapas indutivas.Cnkλnd

Existe uma prova simples e elementar para a propriedade assintótica de ?cn(L)

Yuval Filmus
fonte
A qual "propriedade assintótica" você está se referindo, a que está no topo?
Raphael
Exatamente essa propriedade.
Yuval Filmus
Para o caso redutível, não existem limites combinatórios simples (talvez obtidos considerando subconjuntos de caminhos e vários conjuntos de caminhos)?
András Salamon
Existem limites fáceis, mas você provavelmente perde fatores polinomiais lá. Há uma soma com muitos termos polinomialmente, e podemos calculá-la usando o maior termo. No entanto, isso não nos dará as assintóticas corretas, pois os outros termos decaem rapidamente. Talvez uma estimativa com uma integral seja possível, mas isso já está ficando um pouco confuso.
Yuval Filmus
11
geralmente, encontrar provas alternativas ou mais elementares de problemas pode ser muito difícil e é principalmente um exercício teórico ... existe alguma motivação / bkg / aplicação adicional? sugerir migrar para a história.
vzn

Respostas:

3

O argumento que você esboçou parece estar alinhado com o tratamento de Richard Stanley do Método da matriz de transferência em combinações enumerativas, volume 1 (link: pp 573; print: pp 500).

Ele começa com a função geradora e a descompacta, considerando os digrafos e os fatores permitidos e proibidos. Ele abstrai para liberar monoides, onde usa uma versão refinada das somas que você forneceu para provar:

BUMABB(λ)=(Eu-B(λ))-1 1

Depois de trabalhar em alguns aplicativos, ele também fecha a seção discutindo os produtos Hadamard em relação aos poliaminos horizontalmente convexos.

JSS
fonte
Você pode apontar para um teorema no texto de Stanley que fornece estimativas assintóticas?
Yuval Filmus
Não consigo encontrar nenhuma referência imediata e explícita em Stanley, mas Flajolet e Sedgewick reconhecem sua influência no tratamento do método da matriz de transferência na seção V.6. Em particular, o Corolário V.1 inclui Teoremas anteriores (V.7, V.8) que parecem seguir sua linha de raciocínio. Eles também parecem seguir o esboço de Stanley a partir da subseção V.5, onde a Proposição V.6 corresponde ao Teorema de Stanley 4.7.2 e ao Corolário 4.7.3
JSS
O que estou procurando especificamente é a análise assintótica. A fórmula exata para o número de palavras de determinado comprimento, dada pelo método da matriz de transferência, é o que eu considero certo.
Yuval Filmus