Assintóticos do número de palavras em um idioma regular de comprimento determinado

Para um idioma regular , seja o número de palavras em de comprimento . Utilizando a forma canônica de Jordan (aplicada à matriz de transição não anotada de alguns DFA para ), pode-se mostrar que, para números grandes o suficiente , que são polinômios complexos e $L$ $c_n(L)$ $L$ $n$ $L$ $n$

c_{n} (L) = \sum_{i = 1}^{k} P_{i} (n) λ_{i}^{n},

$c_n(L) = \sum_{i=1}^k P_i(n) \lambda_i^n,$

P_{i}

$P_i$

λ_{i}

$\lambda_i$ são "autovalores" complexos. (Para pequenas

, que pode ter termos adicionais da forma

, onde

de outro modo. Estes correspondem a blocos Jordan de tamanho pelo menos

com autovalor

)

n

$n$

C_{k} [n = k]

$C_k[n=k]$

[n = k]

$[n=k]$

1

$1$

n = k

$n=k$

0

$0$

k + 1

$k+1$

0

$0$

Essa representação parece implicar que, se é infinito, então assintoticamente, para alguns . No entanto, isso é claramente falso: para o idioma acima de de todas as palavras de mesmo comprimento, mas $L$ $c_n(L) \sim C n^k \lambda^n$ $C,\lambda>0$ $L$ $\{0,1\}$ $c_{2n}(L) = 2^{2n}$ . Isso sugere que para alguns de e para todos , para suficientemente grandeou . Isso é comprovado emFlajolet & Sedgewick $c_{2n+1}(L) = 0$ $d$ $a \in \{0,\ldots,d-1\}$ $c_{dm+a}(L) = 0$ $m$ $c_{dm+a} \sim C_a (dm+a)^{k_a} \lambda_a^{dm+a}$ (Teorema V.3), que atribuem a prova a Berstel.

A prova fornecida por Flajolet e Sedgewick é um tanto técnica; tão técnico, de fato, que eles apenas o esboçam. Tentei uma prova mais elementar usando a teoria de Perron-Frobenius. Podemos considerar o gráfico de transição do DFA como um dígrafo. Se o dígrafo é primitivo, o resultado segue quase diretamente o teorema de Perron-Frobenius. Se o dígrafo é irredutível, mas imprimitivo com o índice , então, considerando a " ésima potência" do DFA (cada transição corresponde a símbolos), obtemos o mesmo resultado. O caso difícil é quando o dígrafo é redutível. Podemos reduzir para o caso de um caminho de componentes fortemente conectados e, em seguida, obtemos o resultado estimando somas da forma $r$ $r$ $r$ (Cada uma dessas somas corresponde a uma maneira particular de aceitar uma palavra, passando pelos diferentes componentes de uma certa maneira.) Essa soma, por sua vez, pode ser estimada identificando o maior termo, que corresponde a. Para cada valor próprio que é repetidovezes, obtemos um fator extra de.

\sum_{m_{1} + \dots + m_{k} = m} \prod_{i = 1}^{k} λ_{i}^{m_{i}} .

$\sum_{m_1+\cdots+m_k=m} \prod_{i=1}^k \lambda_i^{m_i}.$

m_{i} \propto \log λ_{i}

$m_i \propto \log \lambda_i$

r

$r$

Θ (m^{r - 1})

$\Theta(m^{r-1})$

A prova tem as suas arestas: no caso redutível, que necessita de passar a partir termos assimptóticas para à soma mencionado acima, e, em seguida, é necessário estimar a soma. $C \lambda_i^m$

A prova de Flajolet e Sedgewick é talvez mais simples, mas menos elementar. Seu ponto de partida é a função geradora racional de , e envolve a indução do número de magnitudes dos polos (!). A idéia básica é que todos os autovalores do módulo máximo são raízes da unidade (se normalizados pelo módulo), devido a um teorema (moderadamente fácil) de Berstel. Escolhendo um apropriado e olhando para as palavras de comprimento , todos esses autovalores se tornam reais. Considerando a expansão da fração parcial, obtemos que, se o autovalor do módulo máximo "sobreviver", ele determinará os assintóticos, que são da forma $c_n(L)$ $d$ $dm+a$ . Caso contrário, encontramos uma nova função geradora racional que corresponde apenas a palavras desse tamanho (usando um produto Hadamard) e repetimos o argumento. A quantidade mencionada continua diminuindo e, por fim, encontramos os assintóticos desejados; pode ter que crescer no processo, para refletir tudo o que acontece nas etapas indutivas. $Cn^k\lambda^n$ $d$

Existe uma prova simples e elementar para a propriedade assintótica de ? $c_n(L)$

formal-languages reference-request regular-languages asymptotics combinatorics Yuval Filmus
fonte

A qual "propriedade assintótica" você está se referindo, a que está no topo?

Raphael

Exatamente essa propriedade.

Yuval Filmus

Para o caso redutível, não existem limites combinatórios simples (talvez obtidos considerando subconjuntos de caminhos e vários conjuntos de caminhos)?

András Salamon

Existem limites fáceis, mas você provavelmente perde fatores polinomiais lá. Há uma soma com muitos termos polinomialmente, e podemos calculá-la usando o maior termo. No entanto, isso não nos dará as assintóticas corretas, pois os outros termos decaem rapidamente. Talvez uma estimativa com uma integral seja possível, mas isso já está ficando um pouco confuso.

Yuval Filmus

geralmente, encontrar provas alternativas ou mais elementares de problemas pode ser muito difícil e é principalmente um exercício teórico ... existe alguma motivação / bkg / aplicação adicional? sugerir migrar para a história.

vzn

O argumento que você esboçou parece estar alinhado com o tratamento de Richard Stanley do Método da matriz de transferência em combinações enumerativas, volume 1 (link: pp 573; print: pp 500).

Ele começa com a função geradora e a descompacta, considerando os digrafos e os fatores permitidos e proibidos. Ele abstrai para liberar monoides, onde usa uma versão refinada das somas que você forneceu para provar:

$B$ $A^*$ $B$ $B^*(\lambda)=(I-B(\lambda))^{-1}$

Depois de trabalhar em alguns aplicativos, ele também fecha a seção discutindo os produtos Hadamard em relação aos poliaminos horizontalmente convexos.

JSS
fonte

Você pode apontar para um teorema no texto de Stanley que fornece estimativas assintóticas?

Yuval Filmus

Não consigo encontrar nenhuma referência imediata e explícita em Stanley, mas Flajolet e Sedgewick reconhecem sua influência no tratamento do método da matriz de transferência na seção V.6. Em particular, o Corolário V.1 inclui Teoremas anteriores (V.7, V.8) que parecem seguir sua linha de raciocínio. Eles também parecem seguir o esboço de Stanley a partir da subseção V.5, onde a Proposição V.6 corresponde ao Teorema de Stanley 4.7.2 e ao Corolário 4.7.3

JSS

O que estou procurando especificamente é a análise assintótica. A fórmula exata para o número de palavras de determinado comprimento, dada pelo método da matriz de transferência, é o que eu considero certo.

Yuval Filmus

Assintóticos do número de palavras em um idioma regular de comprimento determinado

Respostas: