Atualmente, estou trabalhando para entender o uso do limite de Cheeger e da desigualdade de Cheeger, e seu uso para particionamento espectral, condutância, expansão, etc., mas ainda luto para iniciar uma intuição sobre o segundo autovalor da matriz de adjacência.
Geralmente, na teoria dos grafos, a maioria dos conceitos que encontramos é bastante simples de intuir, mas, neste caso, não consigo nem imaginar que tipo de gráfico teria um segundo valor próprio muito baixo ou muito alto.
Eu tenho lido perguntas semelhantes aqui e ali na rede SE, mas elas geralmente se referem a valores próprios em diferentes campos ( análise multivariada , matrizes de distância euclidiana , matrizes de correlação ...).
Mas nada sobre particionamento espectral e teoria de grafos.
Alguém pode tentar compartilhar sua intuição / experiência desse segundo autovalor no caso de gráficos e matrizes de adjacência?
fonte
Respostas:
O segundo autovalor (em magnitude) controla a taxa de convergência da caminhada aleatória no gráfico. Isso é explicado em muitas notas de aula, por exemplo, notas de Luca Trevisan . Grosso modo, a distância L2 à uniformidade apóst etapas pode ser limitada por λt2 .
Outro local onde o segundo autovalor aparece é o problema da camarilha plantada . O ponto de partida é a observação de que um aleatóriaG(n,1/2) gráfico contém um clique de tamanho 2log2n , mas o algoritmo ávido encontra somente um clique de tamanho log2n , e não há melhor algoritmo eficiente é conhecido. (O algoritmo ganancioso apenas escolhe um nó aleatório, joga fora todos os não vizinhos e repete.)
Isto sugere plantando uma grande facção no topo deG(n,1/2) . A questão é: qual deve ser o tamanho da camarilha, para que possamos encontrá-la com eficiência. Se plantarmos uma camarilha do tamanho Cnlogn−−−−−√ , poderíamos identificar os vértices da camarilha apenas pelo seu grau; mas esse método funciona apenas para panelinhas de tamanhoΩ(nlogn−−−−−√) . Podemos melhorar isso usando técnicas espectrais: se plantarmos um clique do tamanhoCn−−√ , osegundo vetor própriocodifica a camarilha, comoAlon, Krivelevich e Sudakovmostraram em um artigo clássico.
De maneira mais geral, os primeiros autovetores são úteis para particionar o gráfico em um pequeno número de clusters. Veja, por exemplo, o Capítulo 3 das notas de aula de Luca Trevisan , que descreve as desigualdades de ordem superior de Cheeger.
fonte
(Isenção de responsabilidade: esta resposta é sobre autovalores de gráficos em geral, não o segundo autovalor em particular. Espero que seja útil, no entanto.)
Uma maneira interessante de pensar sobre os autovalores de um gráficoG=(V,E) é pegar o espaço vetorial Rn onde n=|V| e identificando cada vetor com uma função f:V→R (isto é, uma marcação de vértice). Um vetor próprio da matriz de adjacência, então, é um elemento de f∈Rn tal que existe λ∈R (isto é, um valor próprio) com Af=λf , A sendo a matriz de adjacência de G . Observe que Af é o vetor associado ao mapa que envia todos os vértices v∈V para ∑u∈N(v)f(u) , sendo N(v) o conjunto de vizinhos (ou seja, vértices adjacentes a) u . Portanto, nessa configuração, a propriedade de autovetor de f corresponde à propriedade que soma os valores da função (em f )dos vizinhos de um vértice produz o mesmo resultado da multiplicação do valor da função do vértice pela constante λ .
fonte
Agora, um pouco de cálculo mostra que , e substituindo acima e dividindo numerador e denominador por , temos⟨f0,f0⟩=1n∑{u,v}∈(V2)(f(u)−f(v))2 n2
O que isso significa é que, se colocarmos todos os vértices de na linha real no ponto , a distância média entre dois vértices aleatórios independentes no gráfico (o denominador) será no máximo vezes a distância média entre os pontos finais de uma aresta aleatória no gráfico (o numerador). Portanto, nesse sentido, uma grande lacuna espectral significa que o que acontece através de uma borda aleatória de (comportamento local) é um bom preditor para o que acontece através de um par aleatório não correlacionado de vértices (comportamento global).u G f(u) dd−λ2 G
fonte