Por que usamos um kernel gaussiano como uma métrica de similaridade?

7

No cluster baseado em gráfico, por que é preferível usar o kernel Gaussiano em vez da distância entre dois pontos como métrica de similaridade?

zfb
fonte
11
Eu tenho uma idéia de que, por similaridade, queremos que ele entre 0 e 1. O Kernel Gaussiano satisfaz isso e o peso se torna maior quando a distância entre dois pontos se torna maior. Existe algum outro motivo?
ZFB
aqui você pode assistir a um vídeo que explica muito bem a função> coursera.org/lecture/machine-learning/…
Jozani Hosein

Respostas:

8

Sejamos precisos. "Distância" tem muitos significados na ciência de dados, acho que você está falando sobre distância euclidiana .

O núcleo gaussiano é uma função não linear da distância euclidiana.

insira a descrição da imagem aqui

  • A função do kernel diminui com a distância e varia entre zero e um. Na distância euclidiana, o valor aumenta com a distância. Assim, a função do kernel é uma métrica mais útil para ponderar observações.

  • O fato de estar delimitado entre zero e um é uma propriedade agradável, enquanto a distância absoluta (pode ser qualquer coisa) na distância euclidiana pode causar instabilidade e dificuldade na modelagem.

  • A distância euclidiana (sem o sinal negativo) não é uma medida de similaridade, é uma função de distância. O núcleo gaussiano é uma medida de similaridade.

  • Você pode pensar que o kernel gaussiano é uma função de normalização para a distância euclidiana.

Olá Mundo
fonte
11
Eu também tenho outra pergunta sobre o σ na expressão. Isso tem algum significado? Na minha opinião, acho que isso pode estar relacionado à escala do agrupamento (por exemplo, o raio de um agrupamento circular).
ZFB
@zfb É um parâmetro de escala. O denominador pode ser escrito como uma constante.
HelloWorld
Então, como esse parâmetro de escala afeta o valor de K (x, x ') ou a semelhança? Se ele se tornar maior, então K (x, x ') se tornará maior. Posso dizer que a distância está sendo reduzida em escala? E, neste caso, estamos observando agrupamentos em larga escala (por exemplo, se o agrupamento for identificado por um círculo, então o raio do círculo deve ser grande ou vários pontos juntos são redefinidos para serem "pontos" agregados e depois agrupados esses pontos agregados), em vez de olhar para um menor?
Zfb 5/03
0

Da distância euclidiana, você pode derivar muitas medidas de similaridade das funções do núcleo (polinomial, exponencial, Maternal, personalizada ...), das quais nenhuma é a priori melhor ou pior que o núcleo gaussiano. Tudo depende dos seus dados e do que você espera.

Dada uma função do kernel, você também pode escolher qualquer definição de distância adequada ao seu sentimento: distância euclidiana ponderada, norma , norma , norma , distância do movedor de terra ...L1L

Agora, o núcleo gaussiano com distância euclidiana é muito comum, pois é bastante intuitivo e fornece propriedades úteis, como suavidade.

Romain Reboulleau
fonte
0

No espaço euclidiano, onde os eixos são representados por vetores , espaço tridimensional, a distância pode ser obtida conectando os dois pontos e encontrando o comprimento da conexão. Esse espaço é usado sempre que a base, cada uma das direções, é independente. Em outras palavras, sempre que for necessário encontrar a distância real, a distância euclidiana pode ser empregada se as características ou variáveis, eixos de fato, forem independentes. Pelo contrário, sempre que as variáveis ​​são correlacionadas, a distância euclidiana não pode ser empregada, porque os eixos não são mais independentes. Em situações que não são raras, o Mahalanobis pode ser utilizado. Sua forma é como a distância gaussiana.i,j,k

meios de comunicação
fonte