Como a distância de Gower calcula a diferença entre variáveis ​​binárias '?

13

Eu tenho 17 variáveis ​​numéricas e 5 binárias (0-1), com 73 amostras no meu conjunto de dados. Eu preciso executar uma análise de cluster. Eu sei que a distância de Gower é uma boa métrica para conjuntos de dados com variáveis ​​mistas. No entanto, eu não conseguia entender como a distância de Gower calcula a diferença entre variáveis ​​binárias . Parece-me que não é diferente da distância euclidiana.

Emrah Bilgiç
fonte
Sua pergunta não é clara. Você está simplesmente perguntando 'como a distância de Gower calcula a diferença entre variáveis ​​binárias'? O que significa "não há diferença do que euclidiano"?
gung - Restabelece Monica
11
Obrigado. Desculpe, pergunto como Gower calcula a diferença entre variáveis ​​binárias. Quero dizer, eu não conseguia entender as diferenças entre elas. Euclidiano e Gower para variável binária.
Emrah Bilgic
Você pesquisou neste site Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Sim eu fiz. A distância euclidiana é 0, se ambas as amostras tiverem o mesmo valor, 1 se não. E quanto a Gower?
Emrah Bilgic
4
@ EmrahBilgiç, a métrica de Gower é similaridade, não distância. Torna-se "distância" quando é subtraído de 1. Leia no link acima como ele processa dados binários.
ttnphns

Respostas:

5

E os atributos binários que possuem os valores "m" e "f" para "masculino" e "feminino"?

Você percebe que, para uma variável dicotômica, tudo o que você pode obter é "igual" ou "diferente"? A principal diferença entre as distâncias não é se o valor for 1 ou 0; mas como várias variáveis ​​são combinadas.

Possui QUIT - Anony-Mousse
fonte
3

A distância de Gower usa Manhattan para calcular a distância entre pontos de dados contínuos e Dados para calcular a distância entre pontos de dados categóricos

Sanjeet
fonte