Eu tenho dados que representam algum aspecto do comportamento humano. Quero agrupá-lo (sem supervisão) em perfis comportamentais de algum tipo. agora, algumas das minhas variáveis são categóricas (com 2 ou mais categorias) e outras são contínuas (a maioria são porcentagens). Algumas variáveis são ainda mais complexas, pois uma categoria tem mais continuidade e a outra não possui esses dados adicionais.
Minha pergunta é sobre como categorizar esses dados. Quais são as abordagens (comuns?) Para lidar com isso?
Não preciso de código nem nada, mas algumas referências ou orientações que me ajudarão a entender melhor como lidar com esse desafio.
Se você conhece R
funções que facilitam essa análise, isso seria ótimo, mas não é necessário.
obrigado.
Respostas:
fonte
Veja https://cran.r-project.org/web/packages/ClustOfVar para o pacote de R
ClustOfVar
. Parece implementar alguns dos melhores métodos de cluster disponíveis para misturas de tipos de variáveis.fonte