Como combinar PCA e MCA em dados mistos?

9

Suponha que eu tenha dados misturados e código (python) capaz de executar PCA (análise de componentes principais) em preditores contínuos e MCA (análise de correspondência múltipla) em preditores nominais. É possível combinar resultados do PCA e MCA em um?

Wojciech Migda
fonte

Respostas:

8

Você pode querer usar a análise fatorial de dados mistos .

Permite reduzir a dimensão em um conjunto de dados completo.

A implementação de AR pode ser encontrada no pacote FactoMineR. Mas essa função é problemática quando você tem um número alto de dados / colunas.

Não estou ciente da existência do equivalente em python.

YCR
fonte
Obrigado, eu já li sobre o FAMD antes, que infelizmente parece ter apenas suporte para R - daí a minha pergunta. O mínimo que posso fazer agora é tratar os resultados de ambos os métodos (PCA e MCA) em separação. No entanto, se houver uma maneira de 'misturá-los' para produzir um conjunto de dados monolítico, esta é a resposta que estou procurando.
Wojciech Migda
Ok, verificou-se que meu conjunto de dados é grande o suficiente para tornar a implementação do MCA em mãos para ficar sem memória.
Wojciech Migda
Esse é um problema recorrente que recebo com a implementação do R. Se você tiver um conjunto limitado de variáveis, tente ponderar suas observações. Ou use apenas um subconjunto de sua observação. Caso contrário, você pode tentar transformar sua variável numérica em categoria ordinal ou transformar suas variáveis ​​qualitativas em sinalizadores.
YCR 19/01/19
3

Você pode encontrar a implementação do FAMD para Python aqui .

Hajar Homayouni
fonte
1

Eu estava procurando a mesma coisa em Python e vim o pacote prince que o FAMD implementou.

Edo
fonte
1

Como não tenho pontos suficientes para comentar, responda aqui O pacote @Edo prince tem apenas pacotes CA, MCA e PCA. Não vejo nenhum FAMD aqui.

dir(prince)

['CA', 'MCA', 'PCA', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', 'ca', 'mca', 'pca', 'plot', 'svd']
S_Ymln
fonte