Quando usar o modelo de mistura gaussiano?

9

Eu sou novo no uso de GMMs. Não consegui encontrar nenhuma ajuda apropriada online. Alguém poderia me fornecer o recurso correto sobre "Como decidir se o uso do GMM é adequado ao meu problema?" ou no caso de problemas de classificação "Como decidir se devo usar a classificação SVM ou GMM?"

Vinay
fonte
qual é o seu conjunto de dados e qual é o seu problema exato? É usado quando os dados seguem (é uma mistura de) mais de uma distribuição normal. Veja outra pergunta - stats.stackexchange.com/questions/236295/…
Arpit Sisodia
Você pode pensar nisso como uma forma de agrupamento em que não possui dados rotulados e acredita que os agrupamentos latentes são perfeitamente multivariados normais.
gung - Restabelece Monica
@ arpit-sisodia, estamos trabalhando na viabilidade de uma configuração de teclado de hardware que parece ter recursos específicos e planejamos modelá-la usando o GMM. Não conhecemos claramente o processo subjacente e, portanto, estamos tentando modelar usando métodos de aprendizado de máquina. Portanto, não temos certeza se existe realmente uma mistura de gaussianos no processo subjacente. Além disso, ele é multi-dimensional e que não pode visualizar-o para ver se é mistura de Gaussianas
Vinay
@ arpit-sisodia, o link que você forneceu sugere mais métodos de tentativa e erro para ver se o GMM se encaixa nos meus dados. Existe uma maneira conclusiva / regra Thumb para decidir sobre os modelos a serem usados. O método de tentativa e erro de jogar com mais misturas pode ajustar meus dados. Mas existe uma certa maneira de decidir? Como precisamos ter separabilidade linear dos dados para classificação SVM
Vinay

Respostas:

4

Na minha opinião, você pode executar o GMM quando souber que os pontos de dados são misturas de uma distribuição gaussiana. Basicamente, formando grupos com diferentes médias e desvio padrão. Há um belo diagrama no site scikit-learn. eu

Classificação GMM

Uma abordagem é encontrar os clusters usando métodos de cluster suave e, em seguida, ver se eles são gaussianos. Se estiverem, você pode aplicar um modelo GMM que represente todo o conjunto de dados.

Assassino
fonte
11
frequentemente não sabemos se os pontos de dados são mistura de gaussianos. Portanto, isso é mais uma brincadeira com Gaussian e MoG e veja se ele se encaixa. Mas não há direções regras / polegar de ir sobre em usar GMM direito
Vinay
2
De acordo com a minha experiência, você precisa encontrar o padrão nos dados que é um modelo de mistura. Um bom artigo para ler seria o seguinte: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer
0

Os GMMs geralmente são um bom ponto de partida se seu objetivo é (1) observar agrupamentos, (2) especificar um modelo generativo ou (3) estimar densidades. De fato, para agrupar, os GMMs são um superconjunto de k-means.

1_e
fonte