Estou estudando o modelo Gaussian Mixture e me proponho a essa pergunta.
Suponha que os dados subjacentes sejam gerados a partir de uma mistura de distribuição Gaussiana e cada um deles tenha um vetor médio μ k ∈ R p , onde 1 ≤ k ≤ K e cada um deles tenha a mesma matriz de co-variância Σ e assuma que Σ é uma matriz diagonal. E suponha que a taxa de mistura seja 1 / K , ou seja, cada cluster tem o mesmo peso.
Portanto, neste exemplo ideal, o único trabalho é estimar os vetores médios μ k ∈ R p , onde 1 ≤ k ≤ K e a matriz de co-variância Σ .
A minha pergunta é: se usarmos EM algoritmo, seremos capazes de estimar consistentemente e Σ , ou seja, quando tamanho da amostra n → ∞ , será o estimador de produzido pela EM algoritmo de alcançar o verdadeiro valor de μ k e Σ ?