Vantagens relativas da imputação múltipla e maximização de expectativas (EM)

8

Eu tenho um problema em que

y=a+b

Eu observo y, mas nem nem . Eu quero estimarbab

b=f(x)+ϵ

Eu posso estimar , usando algum tipo de modelo de regressão. Isso me dá . Eu poderia então estimarbab^

b^=f(x)+ϵ

Primeiro problema: um modelo de regressão para prever poderia levar a ser negativo, o que não faria sentido. Não tenho certeza de como contornar isso (não é o tipo de problema com o qual eu lidei muito), mas parece ser o tipo de coisa com a qual outras pessoas lidam rotineiramente. Algum tipo de GLM não gaussiano?bab^

O principal problema é como explicar a incerteza no modelo principal resultante da estimativa de . Eu usei várias imputações antes para covariáveis ​​ausentes. Mas este é um "parâmetro latente" ausente. Como alternativa, são dados de resultados, que parecem adequados para imputar . No entanto, ouço frequentemente o EM usado para parâmetros "latentes". Não sei por que, nem sei se o EM é melhor nesses contextos. O MI é intuitivo para entender, implementar e se comunicar. O EM é intuitivo de entender, mas parece mais difícil de implementar (e ainda não o fiz). b^

O EM é superior para o tipo de problema que tenho acima? Se sim, por quê? Segundo, como implementá-lo em R para um modelo linear ou para um modelo semiparamétrico (GAM)?

generic_user
fonte
Uma ideia é a utilização de distribuição beta para modelo e, em seguida, definirb =Y(1 - c )c=ayb^=y(1c^)
probabilityislogic

Respostas:

1

Se faz sentido usar GLMs ou não, depende da distribuição de . Eu estaria inclinado a usar um modelo não linear de mínimos quadrados para a coisa toda.y

Portanto, se seu modelo de regressão é que são os preditores e são os parâmetros no modelo de regressão para , e seu modelo para é mas onde é restrito para não ser negativo, você pode escrever e ajustar um modelo como este:Z α a b b = f ( x ) + ϵ f ( x ) f ( x ) = exp ( ψ ( x ) )a=Zα+νZαabb=f(x)+ϵf(x)f(x)=exp(ψ(x))

y=Zα+exp(ψ(x))+η

onde é a soma dos dois termos de ruído individuais. (Se você realmente pretende que sem nenhum erro, é necessário fazê-lo de maneira diferente; isso não é realmente um problema de estatísticas, mas sim um problema de aproximação e, provavelmente, você deseja examinar as normas infinitas.)y = a + bηy=a+b

ψa

yf

Isso ainda não trata da questão da imputação. No entanto, esse tipo de estrutura de modelo pode ser inserido em algo como sua sugestão de uso do EM.

Glen_b -Reinstate Monica
fonte
a^
É muita informação pertinente que deve ser explicada na sua pergunta, eu acho.
Glen_b -Reinstala Monica