Compare ajustes do modelo com resposta transformada e não transformada

11

Eu quero comparar dados que proporções entre três grupos diferentes, por exemplo:

 ID Group Prop.Nitrogen
 1    A     0.89
 2    A     0.85
 3    B     0.92
 4    B     0.97

Seguindo Wharton e Hui (doi: 10.1890 / 10-0340.1 1 ), pensei em ver se esses dados seriam melhor tratados usando um logit transformado.

Quando olho para gráficos de diagnóstico de modelos lineares nos dados transformados e não transformados, eles se parecem muito sem problemas óbvios e existem apenas pequenas diferenças nos parâmetros estimados. No entanto, eu ainda gostaria de poder dizer algo sobre o quão bem o modelo se encaixa nas versões transformadas e não transformadas dos dados - eu sei que não posso comparar diretamente os valores da AIC. Existe uma correção e posso fazer para examinar isso? Ou devo seguir uma abordagem diferente?

david w
fonte
Você pode tentar uma transformação Box-Cox ( boxcox()na biblioteca MASS), embora não tenha certeza se ela pode lidar com transformações de logit.
Marius
@ Marius: para esclarecer, você está sugerindo boxcox()os dados brutos ou os dados transformados?
313 Michelle
Que tal transformar os dados e os valores ajustados em uma escala relevante para o assunto (para que você tenha uma escala unificada) e depois calcular o AIC para todos os modelos concorrentes que você possui? Você precisaria calcular os valores da AIC manualmente para modelos que se encaixavam originalmente em uma escala diferente, mas não acho que isso possa ser um problema.
Richard Hardy

Respostas:

1

Minha experiência com dados transformados sugere que a correlação melhora após a transformação, assim como a homocedasticidade e / ou normalidade, embora elas não sejam necessariamente todas ideais para uma única transformação. Uma resposta simples pode ser calcular coeficientes de correlação entre os dois modelos e seus respectivos conjuntos de dados. Pode-se até testar a significância da diferença dos coeficientes de correlação correlacionados. Testes para resíduos de homoscedasticidade e função de densidade também podem oferecer um meio de avaliá-los.

Carl
fonte