Eu tenho dados classificados cruzados em uma tabela 2 x 2 x 6. Vamos chamar as dimensões response
, A
e B
. Ajustei uma regressão logística aos dados com o modelo response ~ A * B
. Uma análise de desvio desse modelo diz que os termos e sua interação são significativos.
No entanto, olhando para as proporções dos dados, parece que apenas 2 níveis B
são responsáveis por esses efeitos significativos. Eu gostaria de testar para ver quais níveis são os culpados. No momento, minha abordagem é realizar 6 testes qui-quadrado em 2 x 2 tabelas de response ~ A
e, em seguida, ajustar os valores de p desses testes para múltiplas comparações (usando o ajuste de Holm).
Minha pergunta é se existe uma abordagem melhor para esse problema. Existe uma abordagem de modelagem mais baseada em princípios ou uma abordagem de comparação de testes com qui-quadrado?
Respostas:
Você deve procurar "particionar o qui-quadrado". Isso é semelhante em lógica à execução de testes post-hoc na ANOVA. Isso permitirá que você determine se seu teste geral significativo é atribuído principalmente a diferenças em categorias ou grupos de categorias específicos.
Um rápido google apareceu esta apresentação, que no final discute métodos para particionar o qui-quadrado.
http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf
fonte
A abordagem sem princípios é descartar os dados desproporcionais, reequipar o modelo e ver se as razões de chances logit / condicionais para resposta e A são muito diferentes (controlando B). Isso pode lhe dizer se há motivo para preocupação. Reunir os níveis de B é outra abordagem. Em linhas mais baseadas em princípios, se você está preocupado com proporções relativas que induzem o paradoxo de Simpson, pode analisar os índices de chances condicionais e marginais da resposta / A e ver se eles revertem.
Para evitar múltiplas comparações em particular, a única coisa que me ocorre é usar um modelo hierárquico que explique efeitos aleatórios entre os níveis.
fonte
Não sei exatamente quais são seus objetivos ou por que eles são o que são. Mas, em vez de testar hipóteses, geralmente recomendo focar a atenção em previsões e intervalos de confiança.
fonte
O teste Post Hoc pode ser adequado ao seu problema. Função chisqPostHoc () nos testes R para diferenças significativas entre todos os pares de populações em um teste qui-quadrado. Mesmo assim, não o usei, mas esse link pode ser útil. https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html
Outra alternativa pode ser a função chisq.desc () do pacote EnQuireR.
fonte