Vários testes qui-quadrado

11

Eu tenho dados classificados cruzados em uma tabela 2 x 2 x 6. Vamos chamar as dimensões response, Ae B. Ajustei uma regressão logística aos dados com o modelo response ~ A * B. Uma análise de desvio desse modelo diz que os termos e sua interação são significativos.

No entanto, olhando para as proporções dos dados, parece que apenas 2 níveis Bsão responsáveis ​​por esses efeitos significativos. Eu gostaria de testar para ver quais níveis são os culpados. No momento, minha abordagem é realizar 6 testes qui-quadrado em 2 x 2 tabelas de response ~ Ae, em seguida, ajustar os valores de p desses testes para múltiplas comparações (usando o ajuste de Holm).

Minha pergunta é se existe uma abordagem melhor para esse problema. Existe uma abordagem de modelagem mais baseada em princípios ou uma abordagem de comparação de testes com qui-quadrado?

JoFrhwld
fonte
Certa vez, fiz a mesma pergunta na lista de discussão R e não obtive resposta. Eu sugiro que você altere seu título, pois sua pergunta é sobre "análise post hoc do quadrado do chi - para detectar a causa do significado" (títulos mais curtos que o que propus seriam melhores :))
Tal Galili
Basta olhar os betas para seus culpados ... E usar um modelo log-linear de poisson. Você obtém a mesma coisa que o teste do qui-quadrado, mas obtém todos os testes diferentes de uma só vez.
probabilityislogic

Respostas:

11

Você deve procurar "particionar o qui-quadrado". Isso é semelhante em lógica à execução de testes post-hoc na ANOVA. Isso permitirá que você determine se seu teste geral significativo é atribuído principalmente a diferenças em categorias ou grupos de categorias específicos.

Um rápido google apareceu esta apresentação, que no final discute métodos para particionar o qui-quadrado.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf

Brett
fonte
Interessante. Você já se deparou com uma implementação R disso?
Tal Galili
Não, não diretamente. No entanto, R fornecerá tudo o que você precisa para fazer isso - como: as contagens observadas, os valores esperados e os resíduos para cada célula. x <- matriz (c (12, 5, 7, 7), ncol = 2) chisq.test (x) chisq.test observado (x) $ residuaisexpectedchisq.test(x)
Brett
Vou te dar uma nota, pois isso deve ser útil para a minha vida de pesquisa. No entanto, essa abordagem é aplicável a uma matriz ixj. No entanto, a minha pergunta envolve uma matriz ixjxk,
JoFrhwld
2
O particionamento de qui-quadrado é extensível a tabelas de contingência de várias vias. Aqui está o artigo que Agresti cita em seu livro, de fato ... HO Lancaster (1951) "Tabelas complexas de contingência tratadas pela partição do χ2" Jornal da Royal Statistical Society. Série B (Metodológica), vol. 13, No. 2
Brett
1

A abordagem sem princípios é descartar os dados desproporcionais, reequipar o modelo e ver se as razões de chances logit / condicionais para resposta e A são muito diferentes (controlando B). Isso pode lhe dizer se há motivo para preocupação. Reunir os níveis de B é outra abordagem. Em linhas mais baseadas em princípios, se você está preocupado com proporções relativas que induzem o paradoxo de Simpson, pode analisar os índices de chances condicionais e marginais da resposta / A e ver se eles revertem.

Para evitar múltiplas comparações em particular, a única coisa que me ocorre é usar um modelo hierárquico que explique efeitos aleatórios entre os níveis.

ars
fonte
0

Não sei exatamente quais são seus objetivos ou por que eles são o que são. Mas, em vez de testar hipóteses, geralmente recomendo focar a atenção em previsões e intervalos de confiança.

Michael Bishop
fonte
0

O teste Post Hoc pode ser adequado ao seu problema. Função chisqPostHoc () nos testes R para diferenças significativas entre todos os pares de populações em um teste qui-quadrado. Mesmo assim, não o usei, mas esse link pode ser útil. https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

Outra alternativa pode ser a função chisq.desc () do pacote EnQuireR.

Dr Nisha Arora
fonte