Estou realizando um teste de adequação do qui-quadrado (GOF) com três categorias e quero especificamente testar o nulo de que as proporções da população em cada categoria são iguais (ou seja, a proporção é de 1/3 em cada grupo):
DADOS OBSERVADOS
Grupo 1 Grupo 2 Grupo 3 Total
686 928 1012 2626
Assim, para este teste GOF, as contagens esperadas são 2626 (1/3) = 875.333 e o teste produz um valor p altamente significativo de <0,0001.
Agora, é óbvio que o Grupo 1 é significativamente diferente de 2 e 3 e é improvável que 2 e 3 sejam significativamente diferentes. No entanto, se eu quisesse testar tudo isso formalmente e conseguir fornecer um valor- p para cada caso, qual seria o método apropriado?
Pesquisei on-line por toda parte e parece que há opiniões diferentes, mas sem documentação formal. Gostaria de saber se existe um texto ou artigo revisado por pares que trate disso.
O que me parece razoável é, à luz do teste geral significativo, fazer testes z para a diferença em cada par de proporções, possivelmente com uma correção no valor (talvez Bonferroni, por exemplo).
Respostas:
Para minha surpresa, algumas pesquisas não pareciam trazer discussões prévias sobre post-hoc para se adequar; Espero que exista provavelmente um aqui em algum lugar, mas como não consigo localizá-lo facilmente, acho razoável transformar meus comentários em uma resposta, para que as pessoas possam pelo menos encontrá-lo usando os mesmos termos de pesquisa que acabei de usar.
As comparações aos pares que você procura fazer (condicionadas apenas à comparação dos dois grupos envolvidos) são sensatas.
Isso equivale a pegar pares de grupos e testar se a proporção em um dos grupos difere de 1/2 (um teste de proporções de uma amostra). Isso - como você sugere - pode ser feito como um teste z (embora o teste binomial e a qualidade do ajuste do qui-quadrado também funcionem).
Muitas das abordagens usuais para lidar com a taxa de erro geral do tipo I devem funcionar aqui (incluindo Bonferroni - junto com os problemas usuais que podem vir com ela).
fonte
so you suggest compare 16 and 14 against 15/15
@Niksr, não. Glen compara os dois grupos como50/50
porcentagem. O terceiro grupo é excluído da comparação.Eu tive o mesmo problema (e fiquei feliz em encontrar este post). Agora também encontrei uma breve nota sobre o assunto em Sheskin (2003: 225) que eu apenas queria compartilhar:
"Outro tipo de comparação que pode ser conduzida é contrastar apenas duas das seis células originais uma com a outra. Especificamente, suponhamos que queremos comparar a célula l / segunda-feira com a célula 2 / terça-feira. Observe [...] que no exemplo acima, como empregamos apenas duas células, a probabilidade de cada célula será π_i = 1/2 A frequência esperada de cada célula é obtida multiplicando π_i = 1/2 pelo número total de observações nas duas células (que igual a 34). Como observado anteriormente, ao realizar uma comparação como a acima, uma questão crítica que o pesquisador deve abordar é qual o valor do alfa a ser empregado na avaliação da hipótese nula ".
Sheskin, DJ 2003. Manual de Procedimentos Estatísticos Paramétricos e Não Paramétricos: Terceira Edição. CRC Pressione.
fonte