O qui-quadrado é sempre um teste unilateral?

48

Um artigo publicado ( pdf ) contém estas 2 frases:

Além disso, a declaração incorreta pode ser causada pela aplicação de regras incorretas ou pela falta de conhecimento do teste estatístico. Por exemplo, o df total em uma ANOVA pode ser considerado o erro df no relatório de um teste , ou o pesquisador pode dividir o valor p relatado de um ou por dois, a fim de obter um valor unilateral , enquanto o valor de um ou já é um teste unilateral.χ 2 F p p χ 2 FFχ2Fppχ2F

Por que eles poderiam ter dito isso? O teste do qui-quadrado é um teste bilateral. (Perguntei a um dos autores, mas não obtive resposta.)

Estou negligenciando alguma coisa?

Joel W.
fonte
Veja o exercício 4.14 da edição de 2004 da Econômica Teoria e Métodos da Davidson & Mackinnon para um exemplo (excepcional) de quando o Qui-quadrado é usado para um teste bicaudal. Edit: ótima explicação aqui: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Max

Respostas:

50

O teste do qui-quadrado é essencialmente sempre um teste unilateral . Aqui está uma maneira solta de pensar sobre isso: o teste do qui-quadrado é basicamente um teste de "qualidade do ajuste". Às vezes, é explicitamente referido como tal, mas mesmo quando não é, ainda é, em essência, uma boa adequação. Por exemplo, o teste qui-quadrado de independência em uma tabela de frequência 2 x 2 é (mais ou menos) um teste de adequação da primeira linha (coluna) à distribuição especificada pela segunda linha (coluna) e vice-versa , simultaneamente. Assim, quando o valor do qui-quadrado realizado está na extremidade direita de sua distribuição, indica um ajuste inadequado e, se for suficientemente longe, em relação a algum limite pré-especificado, podemos concluir que é tão ruim que não acreditamos que os dados sejam dessa distribuição de referência.

Se usássemos o teste do qui-quadrado como um teste bilateral, também estaríamos preocupados se a estatística estivesse muito longe no lado esquerdo da distribuição do qui-quadrado. Isso significa que estamos preocupados que o ajuste seja bom demais . Simplesmente não é algo com que estamos preocupados. (Como uma observação histórica, isso está relacionado à controvérsia sobre se Mendel falsificou seus dados. A idéia era que seus dados fossem bons demais para serem verdadeiros. Veja aqui para mais informações, se você estiver curioso.)

- Reinstate Monica
fonte
9
+1 por mencionar o uso frente e verso nos experimentos de Mendel com ervilhas: é memorável e chega ao cerne da questão.
whuber
2
+1 para uma boa pergunta e uma excelente resposta. @ Joel W: Posso altamente recomendável vídeo Khan Academys na testχ2
Max Gordon
9
Meu resumo disso é que o é um teste bilateral, pelo qual geralmente estamos interessados ​​em apenas uma das caudas da distribuição, indicando mais discordância, em vez de menos discordância do que se espera por acaso. χ2
Frank Harrell
5
Apoiando a visão bicaudal: "A probabilidade bicaudal além de +/- z para a distribuição normal padrão é igual à probabilidade cauda direita acima de z-quadrado para a distribuição qui-quadrado com df = 1. Por exemplo, o bi- A probabilidade normal padrão de cauda de 0,05 que cai abaixo de -1,96 e acima de 1,96 é igual à probabilidade do qui-quadrado da cauda direita acima de (1,96) ao quadrado = 3,84 quando df = 1 ". Agresti, 2007 (2ª ed.) Página 11
Joel W.
5
Está certo. O quadrado de um escore z produz uma variável qui-quadrado. Por exemplo, az de 2 (ou -2!) Quando ao quadrado é igual a 4, o valor do qui-quadrado correspondente. O valor p bicaudal associado a um escore z de 2 é 0,04550026; e o valor p unicaudal associado a um valor qui-quadrado de 4 (df = 1) é 0,04550026. Um teste z bicaudal corresponde a um teste qui-quadrado de uma cauda. Observar a cauda esquerda da distribuição qui-quadrado corresponderia à busca de escores z mais próximos de z = 0 do que você poderia esperar por acaso.
gung - Restabelece Monica
12

O qui-quadrado é sempre um teste unilateral?

Isso realmente depende de duas coisas:

  1. que hipótese está sendo testada. Se você estiver testando a variação dos dados normais em relação a um valor especificado, é bem possível lidar com as caudas superior ou inferior do qui-quadrado (unicaudal) ou as duas caudas da distribuição. Temos que lembrar que estatísticas do tipo não são os únicos testes de qui-quadrado na cidade!(OE)2E

  2. se as pessoas estão falando sobre a hipótese alternativa ser unilateral ou bilateral (porque algumas pessoas usam 'bicaudal' para se referir a uma alternativa bilateral, independentemente do que acontece com a distribuição amostral da estatística . Por exemplo, se estivermos analisando um teste de proporções de duas amostras, alguém pode escrever no nulo que as duas proporções são iguais e, na alternativa, escrever queπ1π2e, em seguida, fale como 'bicaudal', mas teste-o usando um qui-quadrado em vez de um z-test; portanto, observe apenas a cauda superior da distribuição da estatística de teste (portanto, é bicaudal em termos de a distribuição da diferença nas proporções da amostra, mas uma em termos da distribuição da estatística qui-quadrado obtida a partir disso - da mesma maneira que se você fizer seu teste t estatístico , você estará apenas olhando uma cauda na distribuição de ).|T||T|

Ou seja, temos que ter muito cuidado com o que pretendemos cobrir com o uso do "teste do qui-quadrado" e preciso sobre o que queremos dizer quando dizemos "unicaudal" vs "bicaudal".

Em algumas circunstâncias (duas que eu mencionei; pode haver mais), pode fazer todo o sentido chamá-lo de duas caudas, ou pode ser razoável chamá-lo de duas caudas se você aceitar alguma folga no uso da terminologia.

Pode ser uma afirmação razoável dizer que só é unilateral se você restringir a discussão a tipos específicos de testes do qui-quadrado.

Glen_b
fonte
que tal este? stats.stackexchange.com/questions/223560/…
Um velho no mar.
Muito obrigado por mencionar o teste de variação. Esse é realmente um uso bastante interessante do teste, e também a razão pela qual eu acabei nesta página ^^
Tobbey 9/09/09
5

O teste do qui-quadrado da hipótese de que a variação é pode ser uni ou bicaudal exatamente no mesmo sentido que o teste t da hipótese de que a média é pode ser uni ou bicaudal.(n1)s2/σ2σ2(mμ)n/sμ

Ray Koopman
fonte
1

A resposta de @ gung está correta e é a maneira como a discussão de deve ser lida. No entanto, confusão pode surgir de outra leitura:χ2

Seria fácil interpretar a como 'frente e verso' no sentido de que a estatística de teste é tipicamente composta de uma soma de diferenças quadráticas de ambos os lados de uma distribuição original.χ2

Essa leitura seria confundir como a estatística de teste foi gerada com quais caudas da estatística de teste estão sendo analisadas.

conjecturas
fonte
Você poderia elaborar o que seria um "lado de uma distribuição original"? Nem sequer é evidente a que essa "distribuição original" se refere nem como ela está relacionada à estatística do qui-quadrado calculada a partir dos dados.
whuber
Por exemplo, uma soma de normais independentes ao quadrado é . Os normais são a distribuição 'original'. A estatística incorpora informações de ambas as caudas da distribuição normal subjacente. nχ2χ2
conjeturas
OK, mas ainda não consigo descobrir com o que você está contrastando. Você poderia fornecer um exemplo de uma estatística de teste sem dois lados que poderia ser usada na ANOVA e mostrar como ela está conectada às caudas de alguma distribuição?
whuber
Não estou contrastando com nada. Estou apontando uma razão pela qual as pessoas podem ficar confusas sobre o jargão unilateral / bilateral no contexto de . É simples para os especialistas ver que o próprio teste é geralmente um teste unilateral na estatística calculada. Outros podem ter alguns dados e estar pensando em desvios da média em ambas as direções, que geralmente são agrupados em uma estatística . Eles terão ouvido coisas como "pensar em desvios da média nas duas direções = teste nos dois lados". Daí um mal-entendido. χ2χ2χ2
conjeturas
Estou pedindo um contraste apenas para ajudar a entender o que você está tentando descrever. Ainda não consegui determinar o que é isso.
whuber
0

Também tive alguns problemas para resolver essa questão, mas depois de algumas experiências, parecia que meu problema era simplesmente como os testes são nomeados.

No SPSS, por exemplo, uma tabela 2x2 pode incluir um teste de quadratura. Existem duas colunas para valores-p, uma para o "Pearson Chi-Sqare", "Correção de continuidade", etc, e outro par de colunas para o teste exato de Fisher, onde há uma coluna para um teste de dois lados e outra para um Teste unilateral.

Primeiro, pensei que os lados 1 e 2 denotavam uma versão de 1 ou 2 lados do teste do quadrilátero, o que parecia estranho. No entanto, verificou-se que isso denota a formulação subjacente da hipótese alternativa no teste de uma diferença entre proporções, ou seja, o teste z. Portanto, o teste de proporções, geralmente razoável, de dois lados é realizado no SPSS com o teste do quadrado, em que a medida do quadrado é comparada com um valor na cauda superior (unilateral) da distribuição. Acho que é isso que outras respostas à pergunta original já apontaram, mas levei algum tempo para perceber exatamente isso.

A propósito, o mesmo tipo de formulação é usado no openepi.com e possivelmente em outros sistemas também.

Robert L
fonte
0

χ2 teste de variância pode ser de um ou dois lados: a estatística do teste é e a hipótese nula é: s (desvio da amostra) = (um valor de referência). A hipótese alternativa poderia ser: (a) , (b) , (c) . A caculação do valor p envolve a assimetria da distribuição. σs>σs<σsσ(n1)s2σ2σs>σs<σsσ

shahuss
fonte
11
Bem-vindo ao CV! Acho que a resposta de Ray Koopman já cobre esse ponto.
Silverfish 12/09
-1

Os e F são testes unilaterais porque nunca temos valores negativos de e F. Para , a soma da diferença do quadrado observado e esperado ao quadrado é dividida pelo esperado (uma proporção ), portanto, o qui-quadrado é sempre um número positivo ou pode estar perto de zero no lado direito quando não há diferença. Portanto, esse teste é sempre um teste unilateral do lado direito. A explicação para o teste F é semelhante.χ 2 χ 2χ2χ2χ2

Para o teste F, comparamos a variação do grupo à soma das variações dentro do grupo (erro quadrático médio para . Se a soma dos quadrados entre e dentro da média for igual, obtemos um valor F de 1.SSwdfw

Como é essencialmente a razão da soma dos quadrados, o valor nunca se torna um número negativo. Portanto, não temos um teste do lado esquerdo e o teste F é sempre um teste do lado direito. Verifique os números das e F, eles são sempre positivos. Para ambos os testes, você está analisando se a estatística calculada está à direita do valor crítico. χ2

Distribuições Qui-quadrado e F

Daniel
fonte
11
Uma estatística de teste não precisa levar valores negativos para considerarmos as duas caudas. Considere um teste F para a razão de duas variações, por exemplo.
Glen_b
O teste F é o teste unilateral Glen_b.
Daniel
3
O teste F para igualdade de variâncias, que tem uma estatística que é a razão das duas estimativas de variância, NÃO é unilateral; existe uma aproximação que coloca a maior das duas variações de amostra no numerador, mas só é realmente correto se o df for o mesmo. Mas se você não gosta disso, existem vários outros exemplos. A estatística para o teste de soma de classificação não pode ser negativa, mas o teste é bicaudal. Eu posso fornecer outros exemplos, se necessário.
Glen_b
σ12σ22σ12>σ22