Um artigo publicado ( pdf ) contém estas 2 frases:
Além disso, a declaração incorreta pode ser causada pela aplicação de regras incorretas ou pela falta de conhecimento do teste estatístico. Por exemplo, o df total em uma ANOVA pode ser considerado o erro df no relatório de um teste , ou o pesquisador pode dividir o valor p relatado de um ou por dois, a fim de obter um valor unilateral , enquanto o valor de um ou já é um teste unilateral.χ 2 F p p χ 2 F
Por que eles poderiam ter dito isso? O teste do qui-quadrado é um teste bilateral. (Perguntei a um dos autores, mas não obtive resposta.)
Estou negligenciando alguma coisa?
hypothesis-testing
chi-squared
Joel W.
fonte
fonte
Respostas:
O teste do qui-quadrado é essencialmente sempre um teste unilateral . Aqui está uma maneira solta de pensar sobre isso: o teste do qui-quadrado é basicamente um teste de "qualidade do ajuste". Às vezes, é explicitamente referido como tal, mas mesmo quando não é, ainda é, em essência, uma boa adequação. Por exemplo, o teste qui-quadrado de independência em uma tabela de frequência 2 x 2 é (mais ou menos) um teste de adequação da primeira linha (coluna) à distribuição especificada pela segunda linha (coluna) e vice-versa , simultaneamente. Assim, quando o valor do qui-quadrado realizado está na extremidade direita de sua distribuição, indica um ajuste inadequado e, se for suficientemente longe, em relação a algum limite pré-especificado, podemos concluir que é tão ruim que não acreditamos que os dados sejam dessa distribuição de referência.
Se usássemos o teste do qui-quadrado como um teste bilateral, também estaríamos preocupados se a estatística estivesse muito longe no lado esquerdo da distribuição do qui-quadrado. Isso significa que estamos preocupados que o ajuste seja bom demais . Simplesmente não é algo com que estamos preocupados. (Como uma observação histórica, isso está relacionado à controvérsia sobre se Mendel falsificou seus dados. A idéia era que seus dados fossem bons demais para serem verdadeiros. Veja aqui para mais informações, se você estiver curioso.)
fonte
Isso realmente depende de duas coisas:
que hipótese está sendo testada. Se você estiver testando a variação dos dados normais em relação a um valor especificado, é bem possível lidar com as caudas superior ou inferior do qui-quadrado (unicaudal) ou as duas caudas da distribuição. Temos que lembrar que estatísticas do tipo não são os únicos testes de qui-quadrado na cidade!(O−E)2E
se as pessoas estão falando sobre a hipótese alternativa ser unilateral ou bilateral (porque algumas pessoas usam 'bicaudal' para se referir a uma alternativa bilateral, independentemente do que acontece com a distribuição amostral da estatística . Por exemplo, se estivermos analisando um teste de proporções de duas amostras, alguém pode escrever no nulo que as duas proporções são iguais e, na alternativa, escrever queπ1≠π2 e, em seguida, fale como 'bicaudal', mas teste-o usando um qui-quadrado em vez de um z-test; portanto, observe apenas a cauda superior da distribuição da estatística de teste (portanto, é bicaudal em termos de a distribuição da diferença nas proporções da amostra, mas uma em termos da distribuição da estatística qui-quadrado obtida a partir disso - da mesma maneira que se você fizer seu teste t estatístico , você estará apenas olhando uma cauda na distribuição de ).|T| |T|
Ou seja, temos que ter muito cuidado com o que pretendemos cobrir com o uso do "teste do qui-quadrado" e preciso sobre o que queremos dizer quando dizemos "unicaudal" vs "bicaudal".
Em algumas circunstâncias (duas que eu mencionei; pode haver mais), pode fazer todo o sentido chamá-lo de duas caudas, ou pode ser razoável chamá-lo de duas caudas se você aceitar alguma folga no uso da terminologia.
Pode ser uma afirmação razoável dizer que só é unilateral se você restringir a discussão a tipos específicos de testes do qui-quadrado.
fonte
O teste do qui-quadrado da hipótese de que a variação é pode ser uni ou bicaudal exatamente no mesmo sentido que o teste t da hipótese de que a média é pode ser uni ou bicaudal.(n−1)s2/σ2 σ2 (m−μ)n−−√/s μ
fonte
A resposta de @ gung está correta e é a maneira como a discussão de deve ser lida. No entanto, confusão pode surgir de outra leitura:χ2
Seria fácil interpretar a como 'frente e verso' no sentido de que a estatística de teste é tipicamente composta de uma soma de diferenças quadráticas de ambos os lados de uma distribuição original.χ2
Essa leitura seria confundir como a estatística de teste foi gerada com quais caudas da estatística de teste estão sendo analisadas.
fonte
Também tive alguns problemas para resolver essa questão, mas depois de algumas experiências, parecia que meu problema era simplesmente como os testes são nomeados.
No SPSS, por exemplo, uma tabela 2x2 pode incluir um teste de quadratura. Existem duas colunas para valores-p, uma para o "Pearson Chi-Sqare", "Correção de continuidade", etc, e outro par de colunas para o teste exato de Fisher, onde há uma coluna para um teste de dois lados e outra para um Teste unilateral.
Primeiro, pensei que os lados 1 e 2 denotavam uma versão de 1 ou 2 lados do teste do quadrilátero, o que parecia estranho. No entanto, verificou-se que isso denota a formulação subjacente da hipótese alternativa no teste de uma diferença entre proporções, ou seja, o teste z. Portanto, o teste de proporções, geralmente razoável, de dois lados é realizado no SPSS com o teste do quadrado, em que a medida do quadrado é comparada com um valor na cauda superior (unilateral) da distribuição. Acho que é isso que outras respostas à pergunta original já apontaram, mas levei algum tempo para perceber exatamente isso.
A propósito, o mesmo tipo de formulação é usado no openepi.com e possivelmente em outros sistemas também.
fonte
fonte
Os e F são testes unilaterais porque nunca temos valores negativos de e F. Para , a soma da diferença do quadrado observado e esperado ao quadrado é dividida pelo esperado (uma proporção ), portanto, o qui-quadrado é sempre um número positivo ou pode estar perto de zero no lado direito quando não há diferença. Portanto, esse teste é sempre um teste unilateral do lado direito. A explicação para o teste F é semelhante.χ 2 χ 2χ2 χ2 χ2
Para o teste F, comparamos a variação do grupo à soma das variações dentro do grupo (erro quadrático médio para . Se a soma dos quadrados entre e dentro da média for igual, obtemos um valor F de 1.SSwdfw
Como é essencialmente a razão da soma dos quadrados, o valor nunca se torna um número negativo. Portanto, não temos um teste do lado esquerdo e o teste F é sempre um teste do lado direito. Verifique os números das e F, eles são sempre positivos. Para ambos os testes, você está analisando se a estatística calculada está à direita do valor crítico.χ2
fonte