Estou tentando encontrar uma solução para comparar dois testes de "qui-quadrado de qualidade de ajuste". Mais precisamente, quero comparar os resultados de duas experiências independentes. Nesses experimentos, os autores usaram o qui-quadrado de qualidade de ajuste para comparar estimativas aleatórias (frequências esperadas) com frequências observadas. Os dois experimentos tiveram o mesmo número de participantes e os procedimentos experimentais são idênticos, apenas os estímulos foram alterados. Os resultados de duas experiências indicaram um qui-quadrado significativo (exp. 1: X² (18) = 45; p <0,0005 e exp. 2: X² (18) = 79; p <0,0001).
Agora, o que eu quero fazer é testar se há uma diferença entre esses dois resultados. Penso que uma solução poderia ser o uso de intervalos de confiança, mas não sei como calcular esses intervalos de confiança apenas com esses resultados. Ou talvez um teste para comparar o tamanho do efeito (w de Cohen)?
Alguém tem uma solução?
Muito obrigado!
FD
fonte
Respostas:
A informação muito limitada que você possui é certamente uma restrição severa! No entanto, as coisas não são totalmente inúteis.
Sob as mesmas suposições que levam à distribuição assintótica do para a estatística de teste do teste de qualidade de ajuste com o mesmo nome, a estatística do teste sob a hipótese alternativa possui, assintoticamente, uma distribuição não central de χ 2 . Se assumirmos que os dois estímulos são a) significativos eb) têm o mesmo efeito, as estatísticas de teste associadas terão a mesma distribuição χ 2 assintótica não central . Podemos usar isso para construir um teste - basicamente, através da estimativa do parâmetro noncentrality λ e vendo se as estatísticas de teste são muito nas caudas da não central χ 2 ( 18 , λ )χ2 χ2 χ2 λ χ2( 18 , λ^) distribuição. (Isso não quer dizer que este teste terá muito poder, no entanto.)
Podemos estimar o parâmetro de não centralidade, dadas as duas estatísticas de teste, calculando sua média e subtraindo os graus de liberdade (um estimador de métodos de momentos), fornecendo uma estimativa de 44 ou pela máxima probabilidade:
Boa concordância entre nossas duas estimativas, o que não é surpreendente, dados dois pontos de dados e os 18 graus de liberdade. Agora, para calcular um valor-p:
Portanto, nosso valor-p é 0,12, insuficiente para rejeitar a hipótese nula de que os dois estímulos são iguais.
que fornece o seguinte:
Olhando para os verdadeiros pontos de hipótese nulos (valor do eixo x = 0), vemos que o teste é conservador, pois não parece rejeitar tão frequentemente quanto o nível indicaria, mas não de maneira esmagadora. Como esperávamos, ele não tem muito poder, mas é melhor que nada. Gostaria de saber se existem testes melhores por aí, dada a quantidade muito limitada de informações que você tem disponível.
fonte
Você pode obter o V do Cramer, interpretável como uma correlação, convertê-lo em um Z de Fisher e, em seguida, o intervalo de confiança disso é direto (SE = 1 / sqrt (n-3): Z ± se * 1,96). Depois de obter as extremidades do IC, você pode convertê-las novamente em r.
Você já pensou em colocar todas as suas contagens em uma tabela de contingência com uma dimensão adicional do experimento?
fonte