Li que o teste do qui quadrado é útil para verificar se uma amostra é significativamente diferente de um conjunto de valores esperados.
Por exemplo, aqui está uma tabela de resultados de uma pesquisa sobre as cores favoritas das pessoas (n = 15 + 13 + 10 + 17 = 55 total de participantes):
red,blue,green,yellow
15,13,10,17
Um teste do qui-quadrado pode me dizer se essa amostra é significativamente diferente da hipótese nula de probabilidade igual de pessoas gostando de cada cor.
Pergunta: O teste pode ser executado nas proporções do total de participantes que gostam de uma determinada cor? Como abaixo:
red,blue,green,yellow
0.273,0.236,0.182,0.309
Onde, é claro, 0,273 + 0,236 + 0,182 + 0,309 = 1.
Se o teste do qui quadrado não for adequado nesse caso, qual seria o teste? Obrigado!
Edit: Tentei a resposta do @Roman Luštrik abaixo e obtive a seguinte saída: por que não estou recebendo um valor-p e por que R diz "a aproximação do qui-quadrado pode estar incorreta"?
> chisq.test(c(0,0,0,8,6,2,0,0),p = c(0.406197174,0.088746395,0.025193306,0.42041479,0.03192905,0.018328576,0.009190708,0))
Chi-squared test for given probabilities
data: c(0, 0, 0, 8, 6, 2, 0, 0)
X-squared = NaN, df = 7, p-value = NA
Warning message:
In chisq.test(c(0, 0, 0, 8, 6, 2, 0, 0), p = c(0.406197174, 0.088746395, :
Chi-squared approximation may be incorrect
Respostas:
Corrija-me se estiver errado, mas acho que isso pode ser feito em R usando este comando
Isso assume proporções de 1/4 cada. Você pode modificar os valores esperados via argumento
p
. Por exemplo, você acha que as pessoas podem preferir (por qualquer motivo) uma cor a outra (s).fonte
Usando as informações extras que você forneceu (sendo que alguns dos valores são 0), é bastante óbvio por que sua solução não retorna nada. Por um lado, você tem uma probabilidade que é 0, então:
O que torna as divisões impossíveis. Agora, dizer que significa que é impossível obter esse resultado. Nesse caso, você pode simplesmente apagá-lo dos dados (consulte o comentário de @cardinal). Se você quer dizer altamente improvável, uma primeira 'solução' pode ser aumentar essa chance 0 com um número muito pequeno.p=0
Dado:
Você poderia fazer :
Mas este não é um resultado correto. De qualquer forma, deve-se evitar o teste do qui-quadrado nesses casos limítrofes. Uma abordagem melhor é usar uma abordagem de autoinicialização, calcular uma estatística de teste adaptada e comparar a da amostra com a distribuição obtida pela autoinicialização.
No código R, isso pode ser (passo a passo):
Isso fornece um valor p de 0, que está muito mais alinhado com a diferença entre o observado e o esperado. Lembre-se, este método assume que seus dados são extraídos de uma distribuição multinomial. Se essa suposição não se confirmar, o valor p também não se aplica.
fonte
O teste do qui-quadrado é bom desde que as contagens esperadas sejam grandes, geralmente acima de 10 é bom. abaixo disso o parte tende a dominar o teste. Uma estatística exata do teste é fornecida por:1E(xi)
fonte
Sim, você pode testar a hipótese nula: "H0: suporte (vermelho) = suporte (azul) = suporte (verde) = suporte (amarelo) = 1/4" usando um teste do qui quadrado que compara as proporções da pesquisa (0,273 , ...) para as proporções esperadas (1/4, 1/4, 1/4, 1/4)
fonte
A estatística do teste do qui-quadrado de Pearson é
so a test of the significance of the observed proportions depends on the sample size, much as one would expect.
fonte