Uma pergunta de iniciante sobre o resíduo de Pearson no contexto do teste do qui-quadrado para a qualidade do ajuste:
Além da estatística de teste, a chisq.test
função de R reporta o resíduo de Pearson:
(obs - exp) / sqrt(exp)
Entendo por que olhar para a diferença bruta entre valores observados e esperados não é tão informativo, pois uma amostra menor resultará em uma diferença menor. No entanto, gostaria de saber mais sobre o efeito do denominador: por que dividir pela raiz do valor esperado? Este é um resíduo 'padronizado'?
chi-squared
goodness-of-fit
residuals
Iain Dillingham
fonte
fonte
stdres
para resíduos padronizados.chisq.test
também calcula ostdres
componente?Respostas:
Então, o que você vê na fórmula sobre a qual está perguntando é a contagem de células padronizada, sob a suposição de que a contagem de células tem uma distribuição Poisson (incondicional).
A partir daqui, é comum testar a independência da variável de linha e coluna nos dados e, nesse caso, você pode usar uma estatística de teste que analise a soma dos quadrados dos valores acima (que é equivalente à norma ao quadrado) do vetor de valores padronizados). O teste qui-quadrado fornece um valor p para esse tipo de teste com base em uma aproximação de amostra grande à distribuição nula da estatística de teste. Geralmente é aplicado nos casos em que nenhuma contagem de vendas é muito pequena.
fonte
No contexto da qualidade do ajuste, você pode consultar este http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm .
Se você quiser saber como o denominador chegou lá, terá que ver o qui-quadrado aqui como uma aproximação normal ao binômio, para iniciantes, que pode ser estendido para multinômios.
fonte