A estatística do teste de Durbin-Watson pode estar em uma região inconclusiva, onde não é possível rejeitar ou deixar de rejeitar a hipótese nula (neste caso, de autocorrelação zero).
Que outros testes estatísticos podem produzir resultados "inconclusivos"?
Existe uma explicação geral (acenar com a mão é bom) por que esse conjunto de testes não consegue tomar uma decisão binária de "rejeitar" / "falhar em rejeitar"?
Seria um bônus se alguém pudesse mencionar as implicações teóricas da decisão como parte de sua resposta à última pergunta - a presença de uma categoria adicional de (in) conclusão significa que precisamos considerar os custos do Tipo I e Tipo II erros de uma maneira mais sofisticada?
Respostas:
O artigo da Wikipedia explica que a distribuição da estatística de teste sob a hipótese nula depende da matriz de design - a configuração específica dos valores preditores usados na regressão. Durbin & Watson calcularam limites inferiores para a estatística de teste sob a qual o teste de autocorrelação positiva deve rejeitar, em determinados níveis de significância, para qualquer matriz de design, e limites superiores sobre os quais o teste deve falhar em rejeitar qualquer matriz de design. A "região inconclusiva" é apenas a região em que você teria que calcular valores críticos exatos, levando em consideração sua matriz de design, para obter uma resposta definitiva.
Uma situação análoga seria a realização de um teste t unilateral de uma amostra quando você conhece apenas a estatística t, e não o tamanho da amostra † : 1.645 e 6,31 (correspondendo a graus infinitos de liberdade e apenas um). os limites para um teste de tamanho 0,05.
No que diz respeito à teoria da decisão - você tem uma nova fonte de incerteza a ser levada em consideração além da variação da amostra, mas não vejo por que ela não deve ser aplicada da mesma maneira que nas hipóteses nulas compostas. Você está na mesma situação que alguém com um parâmetro incômodo desconhecido, independentemente de como você chegou lá; portanto, se você precisar tomar uma decisão de rejeitar / reter enquanto controla o erro Tipo I sobre todas as possibilidades, rejeite de forma conservadora (por exemplo, quando a estatística Durbin – Watson estiver abaixo do limite inferior ou a estatística t acima de 6,31).
† Ou talvez você tenha perdido suas mesas; mas pode lembrar alguns valores críticos para um gaussiano padrão e a fórmula da função quantílica de Cauchy.
fonte
Outro exemplo de teste com resultados possivelmente inconclusivos é um teste binomial para uma proporção quando apenas a proporção, e não o tamanho da amostra, está disponível. Isso não é completamente irrealista - geralmente vemos ou ouvimos afirmações mal relatadas da forma "73% das pessoas concordam que ..." e assim por diante, onde o denominador não está disponível.
Código R
(O código de arredondamento é extraído desta pergunta StackOverflow .)
fonte