Estou analisando alguns problemas e, em alguns, para testar os coeficientes, às vezes vejo pessoas usando a distribuição de Student e às vezes vejo distribuição normal. Qual é a regra?
10
Estou analisando alguns problemas e, em alguns, para testar os coeficientes, às vezes vejo pessoas usando a distribuição de Student e às vezes vejo distribuição normal. Qual é a regra?
Respostas:
A distribuição normal é a grande distribuição de amostra em muitos problemas estatísticos significativos que envolvem alguma versão do Teorema do Limite Central: você tem (aproximadamente) partes independentes de informações que estão sendo adicionadas para chegar à resposta. Se as estimativas de parâmetros forem assintoticamente normais, suas funções também serão assintoticamente normais (em casos regulares).
Por outro lado, a distribuição Student é derivada sob condições mais restritivas dos erros normais de regressão. Se você pode comprar essa suposição, pode comprar a distribuição usada para testar a hipótese em regressão linear. O uso dessa distribuição fornece intervalos de confiança mais amplos do que o uso da distribuição normal. O significado substantivo disso é que, em amostras pequenas, é necessário estimar sua medida de incerteza, o erro quadrático médio da regressão ou o desvio padrão dos resíduos, . (Em amostras grandes, você tem tanta informação quanto se a conhecesse, então a distribuição degenera para a distribuição normal.)t σ tt t σ t
Existem algumas ocasiões em regressão linear, mesmo com amostras finitas, em que a distribuição de Student não pode ser justificada. Eles estão relacionados a violações das condições de segunda ordem em erros de regressão; ou seja, que eles são (1) variação constante e (2) independentes. Se essas suposições forem violadas, e você corrigir seus erros padrão usando o estimador Eicker / White para resíduos heterocedásticos, mas independentes; ou Newey-West para erros correlacionados em série ou erros padrão em clusterpara dados correlacionados a cluster, não há como você obter uma justificativa razoável para a distribuição de Alunos. No entanto, empregando uma versão apropriada do argumento de normalidade assintótica (matrizes traingulares e outras), você pode justificar a aproximação normal (embora você deva ter em mente que seus intervalos de confiança provavelmente serão muito estreitos).
fonte
Gosto da representação da distribuição t do aluno como uma mistura de uma distribuição normal e uma distribuição gama:
Observe que a média da distribuição gama é e a variação dessa distribuição é . Portanto, podemos ver a distribuição t como generalizando a suposição de variância constante para uma suposição de variância "semelhante". controla basicamente o quão similar permitimos que as variações sejam. Você também vê isso como regressão "aleatória ponderada", pois podemos usar a integral acima como uma representação de "variável oculta" da seguinte maneira:V [ ρ | ν ] = 2E[ ρ | ν] = 1 νV[ ρ | ν] = 2ν ν
Onde e todas as variáveis independentes. De fato, isso é basicamente apenas a definição da distribuição t, comoρ i ∼ G a m m a ( νeEu∼ N( 0 , σ2) Lummmum(νρEu~ L um m m um ( ν2, ν2) G a m m a ( ν2, ν2) ∼ 1νχ2ν
Você pode ver por que esse resultado torna a distribuição do aluno "robusta" em comparação com a normal porque um grande erro pode ocorrer devido a um grande valor de ou a um pequeno valor de . Agora, porque é comum a todas as observações, mas é específico à i-ésima, a coisa geral do "senso comum" a concluir é que os discrepantes fornecem evidências de pequenos . Além disso, se você fizer regressão linear , descobrirá que é o peso da i-ésima observação, assumindo que seja conhecido .:σ 2 ρ i σ 2 ρ i ρ iyEu- μEu σ2 ρEu σ2 ρEu ρEu ρ i ρ iμEu= xTEuβ ρEu ρEu
Portanto, um outlier constitui uma evidência para small que significa que a i-ésima observação ganha menos peso. Além disso, um pequeno "outlier" - uma observação que é prevista / ajustada muito melhor do que o resto - constitui evidência para grandes . Portanto, essa observação terá mais peso na regressão. Isso está de acordo com o que alguém faria intuitivamente com um ponto de dados externo ou bom.ρ iρEu ρEu
Observe que não há uma "regra" para decidir essas coisas, embora a minha e outras respostas a essa pergunta possam ser úteis para encontrar alguns testes que você pode fazer no caminho da variação finita (o aluno t é variação infinita para graus de liberdade menores ou iguais para dois).
fonte