Se nas regressões OLS padrão, duas suposições são violadas (distribuição normal de erros, homocedasticidade), o bootstrapping de erros padrão e intervalos de confiança é uma alternativa apropriada para obter resultados significativos com relação à significância dos coeficientes do regressor?
Os testes de significância com erros padrão de inicialização e intervalos de confiança ainda "funcionam" com heterocedasticidade?
Se sim, quais seriam os intervalos de confiança aplicáveis que podem ser usados nesse cenário (percentil, BC, BCA)?
Finalmente, se o bootstrapping for apropriado nesse cenário, qual seria a literatura relevante que precisa ser lida e citada para chegar a essa conclusão? Qualquer dica seria muito apreciada!
Respostas:
Existem pelo menos três (pode haver mais) abordagens para executar o autoinicialização para regressão linear com dados independentes, mas não idênticos, distribuídos. (Se você tiver outras violações das suposições "padrão", por exemplo, devido a correlações automáticas com dados de séries temporais ou agrupamentos devido ao design de amostragem, as coisas ficam ainda mais complicadas).
A referência final é Wu (1986) , mas Annals não é exatamente a leitura do livro de figuras.
ATUALIZAÇÕES com base nas perguntas de acompanhamento do OP feitas nos comentários:
O número de repetições me pareceu grande; a única boa discussão desse parâmetro de bootstrap que eu conheço é no livro Intro to Bootstrap de Efron & Tibshirani .
fonte
reps(2500)
é provavelmente um exagero, pelo menos para os erros padrão; Eu acho quereps(500)
é bom para fins mais práticos. O livro de introdução do Efron & Tibshirani possui uma seção sobre o número de repetições. Eles também têm um capítulo inteiro sobre regressão, de modo que pode ser outra boa referência para você examinar.robust
opção de sua regressão.est store
ambos os resultados eest tab, se
eles para comparar lado a lado.