A Wikipedia e a vinheta do pacote sanduíche R fornecem boas informações sobre as suposições que suportam erros padrão do coeficiente de OLS e os antecedentes matemáticos dos estimadores sanduíche. Ainda não estou claro como o problema da heterocedasticidade dos resíduos é tratado, provavelmente porque eu não entendo completamente a estimativa da variância padrão dos coeficientes OLS em primeiro lugar.
Qual é a intuição por trás do estimador sanduíche?
multiple-regression
residuals
heteroscedasticity
robust-standard-error
Robert Kubrick
fonte
fonte
Respostas:
Para o OLS, você pode imaginar que está usando a variação estimada dos resíduos (sob a suposição de independência e homoscedasticidade) como uma estimativa para a variação condicional dos s. No estimador baseado em sanduíche, você está usando os resíduos quadrados observados como uma estimativa de plug-in da mesma variação que pode variar entre as observações.YEu
Na estimativa de erro padrão dos mínimos quadrados ordinários para a estimativa do coeficiente de regressão, a variação condicional do resultado é tratada como constante e independente, para que possa ser estimada consistentemente.
Para o sanduíche, evitamos a estimativa consistente da variação condicional e, em vez disso, usamos uma estimativa de plug-in da variação de cada componente usando o resíduo quadrado.
Usando a estimativa de variação de plug-in, obtemos estimativas consistentes da variação de pelo Teorema do Limite Central de Lyapunov.β^
Intuitivamente, esses resíduos quadrados observados limparão qualquer erro inexplicável devido à heterocedasticidade que, de outra forma, seria inesperada sob a suposição de variação constante.
fonte