Para um modelo linear, a solução OLS fornece o melhor estimador linear e imparcial para os parâmetros.
É claro que podemos negociar um viés por uma variação menor, por exemplo, regressão de crista. Mas minha pergunta é sobre não ter viés. Existem outros estimadores que são um tanto usados, que são imparciais, mas com uma variação maior do que os parâmetros estimados pelo OLS?
Se eu tivesse um grande conjunto de dados, poderia sub-amostrá-lo e estimar os parâmetros com menos dados e aumentar a variação. Presumo que isso possa ser hipoteticamente útil.
Essa é mais uma pergunta retórica, porque quando eu li sobre os estimadores do BLUE, uma alternativa pior não é fornecida. Eu acho que fornecer alternativas piores também pode ajudar as pessoas a entender melhor o poder dos estimadores do BLUE.
Respostas:
Um exemplo que vem à mente é um estimador do GLS que considera as observações de maneira diferente, embora isso não seja necessário quando as suposições de Gauss-Markov são cumpridas (que o estatístico pode não saber ser o caso e, portanto, aplicar ainda aplicar o GLS).
Considere o caso de uma regressão deyi , i=1,…,n em uma constante para ilustração (facilmente generalizada para estimadores gerais de GLS). Aqui, assume-se que {yi} é uma amostra aleatória de uma população com μ média e variância σ2 .
Então, sabemos que OLS é apenas β = ˉ y , a média da amostra. Para enfatizar o ponto que cada observação é ponderada com o peso de 1 / n , esta escrever como β = n Σ i = 1 1β^=y¯ 1/n β^=∑i=1n1nyi. Var(β^)=σ2/n .
Here is a graphical illustration from a little simulation, created with the code below:
EDIT: In response to @kjetilbhalvorsen's and @RichardHardy's suggestions I also include the median of theyi , the MLE of the location parameter pf a t(4) distribution (I get warnings that
In log(s) : NaNs produced
that I did not check further) and Huber's estimator in the plot.We observe that all estimators seem to be unbiased. However, the estimator that uses weightswi=(1±ϵ)/n as weights for either half of the sample is more variable, as are the median, the MLE of the t-distribution and Huber's estimator (the latter only slightly so, see also here).
That the latter three are outperformed by the OLS solution is not immediately implied by the BLUE property (at least not to me), as it is not obvious if they are linear estimators (nor do I know if the MLE and Huber are unbiased).
fonte