Seja uma estimativa de probabilidade máxima de um parâmetro verdadeiro de algum modelo. À medida que o número de pontos de dados aumenta, o erro geralmente diminui como O (1 / \ sqrt n) . Usando a desigualdade do triângulo e as propriedades da expectativa, é possível mostrar que essa taxa de erro implica que tanto o "viés" \ lVert \ mathbb E \ hat \ theta - \ theta ^ * \ rVert quanto o "desvio" \ lVert \ mathbb E \ hat \ theta - \ hat \ theta \ rVert diminui no mesmo O (1 / \ sqrt {n})taxa. Obviamente, é possível que os modelos tenham um viés que diminui a uma taxa mais rápida. Muitos modelos (como regressão oridinária de mínimos quadrados) não têm viés.
Estou interessado em modelos com viés que encolhem mais rápido que , mas onde o erro não diminui nessa taxa mais rápida porque o desvio ainda diminui como . Em particular, gostaria de conhecer condições suficientes para que o viés de um modelo diminua na taxa .
fonte
Respostas:
Em geral, você precisa de modelos nos quais o MLE não é assintoticamente normal, mas converge para alguma outra distribuição (e o faz a uma taxa mais rápida). Isso geralmente acontece quando o parâmetro sob estimativa está no limite do espaço do parâmetro. Intuitivamente, isso significa que o MLE abordará o parâmetro "apenas de um lado", para que "melhore a velocidade de convergência", uma vez que não é "distraído", indo e voltando ao redor do parâmetro.
Um exemplo padrão é o MLE para em uma amostra iid de rv uniforme. O MLE aqui é a estatística de pedido máximo,θ U(0,θ)
Sua distribuição finita de amostras é
Então . Mas a mesma taxa aumentada também se aplica à variação.B(θ^n)=O(1/n)
Pode-se também verificar que, para obter uma distribuição limitadora, precisamos olhar para a variável , (ou seja, precisamos escalar por ), poisn(θ−θ^n) n
qual é o CDF da distribuição exponencial.
Espero que isso forneça alguma direção.
fonte
Após os comentários na minha outra resposta (e olhando novamente para o título da pergunta do OP!), Aqui está uma exploração teórica não muito rigorosa da questão.
Queremos determinar se o Bias pode ter uma taxa de convergência diferente da raiz quadrada da variância,B(θ^n)=E(θ^n)−θ
Nós temos
enquanto
Vemos que pode acontecer se(2)
A) ambos os componentes são ; nesse caso, só podemos ter .O(1/n2γ) γ=δ
B) Mas também pode valer se
Para que seja compatível com , precisamos ter(3) (1)
Portanto, parece que, em princípio, é possível ter o viés convergindo a uma taxa mais rápida do que a raiz quadrada da variação. Mas não podemos ter a raiz quadrada da variação convergindo a uma taxa mais rápida que a polarização.
fonte