A desigualdade de Dvoretzky-Kiefer-Wolfowitz é a seguinte:
,
e prediz quão perto uma função de distribuição determinada empiricamente estará da função de distribuição a partir da qual as amostras empíricas são coletadas. Usando essa desigualdade, podemos desenhar intervalos de confiança (ICs) em torno de (ECDF). Mas esses ICs terão distâncias iguais em todos os pontos do ECDF.
Gostaria de saber, existe outra maneira de construir um IC em torno do ECDF?
Lendo sobre estatísticas ordenadas , descobrimos que a distribuição assintótica da estatística ordenada é a seguinte:
Agora, primeiro, o que significa o índice com esses símbolos?
Pergunta principal: somos capazes de usar esse resultado, juntamente com o método delta (veja abaixo), para fornecer ICs para o ECDF. Quero dizer, o ECDF é uma função da estatística ordenada, certo? Mas, ao mesmo tempo, o ECDF é uma função não paramétrica, então isso é um beco sem saída?
Sabemos que e
Espero ter certeza do que estou recebendo aqui e agradecer qualquer ajuda.
EDIT :
Método Delta: se você tiver uma sequência de variáveis aleatórias satisfazendo
e e são finitos, o seguinte é satisfeito:
para qualquer função g que satisfaça a propriedade que existe, tem um valor diferente de zero e é polinomialmente delimitada com a variável aleatória (quote wikipedia)
fonte
Respostas:
Não vejo como usar o método delta, mas ...
Lendo sobre a convergência da função de distribuição empírica , lemos que o teorema do limite central nos fornece:
Podemos usar isso para criar ICs variados em torno de cada :F^n(x)
como , é a nossa melhor estimativa de .F n ( x ) F ( x )E(F^n(x))=F(x) F^n(x) F(x)
Usando o seguinte código R:
Nós temos:
Vemos que as faixas vermelhas (do método CLT) nos dão faixas de confiança mais estreitas.
EDIT : Como o @Kjetil B Halvorsen apontou - esses dois tipos de bandas são tipos diferentes. Eu tinha @Glen_b explicar exatamente o que ele quis dizer:
Muito obrigado a ambos!
fonte