Suponha que você tenha um monte de gente avaliando o quanto eles gostaram de um filme em uma escala discreta de 1 a 10, e você gostaria de um intervalo [ l , u ] tal que com (pelo menos) 95% de confiança, (pelo menos) 90 % de todas as pessoas que assistem ao filme classificá-lo-á não inferior a 1 e superior a u . [ l , u ] é então um intervalo de tolerância (bilateral) com 95% de confiança e 90% de cobertura. (Para ser claro, 95% de confiança implica que, se você repetir esse procedimento várias vezes, 95% dos intervalos produzidos receberão pelo menos 90% de cobertura populacional.) É claro que geralmente queremos que [ l , u ] seja o mais estreito possível. possível enquanto ainda atendemos aos nossos requisitos.
Eu já vi vários métodos não paramétricos para construir intervalos de tolerância para variáveis aleatórias contínuas. Também vi métodos para construir intervalos de tolerância para variáveis binomiais e de Poisson. (O pacote R tolerance
implementa vários desses métodos; Young, 2010.) Mas e as variáveis discretas quando a distribuição é desconhecida? Esse é geralmente o caso de escalas de classificação como a do meu exemplo, e supondo que uma distribuição binomial não pareça segura porque dados reais em escala de classificação geralmente exibem estranheza, como a multimodalidade.
Faria sentido recorrer aos métodos não paramétricos para variáveis contínuas? Como alternativa, o que dizer de um método de Monte Carlo, como gerar 1.000 réplicas de autoinicialização da amostra e encontrar um intervalo que captura pelo menos 90% da amostra em pelo menos 950 das réplicas?
Young, DS (2010). tolerance: Um pacote R para estimar intervalos de tolerância. Journal of Statistical Software, 36 (5), 1–39. Recuperado em http://www.jstatsoft.org/v36/i05
fonte
Respostas:
A variável de interesse é distribuída multinomialmente com probabilidades de classe (célula): . Além disso, as classes são dotadas de uma ordem natural.p1,p2,...,p10
Primeira tentativa: menor "intervalo preditivo" contendo90%
Uma medida não-paramétrica da incerteza (por exemplo, variância, confiança) nas estimativas quantitativas de poderia realmente ser obtida por métodos padrão de autoinicialização .l,u
Segunda abordagem: "pesquisa de inicialização" direta
Abaixo, forneço código Matlab executável que aborda a questão diretamente de uma perspectiva de autoinicialização (o código não é idealmente vetorizado).
Verifique se isso faz sentido.
Execute a simulação de autoinicialização.
O filtro de cada autoinicialização replica os intervalos, , que contêm pelo menos massa de probabilidade e calcula uma estimativa de confiança (freqüentista) desses intervalos.90 %[l,u] 90%
Selecione aqueles que satisfazem a confiança desejada.
Convencendo-se de que o método de inicialização acima é válido
As amostras de bootstrap destinam-se a substituir algo que gostaríamos de ter, mas não o fazem, ou seja: novos e independentes resultados da verdadeira população subjacente (abreviação: novos dados).
No exemplo que eu dei, conhecemos o processo de geração de dados (DGP), portanto, poderíamos "trapacear" e substituir as linhas de código referentes às novas amostras de bootstrap por novos e independentes sorteios do DGP real.
Em seguida, podemos validar a abordagem de bootstrap comparando-a com o ideal. Abaixo estão os resultados.
A matriz de confiança de dados novos e independentes extrai:
Os limites inferior e superior de confiança correspondente a :95%
Concluímos que as matrizes de confiança concordam estreitamente e que os limites são idênticos ... Validar a abordagem de autoinicialização.
fonte