Raciocínio e condicionamento freqüentista nas observações (exemplo de Wagenmakers et al.)

9

Não sou especialista em estatística, mas entendo que há divergências sobre se uma interpretação "freqüentista" ou "bayesiana" da probabilidade é a "certa". De Wagenmakers et. al p. 183:

Considere uma distribuição uniforme com média e largura . Desenhar dois valores aleatoriamente a partir desta distribuição, rotular o menor s e um dos maiores l , e verificar se a média \ MU encontra-se entre s e l . Se esse procedimento for repetido muitas vezes, a média \ mu ficará entre s e l na metade dos casos. Assim, (s, l) fornece um intervalo de confiança freqüente de 50% para \ mu . Mas suponha que, para um empate em particular, s = 9,8 e l = 10,71 s l μ s l μ s l ( s , l ) μ s = 9,8 l = 10,7μ1slμslμsl(s,l)μs=9.8l=10.7. A diferença entre esses valores é de 0.9 e isso abrange 9/10 do intervalo da distribuição. Portanto, para esses valores particulares de s e l , podemos estar 100% confiantes de que s<μ<l , mesmo que o intervalo de confiança freqüente o faça acreditar que você deve ter apenas 50% de confiança.

Existem pessoas que realmente acreditam que há apenas 50% de confiança neste caso ou é um homem de palha?

Acho que de maneira mais geral, o livro parece dizer que os freqüentadores não podem expressar uma afirmação condicional como "Dados s=9.8 e l=10.7 , s<μ<l com probabilidade 1". É verdade que o condicionamento implica raciocínio bayesiano?

Xodarap
fonte
8
Todas as três respostas atuais são muito boas. Eu acrescentaria apenas que a Wagenmakers está fazendo um argumento de palha no sentido de que nenhum estatístico freqüentador jamais recomendaria esse intervalo de confiança - ele existe na literatura apenas como exemplo de um intervalo de confiança patológico. Do ponto de vista freqüentista, demonstra que a cobertura da confiança por si só não é suficiente para uma boa inferência. (Eu sou bayesiano.) #
Cyan

Respostas:

14

Há alguns truques intricados envolvidos. O intervalo de confiança não usa as informações de que o intervalo do uniforme é 1 e, portanto, não é paramétrico, enquanto a alegação feita sobre a amostra com faz e é altamente dependente do modelo. Tenho certeza de que é possível melhorar a cobertura ou a duração (esperada) do intervalo de confiança se essas informações forem levadas em consideração. Por um lado, os pontos finais da distribuição estão no máximo distância de ou . Portanto, um intervalo de confiança de 100% para é .l - s = 0,9 1 - ( l - s ) s l μ ( l - 1 / 2 , de s + 1 / 2 )(s,l)ls=0.91(ls)slμ(l1/2,s+1/2)

Esse problema específico se enquadra no domínio de inferência para distribuições parcialmente identificadas estudadas nos últimos 10 a 15 anos extensivamente em econometria teórica. A probabilidade e, portanto, bayesiana, a inferência para a distribuição uniforme é feia, uma vez que constitui um problema não regular (o suporte à distribuição depende do parâmetro desconhecido).

StasK
fonte
Duvido que você possa reduzir o comprimento esperado abaixo de para obter um intervalo de confiança de 50% em uma amostra de 2 itens. 13
Henry
11

Estou hesitante em responder a isso. Estes cravos freqüentistas x bayesianos são geralmente improdutivos e podem ser desagradáveis ​​e juvenis. Por que vale a pena, os Wagenmakers são um grande negócio, enquanto os filósofos chineses de 3 anos ou mais de idade, por outro lado esquecidos, por outro lado ...

No entanto, eu argumentaria que a interpretação freqüentista padrão de um intervalo de confiança de 50% não é que você deva estar 50% confiante de que o verdadeiro valor está dentro do intervalo ou que existe uma probabilidade de 50% disso. Em vez disso, a ideia é simplesmente que, se o mesmo processo fosse repetido indefinidamente, a porcentagem de ICs que incluía o valor verdadeiro convergiria para 50%. Para qualquer intervalo único, no entanto, a probabilidade de incluir o valor verdadeiro é 0 ou 1, mas você não sabe qual .

- Reinstate Monica
fonte
5

Eu acho que é um argumento fraco para um caso forte.

( 3 l + s - 1(s,l) pode ser um intervalo de confiança de 50% no sentido definido, mas também , e acho que o último pode ser justificado como melhor nessas circunstâncias, pois se estende sem ajustes adicionais para amostras maiores; observe também que este último intervalo de confiança nunca é maior que e sua largura esperada para uma amostra de tamanho é .1(3l+s14,3s+l+14) n112n1n+1

Henry
fonte
No exemplo citado da amostra , minha alternativa sugerida daria o intervalo de confiança de , que é claramente a metade do meio do intervalo de confiança lógico de 50 % [ 10,225 , 10,275 ] 100 % [ 10,2 , 10,3 ]{9.8,10.7}50%[10.225,10.275]100%[10.2,10.3]
Henry