Interpretação do intervalo de confiança

15

Nota: desculpe-me antecipadamente se for uma duplicata, não encontrei um q semelhante na minha pesquisa

Digamos que temos um parâmetro verdadeiro p. Um intervalo de confiança C (X) é um VR que contém p, digamos, 95% das vezes. Agora, suponha que observemos X e calculemos C (X). A resposta comum parece ser incorreta interpretar isso como tendo uma "chance de 95% de conter p", pois "contém" ou "não".

No entanto, digamos que eu pego uma carta no topo de um baralho embaralhado e a deixo com a face para baixo. Intuitivamente, penso na probabilidade dessa carta de ser o ás de espadas como 1/52, mesmo que na realidade "seja ou não seja o ás de espadas". Por que não posso aplicar esse raciocínio ao exemplo do intervalo de confiança?

Ou, se não for significativo falar da "probabilidade" da carta ser o ás de espadas, uma vez que "é ou não é", eu ainda colocaria probabilidades de 51: 1 de que não é o ás de espadas. Existe outra palavra para descrever essa informação? Como esse conceito é diferente de "probabilidade"?

edit: Talvez seja mais claro, a partir de uma interpretação bayesiana de probabilidade, se me disserem que uma variável aleatória contém p 95% do tempo, dada a realização dessa variável aleatória (e nenhuma outra informação para condicionar) é correto dizer que a variável aleatória tem 95% de probabilidade de conter p?

edit: também, a partir de uma interpretação freqüentista da probabilidade, digamos que o frequentista concorda em não dizer algo como "existe uma probabilidade de 95% de que o intervalo de confiança contenha p". Ainda é lógico para um frequentista ter uma "confiança" de que o intervalo de confiança contém p?

Seja alfa o nível de significância e t = 100-alfa. K (t) é a "confiança" do frequentista de que o intervalo de confiança contém p. Faz sentido que K (t) deva estar aumentando em t. Quando t = 100%, o frequentista deve ter certeza (por definição) de que o intervalo de confiança contém p, para que possamos normalizar K (1) = 1. Da mesma forma, K (0) = 0. Presumivelmente, K (0,95) está em algum lugar entre 0 e 1 e K (0,999999) é maior. De que maneira o frequentista consideraria K diferente de P (a distribuição de probabilidade)?

applicative_x
fonte
1
De fato, considere um lançamento de moeda onde a moeda rola embaixo de uma mesa, fora da vista e consideramos o evento em que a moeda caiu sobre as cabeças. À primeira vista, isso parece ser muito semelhante à questão do IC - claramente o evento aconteceu ou não. No entanto, no caso da troca de moedas, muitos (talvez até a maioria) dos freqüentadores parecem perfeitamente felizes em atribuir uma probabilidade fictícia (digamos ) à moeda não observada que acaba caindo na cabeça, enquanto se afasta de dizer a mesma coisa sobre o intervalo aleatório que contém o parâmetro. Para mim, parece haver uma inconsistência. p
Glen_b -Reinstar Monica
@Glen_b Os freqüentistas no cenário de moedas descartadas e não observadas aplicam um raciocínio contrafactual para dizer, não que o valor nominal real da moeda seja "aleatório" (embora não seja observado), mas que possamos generalizar qualquer resultado observado para outros resultados em potencial moeda e calcular probabilidades. Quanto à probabilidade do valor nominal real da moeda, é ou não é cara, não há probabilidade. O é salvo para a construção contrafactual desta definição. p
Adamo
@Glen_b: Eu concordo, veja minha pergunta aqui: stats.stackexchange.com/questions/233588/…
vonjd 6/16
@vonjd até que ponto sua pergunta não existe simplesmente uma duplicata do primeiro parágrafo após a abertura "Nota:" aqui?
Glen_b -Reinstala Monica
@Glen_b: Para ser sincero, eu não estava ciente dessa pergunta quando publiquei a minha e elas certamente se sobrepõem. No entanto, acho que eles não são duplicados, porque o meu está mais preocupado com o uso de probabilidades para resultados ocultos (o que teria conseqüências para intervalos de confiança), enquanto este visa puramente a intervalos de confiança. Mas se você acha que o meu é um duplicado, fique à vontade para fechá-lo.
vonjd 7/09/16

Respostas:

8

Penso que muitos relatos convencionais sobre esse assunto não são claros.

Digamos que você pegue uma amostra do tamanho e obtenha um intervalo de confiança de 95 % para p .10095%p

Então você pega outra amostra de , independente da primeira, e obtém outro intervalo de confiança de 95 % para p .10095%p

O que muda é o intervalo de confiança; o que não muda é . p Isso significa que, nos métodos freqüentistas, diz-se que o intervalo de confiança é "aleatório", mas é "fixo" ou "constante", ou seja, não aleatório. Nos métodos freqüentistas, como o método dos intervalos de confiança, atribui-se probabilidades apenas a coisas aleatórias.p

Então e ( L , U ) é um intervalo de confiança. ( L = "inferior" e U = "superior".) Tire uma nova amostra e L e U mudam, mas p não.Pr(L<p<U)=0,95(L,U)L=U=LUp

Digamos que em um caso particular você tenha e U = 43,61 . Nos métodos freqüentistas, não se atribuiria uma probabilidade à afirmação 40,53 < p < 43,61 , exceto uma probabilidade de 0 ou 1 , porque nada aqui é aleatório: 40,53 não é aleatório, p não é aleatório (pois não mudará se tomamos uma nova amostra) e 43,61 não é aleatório.L=40.53U=43.6140.53<p<43.610140.53p43,61

Na prática, as pessoas se comportam como se tivessem certeza de que p está entre 40,53 e 43,61 . E, na prática, isso geralmente faz sentido. Mas às vezes não. Um desses casos é se números previamente grandes como 40 ou mais são conhecidos como improváveis ​​ou se são altamente prováveis. Se alguém pode atribuir alguma distribuição de probabilidade anterior a p , usa-se o teorema de Bayes para obter um intervalo credível, que pode diferir do intervalo de confiança devido ao conhecimento prévio de quais faixas de valores de p95%p40.5343.6140ppsão prováveis ​​ou improváveis. Também pode realmente acontecer que os próprios dados - as coisas que mudam se uma nova amostra for coletada, possam dizer que é improvável que seja, ou até certo que não seja, tão grande quanto 40 . Isso pode acontecer mesmo nos casos em que o par ( L , U ) é uma estatística suficiente para p . Esse fenômeno pode ser tratado em alguns casos pelo método de condicionamento de Fisher em uma estatística auxiliar. Um exemplo deste último fenómeno é, quando a amostra consiste em apenas duas observações independentes que estão uniformemente distribuídos no intervalo q ± 1 / 2p40(L,U)pθ±1/2. Então, o intervalo entre a menor das duas observações e a maior é um intervalo de confiança de . Mas se a distância entre eles é de 0,001 , seria absurdo estar perto de 50 % de certeza de que θ está entre eles e se a distância é de 0,999 , seria razoavelmente quase 100 % de certeza de que θ está entre eles. A distância entre eles seria a estatística auxiliar na qual se condicionaria.50%0.00150%θ0.999100%θ

Michael Hardy
fonte
Obrigado Michael, que faz muito sentido. Vamos supor no seu exemplo que temos um (L, U) particular, mas os valores não são conhecidos por nós. Tudo o que sabemos é que é a realização de uma variável aleatória com intervalo de confiança de 95%. Sem qualquer prévia do parâmetro ou qualquer outra informação, seria justo estabelecer probabilidades 19: 1 de que (L, U) contenha o parâmetro? Se um freqüentador estiver disposto a fazer isso, mas não chamar sua "disposição de colocar 19: 1 de probabilidade de conter o parâmetro" uma "probabilidade", como o chamaríamos?
Aplicativo_x
Sim, essa probabilidade é de . Certamente dentro dos métodos freqüentistas, pode-se dizer que, em um estado de ignorância de ( L , U ), a probabilidade é 0,95 de que esse intervalo contenha p . Mas quando se tem valores particulares, que não são aleatórios, o frequentista não atribui uma probabilidade diferente de 0 ou 1 à afirmação, uma vez que os valores conhecidos de L e U não são aleatórios. 0.95(L,U)0.95p01LU
Michael Hardy
3

100×(1α)

100×(1α)

A probabilidade, para os freqüentadores, vem da noção de "rebobinar tempo e espaço" para replicar descobertas, como se um número infinito de cópias do mundo fosse criado para avaliar uma descoberta científica repetidas vezes. Portanto, uma probabilidade é exatamente uma frequência. Para os cientistas, esta é uma maneira muito conveniente de discutir descobertas, uma vez que o primeiro princípio da ciência é que os estudos devem ser replicáveis.

No exemplo da sua carta, a confusão entre os bayesianos e os freqüentistas é que o frequentista não atribui uma probabilidade ao valor nominal da carta em particular que você jogou do baralho, enquanto um bayesiano o faria. O freqüentador atribuiria a probabilidade a uma carta, virada do topo do baralho aleatoriamente embaralhado. Um bayesiano não se preocupa em replicar o estudo; depois que o cartão é invertido, você agora tem 100% de crença sobre o que é o cartão e 0% de que ele pode ter outro valor. Para os bayesianos, a probabilidade é uma medida de crença.

Observe que os bayesianos não têm intervalos de confiança por esse motivo, eles resumem a incerteza com intervalos de credibilidade .

AdamO
fonte
Obrigado pela resposta. No exemplo da carta, os bayesianos e os freqüentadores não concordariam que 51: 1 tem chances justas de que a carta seja o ás de espadas? Da mesma forma, para a realização de um intervalo de confiança de 95% (e nenhuma outra informação), os dois não teriam chances 19: 1 de que ele contém o parâmetro true? Nesse sentido, um bayesiano poderia interpretar o intervalo de confiança de 95% como tendo 95% de chance de conter o parâmetro true?
Aplicativo_x
p=1/52
Obrigado Adam, acho que ainda estou confuso. Suponhamos que eu saiba (olhando as cartas) que um baralho de 52 cartas é padrão. Eu embaralho o baralho e escolho as 10 melhores cartas sem olhar para elas. Não foi possível definir o "parâmetro verdadeiro" nesse caso como o número de cartões vermelhos? Então, independentemente do bayesiano vs frequentista, existe um "parâmetro verdadeiro". Se me é permitido escolher 7 cartas aleatoriamente Eu também podia imaginar construir um intervalo de confiança para os cartões #de vermelhas da minha 10.
applicative_x
1
1/2
1
@ AdamO: Acho seus comentários enigmáticos. 'de que utilidade é a noção de' verdade '' é uma mudança de assunto. "Pensamos na verdade como imutável." Então "nós" significa você e quem mais, e qual é a relevância do que eles pensam? "Nenhum cientista poderia coletar dados para verificar algo que já é conhecido." Parece outra mudança de assunto. A seguir, alguns comentários sobre frequentistas e bayesianos. Não tenho vontade de adivinhar o que você está tentando dizer.
Michael Hardy