Esclarecimentos sobre a interpretação de intervalos de confiança?

47

Meu entendimento atual da noção "intervalo de confiança com nível de confiança " é que, se tentássemos calcular o intervalo de confiança várias vezes (sempre com uma nova amostra), ele conteria o parâmetro correto do Tempo.1α1α

Embora eu perceba que isso não é o mesmo que "probabilidade de que o parâmetro verdadeiro esteja nesse intervalo", há algo que quero esclarecer.

[Major Update]

Antes de calcularmos um intervalo de confiança de 95%, há uma probabilidade de 95% de que o intervalo que calculamos cubra o parâmetro true. Depois de calcularmos o intervalo de confiança e obtermos um intervalo específico , não podemos mais dizer isso. Não podemos sequer argumentar de maneira não frequente que temos 95% de certeza de que o verdadeiro parâmetro estará em ; pois, se pudéssemos, contradiz contra exemplos como este: o que, precisamente, é um intervalo de confiança?[ a , b ][a,b][a,b]

Não quero fazer disso um debate sobre a filosofia da probabilidade; em vez disso, estou procurando uma explicação matemática precisa de como e por que ver o intervalo específico muda (ou não muda) a probabilidade de 95% que tínhamos antes de ver esse intervalo. Se você argumenta que "depois de ver o intervalo, a noção de probabilidade não faz mais sentido", tudo bem, vamos trabalhar em uma interpretação da probabilidade na qual faz sentido.[a,b]

Mais precisamente:

Suponha que programamos um computador para calcular um intervalo de confiança de 95%. O computador processa alguns números, calcula um intervalo e se recusa a me mostrar o intervalo até que eu digite uma senha. Antes de inserir a senha e ver o intervalo (mas depois que o computador já a calculou), qual é a probabilidade de o intervalo conter o parâmetro true? É 95%, e esta parte não está em debate : esta é a interpretação da probabilidade que me interessa para esta questão em particular (percebo que existem questões filosóficas importantes que estou suprimindo, e isso é intencional).

Porém, assim que eu digitar a senha e fizer o computador me mostrar o intervalo calculado, a probabilidade (que o intervalo contenha o parâmetro true) poderá mudar. Qualquer alegação de que essa probabilidade nunca mude contraria o contraexemplo acima. Nesse contra-exemplo, a probabilidade pode mudar de 50% para 100%, mas ...

  • Existem exemplos em que a probabilidade muda para algo diferente de 100% ou 0% (EDIT: e se sim, quais são eles)?

  • Existem exemplos em que a probabilidade não muda depois de ver o intervalo específico (ou seja, a probabilidade de o parâmetro verdadeiro estar em ainda é de 95%)?[ a , b ][a,b][a,b]

  • Como (e por que) a probabilidade muda em geral depois de ver o computador cuspir ?[a,b]

[Editar]

Obrigado por todas as ótimas respostas e discussões úteis!

Elliott
fonte
1
Isso pode fornecer alguns pontos interessantes: en.wikipedia.org/wiki/Credible_interval
nico
Suas suposições de que P (E | C) = 1 e P (E | C ') = 0 são injustificadas. Por que você afirma que, se o intervalo real não contém o valor verdadeiro do parâmetro, este último certamente está fora dele?
Vítreo
Não sei ao certo o que você quer dizer com "intervalo real" ou "último". Você pode esclarecer por favor?
213 Elliott
@nico Obrigado pelo link. A intenção da minha pergunta original era "meu argumento parece mostrar que um intervalo de confiança pode ser interpretado como um intervalo credível bayesiano, mas esse não é o caso, então o que há de errado com meu raciocínio". Mas tenho que admitir, não estou feliz com a noção "a probabilidade de que o intervalo contenha o parâmetro verdadeiro [desconhecido] seja 0 ou 1". Para mim, é como dizer "a probabilidade de a moeda cair cara, depois que eu a joguei, mas antes de olhar para ela, é 0 ou 1"; Não vejo por que não é 1/2.
22711 Elliott
@ Elliot: o gato de Schrödinger vem à mente :) Eu não sou suficientemente experiente para lhe dar uma explicação adequada, mas eu adoraria ver uma resposta para isso. PS: e não vamos esquecer que a moeda também pode cair no limite!
Nico

Respostas:

28

Penso que o problema fundamental é que as estatísticas frequentistas só podem atribuir uma probabilidade a algo que pode ter uma frequência de longo prazo. Se o valor real de um parâmetro está em um intervalo específico ou não, não possui uma frequência de longo prazo, pois só podemos realizar o experimento uma vez, para que você não possa atribuir uma probabilidade freqüente a ele. O problema surge da definição de probabilidade. Se você alterar a definição de probabilidade para Bayesiana, o problema desaparecerá instantaneamente, pois você não estará mais vinculado à discussão de frequências de longo prazo.

Veja minha resposta (em vez da língua) para uma pergunta relacionada aqui :

" Um freqüentista é alguém que acredita que as probabilidades representam frequências de longo prazo com as quais ocorrem eventos; se necessário, ele inventará uma população fictícia da qual sua situação específica pode ser considerada uma amostra aleatória, para que ele possa falar significativamente sobre frequências de longo prazo. Se Se você fizer uma pergunta sobre uma situação específica, ele não dará uma resposta direta, mas fará uma declaração sobre essa população (possivelmente imaginária) " .

No caso de um intervalo de confiança, a pergunta que normalmente gostaríamos de fazer (a menos que tenhamos um problema no controle de qualidade, por exemplo) é "dada essa amostra de dados, retorne o menor intervalo que contenha o valor verdadeiro do parâmetro com probabilidade X ". No entanto, um frequentista não pode fazer isso, pois o experimento é realizado apenas uma vez e, portanto, não há frequências de longo prazo que possam ser usadas para atribuir uma probabilidade. Portanto, o frequentista precisa inventar uma população de experimentos (que você não realizou) a partir dos quais o experimento que você realizou pode ser considerado uma amostra aleatória. O frequentista então fornece uma resposta indireta sobre essa população fictícia de experimentos, em vez de uma resposta direta à pergunta que você realmente queria fazer sobre um experimento específico.

Essencialmente, é um problema de linguagem, a definição freqüente de uma população simplesmente não permite discutir a probabilidade do verdadeiro valor de um parâmetro em um intervalo específico. Isso não significa que as estatísticas freqüentistas sejam ruins ou não sejam úteis, mas é importante conhecer as limitações.

Em relação à grande atualização

Não tenho certeza se podemos dizer que "Antes de calcular um intervalo de confiança de 95%, há uma probabilidade de 95% de que o intervalo que calculamos cubra o parâmetro verdadeiro". dentro de um quadro freqüentista. Existe uma inferência implícita aqui de que a frequência de longo prazo com a qual o valor verdadeiro do parâmetro se encontra em intervalos de confiança construídos por algum método específico também é a probabilidade de que o valor verdadeiro do parâmetro esteja no intervalo de confiança para a amostra em particular. de dados que vamos usar. Essa é uma inferência perfeitamente razoável, mas é uma inferência bayesiana, não freqüentista, pois a probabilidade de que o verdadeiro valor do parâmetro esteja no intervalo de confiança que construímos para uma amostra específica de dados não tem frequência de longo prazo, pois nós temos apenas uma amostra de dados.

No entanto, podemos "fazer algum tipo de argumento não freqüentador de que temos 95% de certeza de que o parâmetro verdadeiro estará em [a, b]", é exatamente isso que é um intervalo credível bayesiano e, para muitos problemas, o intervalo credível bayesiano coincide exatamente com o intervalo de confiança freqüentista.

"Eu não quero fazer disso um debate sobre a filosofia da probabilidade", infelizmente isso é inevitável, a razão pela qual você não pode atribuir uma probabilidade frequista para saber se o verdadeiro valor da estatística está no intervalo de confiança é uma conseqüência direta da filosofia freqüentista da probabilidade. Os freqüentistas só podem atribuir probabilidades a coisas que podem ter frequências de longo prazo, pois é assim que os freqüentadores definem a probabilidade em sua filosofia. Isso não faz a filosofia freqüentista estar errada, mas é importante entender os limites impostos pela definição de probabilidade.

"Antes de inserir a senha e ver o intervalo (mas depois que o computador já a calculou), qual é a probabilidade de o intervalo conter o parâmetro true? É 95% e esta parte não está em debate:" está incorreto, ou pelo menos ao fazer tal afirmação, você se afastou da estrutura das estatísticas freqüentistas e fez uma inferência bayesiana envolvendo um grau de plausibilidade na verdade de uma afirmação, em vez de uma frequência de longo prazo. No entanto, como eu disse anteriormente, é uma inferência perfeitamente razoável e natural.

Nada mudou antes ou depois de digitar a senha, porque é possível atribuir uma probabilidade freqüente a nenhum evento. As estatísticas freqüentistas podem ser bastante contra-intuitivas, pois muitas vezes queremos fazer perguntas sobre graus de plausibilidade de declarações sobre eventos particulares, mas isso está fora do âmbito das estatísticas freqüentistas, e é a origem da maioria das interpretações errôneas dos procedimentos freqüentistas.

Dikran Marsupial
fonte
2
Sim, esse é o argumento que estou afirmando, a segunda afirmação não é realmente uma afirmação sobre essa moeda em particular. É uma declaração sobre uma população imaginária de moedas que a maioria das pessoas interpreta incorretamente como uma declaração sobre nossa moeda em particular. No entanto, ao dar esse salto, estamos aplicando a intuição bayesiana sobre probabilidade e ignorando o que realmente é um intervalo de confiança. Não há problema em atribuir uma probabilidade ao estado da moeda, desde que nos afastemos de uma definição freqüente de probabilidade.
Dikran Marsupial
2
Para esclarecer, dizer que "imagine muitas instâncias separadas do começo dos tempos; você esperaria que cerca da metade delas produzisse cabeças" é um raciocínio freqüentista perfeitamente correto. No entanto, ir daí para "portanto, a probabilidade de que essa moeda também seja de 0,5" não é uma probabilidade aplicada a algo que não tem uma frequência de longo prazo, pois só pode acontecer uma vez e uma vez. É perfeitamente razoável o raciocínio bayesiano, pois uma probabilidade bayesiana é uma afirmação sobre a plausibilidade de uma proposição (que pode ser baseada em uma frequência de longo prazo dentro de uma população).
Dikran Marsupial
1
Sua resposta para as duas perguntas seria, na verdade, uma declaração sobre a proporção de uma população imaginária de moedas que desembocaria na cabeça. Mas é provável que isso não seja explicitado, pois as pessoas geralmente gostam de ser úteis (respostas indiretas geralmente não são tão úteis), e também as estatísticas freqüentistas são bastante contra-intuitivas e é provável que o freqüentador contorne esse ponto para evitar confusão. Se fixado para fazer uma afirmação probabilística sobre uma mudança em particular, um bom freqüentador simplesmente se recusaria a responder - está fora dos limites das estatísticas freqüentistas.
Dikran Marsupial
1
Essencialmente, o freqüentador não responderia à sua pergunta, ele faria uma declaração sobre uma população de lançamentos de moedas e deixaria você deduzir que a probabilidade de uma cabeça nessa troca específica era a mesma da proporção na população implícita . Mas isso seria sua inferência bayesiana, não dele.
Dikran Marsupial
1
@ Aaron Claro, você poderia dizer "a probabilidade é 0 ou 1" para muitas coisas, mas essa resposta não nos ajuda absolutamente nada (por exemplo, se queremos responder a uma pergunta concreta sobre quanto devemos apostar em um jogo ou se ou não, devemos lançar um ônibus espacial). Além disso, as coisas que "poderiam acontecer" são: (1) a moeda caiu na cabeça e você a cobriu, (2) a moeda caiu na coroa e você a cobriu; em uma "população imaginária" de muitas tentativas de "virar e cobrir", cerca de 50% resultam em você ver cabeças.
9308 Elliott
14

Grande atualização, grande nova resposta. Deixe-me tentar abordar claramente esse ponto, porque é onde está o problema:

"Se você argumenta que" depois de ver o intervalo, a noção de probabilidade não faz mais sentido ", tudo bem, vamos trabalhar em uma interpretação de probabilidade na qual faz sentido".

As regras da probabilidade não mudam, mas o seu modelo para o universo muda. Você está disposto a quantificar suas crenças anteriores sobre um parâmetro usando uma distribuição de probabilidade? Atualizar a distribuição de probabilidade depois de ver os dados é uma coisa razoável a se fazer? Se você pensa assim, pode fazer declarações como . Minha distribuição anterior pode representar minha incerteza sobre o verdadeiro estado da natureza , não apenas a aleatoriedade, como é comumente entendido - ou seja, se eu atribuir uma distribuição anterior ao número de bolas vermelhas em uma urna, isso não significa que eu acho que o número de bolas vermelhas é aleatória. É fixo, mas não tenho certeza.P(θ[L(X),U(X)]|X=x)

Várias pessoas, incluindo eu, disseram isso, mas se você não estiver disposto a chamar uma variável aleatória, a instrução não é significativo. Se sou freqüentador, estou tratando como uma quantidade fixa E não posso atribuir uma distribuição de probabilidade a ela. Por quê? Porque é fixo, e minha interpretação da probabilidade é em termos de frequências de longo prazo. O número de bolas vermelhas na urna nunca muda. é o que é. Se eu puxar algumas bolas, tenho uma amostra aleatória. Posso perguntar o que aconteceria se eu pegasse um monte de amostras aleatórias - ou seja, eu posso falar sobreP ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) porque o intervalo depende da amostra, que é (espere!) aleatória.

Mas você não quer isso. Você deseja - qual é a probabilidade de esse intervalo que eu construí com a minha amostra observada (e agora fixa) conter o parâmetro. No entanto, uma vez que você condicionou então, para mim, um frequentista, não resta mais nada aleatório e a instrução não ' Não faz sentido de nenhuma maneira significativa.X = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

A única maneira baseada em princípios (OMI) para fazer uma declaração sobre é quantificar nossa incerteza sobre um parâmetro com uma distribuição de probabilidade (anterior) e atualize essa distribuição com novas informações pelo Teorema de Bayes. Qualquer outra abordagem que eu vi é uma aproximação sem brilho a Bayes. Você certamente não pode fazê-lo de uma perspectiva freqüentista.P(θ[L(X),U(X)]|X=x)

Isso não quer dizer que você não possa avaliar os procedimentos freqüentadores tradicionais de uma perspectiva bayesiana (geralmente os intervalos de confiança são apenas intervalos credíveis sob antecedentes uniformes, por exemplo) ou que avaliar os estimadores bayesianos / intervalos credíveis de uma perspectiva frequentista não é valioso (Eu acho que pode ser). Não quer dizer que a estatística clássica / freqüentista seja inútil, porque não é. É o que é, e não devemos tentar torná-lo mais.

Você acha razoável dar uma distribuição prévia a um parâmetro para representar suas crenças sobre o universo? Parece que você faz seus comentários; na minha experiência, a maioria das pessoas concordaria (essa é a meia piada que eu fiz no meu comentário à resposta de G. Jay Kerns). Nesse caso, o paradigma bayesiano fornece uma maneira lógica e coerente de fazer afirmações sobre . A abordagem freqüentista simplesmente não.P(θ[L(X),U(X)]|X=x)

JMS
fonte
1
(+1) muito bem feito, novamente, e local no ponto morto.
+1 O mesmo comentário acima (consulte a resposta de G. Jay Kerns); isso foi realmente útil.
Elliott
Bounty schmounty :) Fico feliz que você tenha achado útil.
JMS
11

OK, agora você está falando! Votei em excluir minha resposta anterior, porque não faz sentido com esta pergunta importante.

Nesta pergunta nova e atualizada, com um computador que calcula intervalos de confiança de 95%, sob a interpretação freqüentista ortodoxa, eis as respostas para suas perguntas:

  1. Não.
  2. Não.
  3. Uma vez observado o intervalo, ele não é mais aleatório e não muda. (Talvez o intervalo tenha sido .) Mas também não muda e nunca mudou. (Talvez seja ) A probabilidade muda de 95% para 0% porque 95% dos intervalos que o computador calcula cobrem 7, mas 100% dos intervalos NÃO cobrem 7.θ θ = 7 [ 1 , 3 ][1,3]θθ=7[1,3]

(A propósito, no mundo real, o pesquisador nunca sabe que , o que significa que o pesquisador nunca pode saber se a verdadeira probabilidade cobre é zero ou um. (S) ele só pode diga que deve ser um ou outro.) Além disso, o pesquisador pode dizer que 95% dos intervalos do computador cobrem , mas já sabíamos disso.[ 1 , 3 ] θ θθ=7[1,3]θθ

O espírito da sua pergunta mantém insinuando volta ao observador conhecimento , e como isso se relaciona a onde mentiras. Que (presumivelmente) é por isso que você estava falando sobre a senha, sobre o computador calcular o intervalo sem o seu vê-lo ainda, etc . Vi nos seus comentários respostas que parece insatisfatório / impróprio ser obrigado a se comprometer com 0 ou 1, afinal, por que não acreditamos que seja 87%, ou mesmo 99%? ? Mas esse é exatamente o poder - e, ao mesmo tempo, o calcanhar de Aquiles - da estrutura freqüentista: o conhecimento / crença subjetiva do observador é irrelevante. Tudo o que importa é uma frequência relativa de longo prazo. Nada mais nada menos.15 / 16θ15/16

Como alternativa final: se você alterar sua interpretação da probabilidade (que você optou intencionalmente por não fazer para esta pergunta), as novas respostas são:

  1. Sim.
  2. Sim.
  3. A probabilidade muda porque probabilidade = conhecimento subjetivo, ou grau de crença, e o conhecimento do observador mudou. Representamos o conhecimento com distribuições anteriores / posteriores e, à medida que novas informações se tornam disponíveis, as primeiras se transformam nas últimas (via Regra de Bayes).

(Mas, para uma divulgação completa, a configuração que você descreve não corresponde muito bem à interpretação subjetiva. Por exemplo, geralmente temos um intervalo de credibilidade anterior de 95% antes de ligar o computador, então o acionamos e o empregamos para fornecer intervalo de credibilidade posterior de 95%, que geralmente é consideravelmente mais fino que o anterior.)


fonte
Novamente! :) Bem feito.
JMS
3
Devo apenas salientar que a interpretação bayesiana de probabilidade não é necessariamente subjetiva, de modo que não é realmente uma força da abordagem freqüentista. No caso da abordagem bayesiana objetiva da "probabilidade de um problema de desembarque de moedas", o uso de um prior não informativo não envolve nenhuma subjetividade. A verdadeira força da abordagem freqüentista reside em problemas como controle de qualidade, onde é natural falar de ensaios repetidos e frequências de longo prazo. Ele só tem dificuldades quando você faz perguntas sobre eventos específicos.
Dikran Marsupial
@JMS, obrigado. @Dikran, é difícil falar sobre isso com 544 caracteres em uma pequena caixa na tela do computador. Resumidamente: concordo que a palavra "bayesiano" não é sinônimo de "subjetivo". E não faz sentido tentar identificar onde realmente reside a força de qualquer uma das abordagens. Conclusão: todos podemos concordar com uma frequência relativa de longo prazo, mas, na maioria das vezes, sua região posterior será diferente da minha.
2
@Dikran Marsupial Você faz um bom argumento. Eu apenas acrescentaria que, depois que passamos dos problemas de brinquedo para a modelagem aplicada real, é comum que a subjetividade realmente importante apareça na maneira como especificamos a probabilidade, não necessariamente as próprias distribuições anteriores (essas observações são realmente intercambiáveis? Gaussiana? etc). Dessa forma, a subjetividade é incorporada a uma grande parte das estatísticas baseadas em modelos, tanto bayesianas quanto freqüentistas.
JMS
+1 Obrigado pela bela resposta. Definitivamente, isso merece uma recompensa, mas, para evitar ser político, acabei passando por votos positivos.
21711 Elliott
6

Vou colocar meus dois centavos (talvez redigestando algumas das respostas anteriores). Para um freqüentador, o próprio intervalo de confiança é, em essência, uma variável aleatória bidimensional: se você refizesse o experimento um zilhão de vezes, o intervalo de confiança que você estimaria (ou seja: calcular com base nos dados recém-encontrados a cada vez) diferiria cada vez . Como tal, os dois limites do intervalo são variáveis ​​aleatórias.

Um IC de 95%, portanto, significa nada mais do que a garantia (considerando que todas as suas suposições que levam a esse IC estão corretas) de que esse conjunto de variáveis ​​aleatórias conterá o valor verdadeiro (uma expressão muito frequente) em 95% dos casos.

Você pode calcular facilmente o intervalo de confiança para a média de 100 empates a partir de uma distribuição normal padrão. Então, se você desenhar 10000 vezes 100 valores dessa distribuição normal padrão e sempre calcular o intervalo de confiança para a média, verá que 0 está lá cerca de 9500 vezes.

O fato de você ter criado um intervalo de confiança apenas uma vez (a partir dos dados reais) reduz de fato a probabilidade de o valor verdadeiro estar nesse intervalo para 0 ou 1, mas não altera a probabilidade do intervalo de confiança como um valor. variável aleatória para conter o valor verdadeiro.

Portanto, a linha de fundo: a probabilidade de qualquer intervalo de confiança de 95% (ou seja, em média) que contenha o valor verdadeiro (95%) não muda, e a probabilidade de um intervalo em particular (IC ou qualquer outra coisa) conter o valor verdadeiro (0 ou 1). A probabilidade do intervalo que o computador conhece, mas você não é realmente 0 ou 1 (porque é um intervalo específico), mas como você não o conhece (e, de maneira freqüentista, não consegue recalcular esse mesmo intervalo) infinitamente várias vezes a partir dos mesmos dados), tudo o que você precisa é a probabilidade de qualquer intervalo.

Nick Sabbe
fonte
Nota lateral engraçada: o verificador ortográfico deste site considera a palavra frequentista digna de sublinhado encaracolado. Este site é secretamente dominado por bayesianos? Oh, eu acho que não é, pois Bayesians têm sua própria sublinhado encaracolado :-)
Nick Sabbe
4

O motivo pelo qual o intervalo de confiança não especifica "a probabilidade de que o parâmetro true esteja no intervalo" é porque, uma vez especificado o intervalo, o paramater fica nele ou não. No entanto, para um intervalo de confiança de 95%, por exemplo, você tem 95% de chance de criar um intervalo de confiança que contenha o valor. Este é um conceito bastante difícil de entender, por isso posso não estar articulando bem. Veja http://frank.itlab.us/datamodel/node39.html para mais esclarecimentos.

Lauren Gundrum
fonte
2
Suponha que você programe um computador para calcular um intervalo de confiança, mas não analisa a saída. Antes de ver a saída, você sabe que há uma chance de 95% de que o intervalo contenha o parâmetro correto (assim como antes de ver o resultado de uma troca de moeda, você sabe que há 50% de chance de cara). De que maneira a observação subsequente da saída altera essa probabilidade, considerando que você não conhece o parâmetro correto em primeiro lugar (concordo que observar o resultado de um lançamento de moeda altera a probabilidade de cabeças de 50% para 1) ou 0)?
Elliott
Além disso, embora eu concorde que há uma distinção, estou me perguntando o que há de errado com o meu "argumento" acima mostrando que eles são a mesma coisa.
Elliott
2
@ Elliott Suas perguntas parecem ser as mesmas desta analogia: você joga uma moeda justa. Portanto, a probabilidade de cabeças é de 50%. Agora você olha para a moeda e ela é cara. De que maneira isso muda a probabilidade de cabeças? A resposta é que não, porque a probabilidade se refere ao procedimento de troca de moedas, e não ao resultado. Parece-me que o contraexemplo a que você se refere funciona de maneira semelhante: o procedimento pode ter uma chance de 50% de cobrir o parâmetro, mas após o fato de ter sido possível verificar se o parâmetro está realmente coberto. E daí?
whuber
Não estou falando de mudar a probabilidade de uma moeda justa ser cara; em vez disso, estou falando sobre mudar a probabilidade de que essa moeda em particular seja cara. Depois que eu o viro e antes de olhá-lo, eu diria que a probabilidade em questão é de 50%, porque cerca de metade desses casos envolve uma moeda com heads-up. Por outro lado, depois de olhá-lo e ver caras, 100% desses casos envolvem uma moeda com heads-up (os casos com caudas para cima foram eliminados quando eu olhei para a moeda e não vi cabeças).
217 Elliott
Concordo que após o fato, pode ser possível verificar se o parâmetro foi coberto. Minha resposta para "e daí?" é "então meu argumento acima (na pergunta original) deve estar errado, e eu estou imaginando o que há de errado com ele".
22711 Elliott
4

Eu não acho que um frequentista possa dizer que existe alguma probabilidade do verdadeiro valor (populacional) de uma estatística no intervalo de confiança de uma amostra específica. Ou é, ou não é, mas não há frequência de longo prazo para um evento específico, apenas a população de eventos que você obteria pela execução repetida de um procedimento estatístico. É por isso que temos que seguir declarações como "95% dos intervalos de confiança construídos conterão o valor verdadeiro da estatística", mas não "existe uma probabilidade de% de que o valor verdadeiro esteja no intervalo de confiança calculado para esse particular amostra". Isso é verdade para qualquer valor de p, simplesmente não é possível com a definição freqüentista do que realmente é uma probabilidade. Um bayesiano pode fazer tal afirmação usando um intervalo credível.

Dikran Marsupial
fonte
3

E[a,b]

E~(L(X),U(X))

Editar: @G. Jay Kerns torna o argumento melhor do que eu e digita mais rápido, então provavelmente apenas continue :)

JMS
fonte
[a,b]
2
|
Eu não sei, o seu está no local. :-)
2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0

raegtin
fonte
Considerando que defini C como o evento em que esse intervalo específico, [a, b], contém o parâmetro true, não tenho certeza se concordo que E e C / C 'sejam independentes: saber que C ocorreu garante que E ocorreu .
9118 Elliott
Mas C é uma variável aleatória! Você está alterando as definições de todos esses eventos depois que tudo já ocorreu. Em outras palavras, se você estiver definindo C como esse evento específico, C não será mais um intervalo de confiança.
raegtin
2
O problema é que, se C é o evento em que o intervalo contém o parâmetro true nessa execução específica do experimento, ele não possui uma frequência de execução longa (essa execução específica pode ocorrer apenas uma vez) e, portanto, você não pode atribuir uma probabilidade freqüentista. É por isso que a definição de um intervalo de confiança freqüentista é em termos de uma população de experimentos replicados. Parece que você está aplicando o raciocínio bayesiano a um cenário freqüentista e há uma incompatibilidade de definições de probabilidade.
Dikran Marsupial
Aqui está outra maneira de ver isso. O que você parece estar fazendo é o seguinte: execute um cálculo para obter um intervalo de confiança [a, b]. Defina C como o evento em que esse intervalo de confiança específico [a, b] contém o parâmetro true. Defina também E como o evento em que esse intervalo específico [a, b] contém o parâmetro true. Assim, E e C são o mesmo evento!
raegtin
É isso que você está realmente fazendo. Parece que você pensa que está fazendo o seguinte (o que não é): execute o cálculo nº 1 para obter um intervalo [a, b]. Defina E como o evento em que esse intervalo específico [a, b] contém o parâmetro true. Em seguida, esqueça o cálculo nº 1 e defina C como o evento em que qualquer outro intervalo calculado [a ', b'] contenha o parâmetro true. Nesse caso, E e C são independentes.
raegtin
2

Há tantas explicações longas aqui que não tenho tempo para lê-las. Mas acho que a resposta para a pergunta básica pode ser curta e doce. É a diferença entre uma probabilidade que é incondicional nos dados. A probabilidade de 1-alfa antes de coletar os dados é a probabilidade de que o procedimento bem definido inclua o parâmetro. Depois de coletar os dados e saber que o intervalo específico que você gerou, o intervalo é fixo e, como o parâmetro é uma constante, a probabilidade condicional é 0 ou 1. Mas, como ainda não sabemos o valor real do parâmetro, depois de coletar os dados, não sabemos qual é o valor.

A extensão do post por Michael Chernick copiou os comentários do formulário:

há uma exceção patológica a isso que pode ser chamada estimativa perfeita. Suponha que tenhamos um processo autoregressivo de primeira ordem, dado por X (n) = pX (n-1) + en. Como é estacionário, sabemos que p não é 1 ou -1 e é <1 em valor absoluto. Agora, os en são distribuídos de forma idêntica e independente, com uma distribuição mista; existe uma probabilidade positiva q de que en = 0

Existe uma exceção patológica a isso que pode ser chamada estimativa perfeita. Suponha que tenhamos um processo autoregressivo de primeira ordem, dado por X (n) = pX (n-1) + en. Como é estacionário, sabemos que p não é 1 ou -1 e é <1 em valor absoluto.

Agora, os en são distribuídos de forma idêntica e independente, com uma distribuição mista. Existe uma probabilidade positiva q de que en = 0 e com probabilidade 1-q tenha uma distribuição absolutamente contínua (digamos que a densidade é diferente de zero em um intervalo limitado a 0. Então coletar dados da série temporal sequencialmente e para cada par sucessivo de valores estimar p por X (i) / X (i-1) Agora, quando ei = 0, a razão será exatamente p.

Como q é maior que 0, eventualmente, a razão repetirá um valor e esse valor deve ser o valor exato do parâmetro p porque, se não for o valor de ei que não é 0, repetirá com a probabilidade 0 e ei / x (i -1) não se repetirá.

Portanto, a regra de parada sequencial é amostrar até que a proporção se repita exatamente e use o valor repetido como a estimativa de p. Como p é exatamente qualquer intervalo que você constrói, centrado nessa estimativa, tem probabilidade 1 de incluir o parâmetro true. Embora este seja um exemplo patológico impraticável, existem processos estocásticos estacionários com as propriedades necessárias para a distribuição de erros

Michael Chernick
fonte
2
você considerou anexar o exemplo descrito ao longo desses vários comentários à sua resposta?
Macro
@ Michael Eu vou comentar segundo Macro. Observe que os comentários geralmente são vistos como uma maneira de interagir com outros usuários (por exemplo, ao solicitar esclarecimentos etc.) e, em qualquer caso, às vezes são vistos como ' cidadãos de terceira classe no Stack Exchange '. No entanto, após a nossa troca mais recente, deixarei que você decida como proceder com essa série de comentários. Esta observação se aplica a outra série de comentários encontrados aqui .
chl
Não coloco comentários nas respostas, porque parece haver uma política para reduzir as respostas que têm muita discussão em particular quando alguém julga que a resposta realmente não responde à pergunta. Portanto, as respostas são para dar respostas e comentários sob comentários. Meus comentários tendem a ultrapassar o limite de caracteres, então eu uso vários.
Michael Chernick
@MichaelChernick Não existe tal política, portanto, eu incorporei seus comentários no post.
1
@MichaelChernick, venho postando neste site regularmente há cerca de um ano e nunca ouvi ninguém sugerir que os moderadores eram opressivos ou que as regras do site eram confusas. Os problemas que você encontrou em re: suas postagens são discutidos explicitamente nas Perguntas frequentes.
Macro
1

Duas observações sobre as muitas perguntas e respostas que podem ajudar ainda.

Parte da confusão vem do encobrimento de uma matemática mais profunda da teoria das probabilidades, que, a propósito, não estava em pé de igualdade matemática até a década de 1940. Ele entra no que constitui espaços de amostra, espaços de probabilidade etc.

Primeiro, você afirmou que, após um lançamento de moeda, sabemos que existe uma probabilidade de 0% de que não surja coroa se surgir cara. Nesse ponto, não faz sentido falar sobre probabilidade; o que aconteceu aconteceu, e nós sabemos disso. A probabilidade é sobre o desconhecido no futuro, não o conhecido no presente.

Como um pequeno corolário sobre o que a probabilidade zero realmente significa, considere o seguinte: assumimos que uma contagem justa tem uma probabilidade de 0,5 de virada na cara e 0,5 de virada na coroa. Isso significa que ele tem 100% de chance de aparecer cara ou coroa, já que esses resultados são MECE (mutuamente exclusivos e completamente exaustivos). No entanto, há uma mudança de zero por cento na composição de caras e rabos : Nossa noção de 'cara' e 'coroa' é que eles são mutuamente exclusivos. Assim, isso tem zero por cento de chance, porque é impossível na maneira como pensamos (ou definimos) 'jogar uma moeda'. E é impossível antes e depois do sorteio.

Como corolário adicional disso, qualquer coisa que não seja, por definição, impossível é possível. No mundo real, odeio quando os advogados perguntam "não é possível que você assinou este documento e se esqueceu dele?" porque a resposta é sempre "sim" pela natureza da pergunta. Por outro lado, a resposta também é "sim" para a pergunta "não é possível que você tenha sido transportado por desmaterialização para o planeta Remulak 4 e forçado a fazer algo e depois transportado de volta sem nenhuma lembrança?". A probabilidade pode ser muito baixa - mas o que não é impossível é possível. Em nosso conceito regular de probabilidade, quando falamos em jogar uma moeda, ela pode surgir; pode aparecer caudas; e pode até ficar de pé ou (de alguma forma, como se fôssemos esgueirados para dentro de uma nave espacial enquanto drogados e levados em órbita) flutuassem no ar para sempre. Mas, antes ou depois do sorteio, caudas ao mesmo tempo: são resultados mutuamente exclusivos no espaço amostral do experimento (procure 'espaços amostrais probabilísticos' e 'álgebras sigma').

Segundo, em toda essa filosofia bayesiana / freqüentista em intervalos de confiança, é verdade que se refere a frequências se alguém está atuando como freqüentista. Portanto, quando dizemos que o intervalo de confiança para uma média amostrada e estimada é de 95%, não estamos dizendo que temos 95% de certeza de que o valor "real" está entre os limites. Estamos dizendo que, se pudéssemos repetir esse experimento repetidamente, 95% das vezes descobriríamos que a média estava, de fato, entre os limites. Quando fazemos isso com uma única corrida, no entanto, estamos pegando um atalho mental e dizendo 'temos 95% de certeza de que estamos certos'.

Por fim, não se esqueça de qual é a configuração padrão em um teste de hipótese com base em um experimento. Se queremos saber se um hormônio de crescimento da planta faz com que as plantas cresçam mais rapidamente, talvez primeiro determinemos o tamanho médio de um tomate após 6 meses de crescimento. Então repetimos, mas com o hormônio, e obtemos o tamanho médio. Nossa hipótese nula é "o hormônio não funcionou" e testamos isso . Mas, se as plantas testadas forem, em média, maiores, com 99% de confiança, isso significa 'sempre haverá variação aleatória devido às plantas e com que precisão pesamos, mas a quantidade de aleatoriedade que explicaria isso ocorreria menos de um tempo em cem. "

eSurfsnake
fonte
1

A questão pode ser caracterizada como uma confusão de probabilidade anterior e posterior ou talvez como a insatisfação de não conhecer a distribuição conjunta de certas variáveis ​​aleatórias.

Condicionamento

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Não condicionar a evidência significa ignorar a evidência. No entanto, só podemos condicionar o que é expressável no modelo probabilístico. Em nosso exemplo, com as duas bolas da urna, não podemos condicionar o clima ou a forma como nos sentimos hoje. Caso tenhamos motivos para acreditar que essa é uma evidência relevante para o experimento, precisamos primeiro mudar nosso modelo para nos permitir expressar essa evidência como eventos formais.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Intervalo de confiança

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ, significaria reconhecer essas evidências e, ao mesmo tempo, ignorá-las.

Aprendendo mais, sabendo menos

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX

Lasse Kliemann
fonte
0

Se eu digo que a probabilidade que os Knicks marcaram entre xbar - 2sd (x) e xbar + 2sd (x) é de cerca de 0,95 em algum jogo no passado, essa é uma afirmação razoável, dada uma suposição distributiva específica sobre a distribuição das pontuações de basquete . Se eu coletar dados sobre as pontuações dadas uma amostra de jogos e calcular esse intervalo, a probabilidade de que eles pontuaram nesse intervalo em um determinado dia no passado é claramente zero ou um, e você pode pesquisar no resultado do jogo no Google para descobrir. A única noção de manter uma probabilidade diferente de zero ou de uma probabilidade para o freqüentador vem de amostragens repetidas, e a realização da estimativa de intervalo de uma amostra específica é o ponto mágico em que aconteceu ou não forneceu a estimativa de intervalo dessa amostra. . Não é o ponto em que você digita a senha,

É isso que Dikran argumenta acima, e votei na resposta dele. O ponto em que amostras repetidas estão fora de consideração é o ponto no paradigma freqüentista em que a probabilidade não discreta se torna impossível , não quando você digita a senha como no seu exemplo acima ou quando pesquisa o resultado no meu exemplo do exemplo Jogo de Knicks, mas o ponto em que seu número de amostras = 1.

Patrick McCann
fonte
0

Modelagem

S=(Ω,Σ,P)EΣP(E)ESS

O passo (1) pode permitir alguma margem de manobra. Às vezes, a adequação da modelagem pode ser testada comparando a probabilidade de certos eventos com o que esperaríamos intuitivamente. Em particular, examinar certas probabilidades marginais ou condicionais pode ajudar a ter uma idéia de quão apropriada é a modelagem.

X1,,XnDist(θ)θR

Estimador de intervalo de confiança

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

Preferências

γ1γ2γ1<γ2uma probabilidade maior de ser um bilhete vencedor do que o primeiro quando eles foram sorteados. Uma preferência em relação a observações diferentes (os dois tickets neste exemplo) com base nas propriedades probabilísticas dos processos aleatórios que geraram as observações é boa. Observe que não dizemos que nenhum dos ingressos tem maior probabilidade de ser um bilhete vencedor. Se alguma vez dissermos isso, então com "probabilidade" em um sentido coloquial, o que pode significar qualquer coisa, por isso é melhor evitar aqui.

0.95

Exemplo com um Prior Simples

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)
Lasse Kliemann
fonte
0

Se pudéssemos dizer "a probabilidade de que o parâmetro true esteja neste intervalo de confiança", não consideraríamos o tamanho da amostra. Não importa o tamanho da amostra, contanto que a média seja a mesma, o intervalo de confiança será igualmente amplo. Mas quando dizemos "se eu repetir isso 100 vezes, esperaria que, em 95 dos casos, o parâmetro true esteja dentro do intervalo", estamos levando em consideração o tamanho do tamanho da amostra e a certeza de nossa estimativa. . Quanto maior o tamanho da amostra, menor a variação da estimativa média. Portanto, não varia muito e, quando repetimos o procedimento 100 vezes, não precisamos de um intervalo grande para garantir que, em 95 dos casos, o parâmetro true esteja no intervalo.

OBIEK
fonte
Lembre-se de que o intervalo de confiança é um conceito freqüentista.
Michael Chernick