Meu entendimento atual da noção "intervalo de confiança com nível de confiança " é que, se tentássemos calcular o intervalo de confiança várias vezes (sempre com uma nova amostra), ele conteria o parâmetro correto do Tempo.
Embora eu perceba que isso não é o mesmo que "probabilidade de que o parâmetro verdadeiro esteja nesse intervalo", há algo que quero esclarecer.
[Major Update]
Antes de calcularmos um intervalo de confiança de 95%, há uma probabilidade de 95% de que o intervalo que calculamos cubra o parâmetro true. Depois de calcularmos o intervalo de confiança e obtermos um intervalo específico , não podemos mais dizer isso. Não podemos sequer argumentar de maneira não frequente que temos 95% de certeza de que o verdadeiro parâmetro estará em ; pois, se pudéssemos, contradiz contra exemplos como este: o que, precisamente, é um intervalo de confiança?[ a , b ]
Não quero fazer disso um debate sobre a filosofia da probabilidade; em vez disso, estou procurando uma explicação matemática precisa de como e por que ver o intervalo específico muda (ou não muda) a probabilidade de 95% que tínhamos antes de ver esse intervalo. Se você argumenta que "depois de ver o intervalo, a noção de probabilidade não faz mais sentido", tudo bem, vamos trabalhar em uma interpretação da probabilidade na qual faz sentido.
Mais precisamente:
Suponha que programamos um computador para calcular um intervalo de confiança de 95%. O computador processa alguns números, calcula um intervalo e se recusa a me mostrar o intervalo até que eu digite uma senha. Antes de inserir a senha e ver o intervalo (mas depois que o computador já a calculou), qual é a probabilidade de o intervalo conter o parâmetro true? É 95%, e esta parte não está em debate : esta é a interpretação da probabilidade que me interessa para esta questão em particular (percebo que existem questões filosóficas importantes que estou suprimindo, e isso é intencional).
Porém, assim que eu digitar a senha e fizer o computador me mostrar o intervalo calculado, a probabilidade (que o intervalo contenha o parâmetro true) poderá mudar. Qualquer alegação de que essa probabilidade nunca mude contraria o contraexemplo acima. Nesse contra-exemplo, a probabilidade pode mudar de 50% para 100%, mas ...
Existem exemplos em que a probabilidade muda para algo diferente de 100% ou 0% (EDIT: e se sim, quais são eles)?
Existem exemplos em que a probabilidade não muda depois de ver o intervalo específico (ou seja, a probabilidade de o parâmetro verdadeiro estar em ainda é de 95%)?[ a , b ]
Como (e por que) a probabilidade muda em geral depois de ver o computador cuspir ?
[Editar]
Obrigado por todas as ótimas respostas e discussões úteis!
fonte
Respostas:
Penso que o problema fundamental é que as estatísticas frequentistas só podem atribuir uma probabilidade a algo que pode ter uma frequência de longo prazo. Se o valor real de um parâmetro está em um intervalo específico ou não, não possui uma frequência de longo prazo, pois só podemos realizar o experimento uma vez, para que você não possa atribuir uma probabilidade freqüente a ele. O problema surge da definição de probabilidade. Se você alterar a definição de probabilidade para Bayesiana, o problema desaparecerá instantaneamente, pois você não estará mais vinculado à discussão de frequências de longo prazo.
Veja minha resposta (em vez da língua) para uma pergunta relacionada aqui :
" Um freqüentista é alguém que acredita que as probabilidades representam frequências de longo prazo com as quais ocorrem eventos; se necessário, ele inventará uma população fictícia da qual sua situação específica pode ser considerada uma amostra aleatória, para que ele possa falar significativamente sobre frequências de longo prazo. Se Se você fizer uma pergunta sobre uma situação específica, ele não dará uma resposta direta, mas fará uma declaração sobre essa população (possivelmente imaginária) " .
No caso de um intervalo de confiança, a pergunta que normalmente gostaríamos de fazer (a menos que tenhamos um problema no controle de qualidade, por exemplo) é "dada essa amostra de dados, retorne o menor intervalo que contenha o valor verdadeiro do parâmetro com probabilidade X ". No entanto, um frequentista não pode fazer isso, pois o experimento é realizado apenas uma vez e, portanto, não há frequências de longo prazo que possam ser usadas para atribuir uma probabilidade. Portanto, o frequentista precisa inventar uma população de experimentos (que você não realizou) a partir dos quais o experimento que você realizou pode ser considerado uma amostra aleatória. O frequentista então fornece uma resposta indireta sobre essa população fictícia de experimentos, em vez de uma resposta direta à pergunta que você realmente queria fazer sobre um experimento específico.
Essencialmente, é um problema de linguagem, a definição freqüente de uma população simplesmente não permite discutir a probabilidade do verdadeiro valor de um parâmetro em um intervalo específico. Isso não significa que as estatísticas freqüentistas sejam ruins ou não sejam úteis, mas é importante conhecer as limitações.
Em relação à grande atualização
Não tenho certeza se podemos dizer que "Antes de calcular um intervalo de confiança de 95%, há uma probabilidade de 95% de que o intervalo que calculamos cubra o parâmetro verdadeiro". dentro de um quadro freqüentista. Existe uma inferência implícita aqui de que a frequência de longo prazo com a qual o valor verdadeiro do parâmetro se encontra em intervalos de confiança construídos por algum método específico também é a probabilidade de que o valor verdadeiro do parâmetro esteja no intervalo de confiança para a amostra em particular. de dados que vamos usar. Essa é uma inferência perfeitamente razoável, mas é uma inferência bayesiana, não freqüentista, pois a probabilidade de que o verdadeiro valor do parâmetro esteja no intervalo de confiança que construímos para uma amostra específica de dados não tem frequência de longo prazo, pois nós temos apenas uma amostra de dados.
No entanto, podemos "fazer algum tipo de argumento não freqüentador de que temos 95% de certeza de que o parâmetro verdadeiro estará em [a, b]", é exatamente isso que é um intervalo credível bayesiano e, para muitos problemas, o intervalo credível bayesiano coincide exatamente com o intervalo de confiança freqüentista.
"Eu não quero fazer disso um debate sobre a filosofia da probabilidade", infelizmente isso é inevitável, a razão pela qual você não pode atribuir uma probabilidade frequista para saber se o verdadeiro valor da estatística está no intervalo de confiança é uma conseqüência direta da filosofia freqüentista da probabilidade. Os freqüentistas só podem atribuir probabilidades a coisas que podem ter frequências de longo prazo, pois é assim que os freqüentadores definem a probabilidade em sua filosofia. Isso não faz a filosofia freqüentista estar errada, mas é importante entender os limites impostos pela definição de probabilidade.
"Antes de inserir a senha e ver o intervalo (mas depois que o computador já a calculou), qual é a probabilidade de o intervalo conter o parâmetro true? É 95% e esta parte não está em debate:" está incorreto, ou pelo menos ao fazer tal afirmação, você se afastou da estrutura das estatísticas freqüentistas e fez uma inferência bayesiana envolvendo um grau de plausibilidade na verdade de uma afirmação, em vez de uma frequência de longo prazo. No entanto, como eu disse anteriormente, é uma inferência perfeitamente razoável e natural.
Nada mudou antes ou depois de digitar a senha, porque é possível atribuir uma probabilidade freqüente a nenhum evento. As estatísticas freqüentistas podem ser bastante contra-intuitivas, pois muitas vezes queremos fazer perguntas sobre graus de plausibilidade de declarações sobre eventos particulares, mas isso está fora do âmbito das estatísticas freqüentistas, e é a origem da maioria das interpretações errôneas dos procedimentos freqüentistas.
fonte
Grande atualização, grande nova resposta. Deixe-me tentar abordar claramente esse ponto, porque é onde está o problema:
"Se você argumenta que" depois de ver o intervalo, a noção de probabilidade não faz mais sentido ", tudo bem, vamos trabalhar em uma interpretação de probabilidade na qual faz sentido".
As regras da probabilidade não mudam, mas o seu modelo para o universo muda. Você está disposto a quantificar suas crenças anteriores sobre um parâmetro usando uma distribuição de probabilidade? Atualizar a distribuição de probabilidade depois de ver os dados é uma coisa razoável a se fazer? Se você pensa assim, pode fazer declarações como . Minha distribuição anterior pode representar minha incerteza sobre o verdadeiro estado da natureza , não apenas a aleatoriedade, como é comumente entendido - ou seja, se eu atribuir uma distribuição anterior ao número de bolas vermelhas em uma urna, isso não significa que eu acho que o número de bolas vermelhas é aleatória. É fixo, mas não tenho certeza.P( θ ∈ [ L ( X) , U( X) ] | X= x )
Várias pessoas, incluindo eu, disseram isso, mas se você não estiver disposto a chamar uma variável aleatória, a instrução não é significativo. Se sou freqüentador, estou tratando como uma quantidade fixa E não posso atribuir uma distribuição de probabilidade a ela. Por quê? Porque é fixo, e minha interpretação da probabilidade é em termos de frequências de longo prazo. O número de bolas vermelhas na urna nunca muda. é o que é. Se eu puxar algumas bolas, tenho uma amostra aleatória. Posso perguntar o que aconteceria se eu pegasse um monte de amostras aleatórias - ou seja, eu posso falar sobreP ( θ ∈ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ ∈ [ L ( X ) , U ( X ) ] )θ P( θ ∈ [ L ( X) , U( X) ] | X= x ) θ θ θ P( θ ∈ [ L ( X) , U( X) ] ) porque o intervalo depende da amostra, que é (espere!) aleatória.
Mas você não quer isso. Você deseja - qual é a probabilidade de esse intervalo que eu construí com a minha amostra observada (e agora fixa) conter o parâmetro. No entanto, uma vez que você condicionou então, para mim, um frequentista, não resta mais nada aleatório e a instrução não ' Não faz sentido de nenhuma maneira significativa.X = x P ( θ ∈ [ L ( X ) , U ( X ) ] | X = x )P( θ ∈ [ L ( X) , U( X) ] | X= x ) X= x P( θ ∈ [ L ( X) , U( X) ] | X= x )
A única maneira baseada em princípios (OMI) para fazer uma declaração sobre é quantificar nossa incerteza sobre um parâmetro com uma distribuição de probabilidade (anterior) e atualize essa distribuição com novas informações pelo Teorema de Bayes. Qualquer outra abordagem que eu vi é uma aproximação sem brilho a Bayes. Você certamente não pode fazê-lo de uma perspectiva freqüentista.P( θ ∈ [ L ( X) , U( X) ] | X= x )
Isso não quer dizer que você não possa avaliar os procedimentos freqüentadores tradicionais de uma perspectiva bayesiana (geralmente os intervalos de confiança são apenas intervalos credíveis sob antecedentes uniformes, por exemplo) ou que avaliar os estimadores bayesianos / intervalos credíveis de uma perspectiva frequentista não é valioso (Eu acho que pode ser). Não quer dizer que a estatística clássica / freqüentista seja inútil, porque não é. É o que é, e não devemos tentar torná-lo mais.
Você acha razoável dar uma distribuição prévia a um parâmetro para representar suas crenças sobre o universo? Parece que você faz seus comentários; na minha experiência, a maioria das pessoas concordaria (essa é a meia piada que eu fiz no meu comentário à resposta de G. Jay Kerns). Nesse caso, o paradigma bayesiano fornece uma maneira lógica e coerente de fazer afirmações sobre . A abordagem freqüentista simplesmente não.P( θ ∈ [ L ( X) , U( X) ] | X= x )
fonte
OK, agora você está falando! Votei em excluir minha resposta anterior, porque não faz sentido com esta pergunta importante.
Nesta pergunta nova e atualizada, com um computador que calcula intervalos de confiança de 95%, sob a interpretação freqüentista ortodoxa, eis as respostas para suas perguntas:
(A propósito, no mundo real, o pesquisador nunca sabe que , o que significa que o pesquisador nunca pode saber se a verdadeira probabilidade cobre é zero ou um. (S) ele só pode diga que deve ser um ou outro.) Além disso, o pesquisador pode dizer que 95% dos intervalos do computador cobrem , mas já sabíamos disso.[ 1 , 3 ] θ θθ = 7 [ 1 , 3 ] θ θ
O espírito da sua pergunta mantém insinuando volta ao observador conhecimento , e como isso se relaciona a onde mentiras. Que (presumivelmente) é por isso que você estava falando sobre a senha, sobre o computador calcular o intervalo sem o seu vê-lo ainda, etc . Vi nos seus comentários respostas que parece insatisfatório / impróprio ser obrigado a se comprometer com 0 ou 1, afinal, por que não acreditamos que seja 87%, ou mesmo 99%? ? Mas esse é exatamente o poder - e, ao mesmo tempo, o calcanhar de Aquiles - da estrutura freqüentista: o conhecimento / crença subjetiva do observador é irrelevante. Tudo o que importa é uma frequência relativa de longo prazo. Nada mais nada menos.15 / 16θ 15 / 16
Como alternativa final: se você alterar sua interpretação da probabilidade (que você optou intencionalmente por não fazer para esta pergunta), as novas respostas são:
(Mas, para uma divulgação completa, a configuração que você descreve não corresponde muito bem à interpretação subjetiva. Por exemplo, geralmente temos um intervalo de credibilidade anterior de 95% antes de ligar o computador, então o acionamos e o empregamos para fornecer intervalo de credibilidade posterior de 95%, que geralmente é consideravelmente mais fino que o anterior.)
fonte
Vou colocar meus dois centavos (talvez redigestando algumas das respostas anteriores). Para um freqüentador, o próprio intervalo de confiança é, em essência, uma variável aleatória bidimensional: se você refizesse o experimento um zilhão de vezes, o intervalo de confiança que você estimaria (ou seja: calcular com base nos dados recém-encontrados a cada vez) diferiria cada vez . Como tal, os dois limites do intervalo são variáveis aleatórias.
Um IC de 95%, portanto, significa nada mais do que a garantia (considerando que todas as suas suposições que levam a esse IC estão corretas) de que esse conjunto de variáveis aleatórias conterá o valor verdadeiro (uma expressão muito frequente) em 95% dos casos.
Você pode calcular facilmente o intervalo de confiança para a média de 100 empates a partir de uma distribuição normal padrão. Então, se você desenhar 10000 vezes 100 valores dessa distribuição normal padrão e sempre calcular o intervalo de confiança para a média, verá que 0 está lá cerca de 9500 vezes.
O fato de você ter criado um intervalo de confiança apenas uma vez (a partir dos dados reais) reduz de fato a probabilidade de o valor verdadeiro estar nesse intervalo para 0 ou 1, mas não altera a probabilidade do intervalo de confiança como um valor. variável aleatória para conter o valor verdadeiro.
Portanto, a linha de fundo: a probabilidade de qualquer intervalo de confiança de 95% (ou seja, em média) que contenha o valor verdadeiro (95%) não muda, e a probabilidade de um intervalo em particular (IC ou qualquer outra coisa) conter o valor verdadeiro (0 ou 1). A probabilidade do intervalo que o computador conhece, mas você não é realmente 0 ou 1 (porque é um intervalo específico), mas como você não o conhece (e, de maneira freqüentista, não consegue recalcular esse mesmo intervalo) infinitamente várias vezes a partir dos mesmos dados), tudo o que você precisa é a probabilidade de qualquer intervalo.
fonte
O motivo pelo qual o intervalo de confiança não especifica "a probabilidade de que o parâmetro true esteja no intervalo" é porque, uma vez especificado o intervalo, o paramater fica nele ou não. No entanto, para um intervalo de confiança de 95%, por exemplo, você tem 95% de chance de criar um intervalo de confiança que contenha o valor. Este é um conceito bastante difícil de entender, por isso posso não estar articulando bem. Veja http://frank.itlab.us/datamodel/node39.html para mais esclarecimentos.
fonte
Eu não acho que um frequentista possa dizer que existe alguma probabilidade do verdadeiro valor (populacional) de uma estatística no intervalo de confiança de uma amostra específica. Ou é, ou não é, mas não há frequência de longo prazo para um evento específico, apenas a população de eventos que você obteria pela execução repetida de um procedimento estatístico. É por isso que temos que seguir declarações como "95% dos intervalos de confiança construídos conterão o valor verdadeiro da estatística", mas não "existe uma probabilidade de% de que o valor verdadeiro esteja no intervalo de confiança calculado para esse particular amostra". Isso é verdade para qualquer valor de p, simplesmente não é possível com a definição freqüentista do que realmente é uma probabilidade. Um bayesiano pode fazer tal afirmação usando um intervalo credível.
fonte
Editar: @G. Jay Kerns torna o argumento melhor do que eu e digita mais rápido, então provavelmente apenas continue :)
fonte
fonte
Há tantas explicações longas aqui que não tenho tempo para lê-las. Mas acho que a resposta para a pergunta básica pode ser curta e doce. É a diferença entre uma probabilidade que é incondicional nos dados. A probabilidade de 1-alfa antes de coletar os dados é a probabilidade de que o procedimento bem definido inclua o parâmetro. Depois de coletar os dados e saber que o intervalo específico que você gerou, o intervalo é fixo e, como o parâmetro é uma constante, a probabilidade condicional é 0 ou 1. Mas, como ainda não sabemos o valor real do parâmetro, depois de coletar os dados, não sabemos qual é o valor.
A extensão do post por Michael Chernick copiou os comentários do formulário:
há uma exceção patológica a isso que pode ser chamada estimativa perfeita. Suponha que tenhamos um processo autoregressivo de primeira ordem, dado por X (n) = pX (n-1) + en. Como é estacionário, sabemos que p não é 1 ou -1 e é <1 em valor absoluto. Agora, os en são distribuídos de forma idêntica e independente, com uma distribuição mista; existe uma probabilidade positiva q de que en = 0
Existe uma exceção patológica a isso que pode ser chamada estimativa perfeita. Suponha que tenhamos um processo autoregressivo de primeira ordem, dado por X (n) = pX (n-1) + en. Como é estacionário, sabemos que p não é 1 ou -1 e é <1 em valor absoluto.
Agora, os en são distribuídos de forma idêntica e independente, com uma distribuição mista. Existe uma probabilidade positiva q de que en = 0 e com probabilidade 1-q tenha uma distribuição absolutamente contínua (digamos que a densidade é diferente de zero em um intervalo limitado a 0. Então coletar dados da série temporal sequencialmente e para cada par sucessivo de valores estimar p por X (i) / X (i-1) Agora, quando ei = 0, a razão será exatamente p.
Como q é maior que 0, eventualmente, a razão repetirá um valor e esse valor deve ser o valor exato do parâmetro p porque, se não for o valor de ei que não é 0, repetirá com a probabilidade 0 e ei / x (i -1) não se repetirá.
Portanto, a regra de parada sequencial é amostrar até que a proporção se repita exatamente e use o valor repetido como a estimativa de p. Como p é exatamente qualquer intervalo que você constrói, centrado nessa estimativa, tem probabilidade 1 de incluir o parâmetro true. Embora este seja um exemplo patológico impraticável, existem processos estocásticos estacionários com as propriedades necessárias para a distribuição de erros
fonte
Duas observações sobre as muitas perguntas e respostas que podem ajudar ainda.
Parte da confusão vem do encobrimento de uma matemática mais profunda da teoria das probabilidades, que, a propósito, não estava em pé de igualdade matemática até a década de 1940. Ele entra no que constitui espaços de amostra, espaços de probabilidade etc.
Primeiro, você afirmou que, após um lançamento de moeda, sabemos que existe uma probabilidade de 0% de que não surja coroa se surgir cara. Nesse ponto, não faz sentido falar sobre probabilidade; o que aconteceu aconteceu, e nós sabemos disso. A probabilidade é sobre o desconhecido no futuro, não o conhecido no presente.
Como um pequeno corolário sobre o que a probabilidade zero realmente significa, considere o seguinte: assumimos que uma contagem justa tem uma probabilidade de 0,5 de virada na cara e 0,5 de virada na coroa. Isso significa que ele tem 100% de chance de aparecer cara ou coroa, já que esses resultados são MECE (mutuamente exclusivos e completamente exaustivos). No entanto, há uma mudança de zero por cento na composição de caras e rabos : Nossa noção de 'cara' e 'coroa' é que eles são mutuamente exclusivos. Assim, isso tem zero por cento de chance, porque é impossível na maneira como pensamos (ou definimos) 'jogar uma moeda'. E é impossível antes e depois do sorteio.
Como corolário adicional disso, qualquer coisa que não seja, por definição, impossível é possível. No mundo real, odeio quando os advogados perguntam "não é possível que você assinou este documento e se esqueceu dele?" porque a resposta é sempre "sim" pela natureza da pergunta. Por outro lado, a resposta também é "sim" para a pergunta "não é possível que você tenha sido transportado por desmaterialização para o planeta Remulak 4 e forçado a fazer algo e depois transportado de volta sem nenhuma lembrança?". A probabilidade pode ser muito baixa - mas o que não é impossível é possível. Em nosso conceito regular de probabilidade, quando falamos em jogar uma moeda, ela pode surgir; pode aparecer caudas; e pode até ficar de pé ou (de alguma forma, como se fôssemos esgueirados para dentro de uma nave espacial enquanto drogados e levados em órbita) flutuassem no ar para sempre. Mas, antes ou depois do sorteio, caudas ao mesmo tempo: são resultados mutuamente exclusivos no espaço amostral do experimento (procure 'espaços amostrais probabilísticos' e 'álgebras sigma').
Segundo, em toda essa filosofia bayesiana / freqüentista em intervalos de confiança, é verdade que se refere a frequências se alguém está atuando como freqüentista. Portanto, quando dizemos que o intervalo de confiança para uma média amostrada e estimada é de 95%, não estamos dizendo que temos 95% de certeza de que o valor "real" está entre os limites. Estamos dizendo que, se pudéssemos repetir esse experimento repetidamente, 95% das vezes descobriríamos que a média estava, de fato, entre os limites. Quando fazemos isso com uma única corrida, no entanto, estamos pegando um atalho mental e dizendo 'temos 95% de certeza de que estamos certos'.
Por fim, não se esqueça de qual é a configuração padrão em um teste de hipótese com base em um experimento. Se queremos saber se um hormônio de crescimento da planta faz com que as plantas cresçam mais rapidamente, talvez primeiro determinemos o tamanho médio de um tomate após 6 meses de crescimento. Então repetimos, mas com o hormônio, e obtemos o tamanho médio. Nossa hipótese nula é "o hormônio não funcionou" e testamos isso . Mas, se as plantas testadas forem, em média, maiores, com 99% de confiança, isso significa 'sempre haverá variação aleatória devido às plantas e com que precisão pesamos, mas a quantidade de aleatoriedade que explicaria isso ocorreria menos de um tempo em cem. "
fonte
A questão pode ser caracterizada como uma confusão de probabilidade anterior e posterior ou talvez como a insatisfação de não conhecer a distribuição conjunta de certas variáveis aleatórias.
Condicionamento
Não condicionar a evidência significa ignorar a evidência. No entanto, só podemos condicionar o que é expressável no modelo probabilístico. Em nosso exemplo, com as duas bolas da urna, não podemos condicionar o clima ou a forma como nos sentimos hoje. Caso tenhamos motivos para acreditar que essa é uma evidência relevante para o experimento, precisamos primeiro mudar nosso modelo para nos permitir expressar essa evidência como eventos formais.
Intervalo de confiança
Aprendendo mais, sabendo menos
fonte
Se eu digo que a probabilidade que os Knicks marcaram entre xbar - 2sd (x) e xbar + 2sd (x) é de cerca de 0,95 em algum jogo no passado, essa é uma afirmação razoável, dada uma suposição distributiva específica sobre a distribuição das pontuações de basquete . Se eu coletar dados sobre as pontuações dadas uma amostra de jogos e calcular esse intervalo, a probabilidade de que eles pontuaram nesse intervalo em um determinado dia no passado é claramente zero ou um, e você pode pesquisar no resultado do jogo no Google para descobrir. A única noção de manter uma probabilidade diferente de zero ou de uma probabilidade para o freqüentador vem de amostragens repetidas, e a realização da estimativa de intervalo de uma amostra específica é o ponto mágico em que aconteceu ou não forneceu a estimativa de intervalo dessa amostra. . Não é o ponto em que você digita a senha,
É isso que Dikran argumenta acima, e votei na resposta dele. O ponto em que amostras repetidas estão fora de consideração é o ponto no paradigma freqüentista em que a probabilidade não discreta se torna impossível , não quando você digita a senha como no seu exemplo acima ou quando pesquisa o resultado no meu exemplo do exemplo Jogo de Knicks, mas o ponto em que seu número de amostras = 1.
fonte
Modelagem
O passo (1) pode permitir alguma margem de manobra. Às vezes, a adequação da modelagem pode ser testada comparando a probabilidade de certos eventos com o que esperaríamos intuitivamente. Em particular, examinar certas probabilidades marginais ou condicionais pode ajudar a ter uma idéia de quão apropriada é a modelagem.
Estimador de intervalo de confiança
Preferências
Exemplo com um Prior Simples
fonte
Se pudéssemos dizer "a probabilidade de que o parâmetro true esteja neste intervalo de confiança", não consideraríamos o tamanho da amostra. Não importa o tamanho da amostra, contanto que a média seja a mesma, o intervalo de confiança será igualmente amplo. Mas quando dizemos "se eu repetir isso 100 vezes, esperaria que, em 95 dos casos, o parâmetro true esteja dentro do intervalo", estamos levando em consideração o tamanho do tamanho da amostra e a certeza de nossa estimativa. . Quanto maior o tamanho da amostra, menor a variação da estimativa média. Portanto, não varia muito e, quando repetimos o procedimento 100 vezes, não precisamos de um intervalo grande para garantir que, em 95 dos casos, o parâmetro true esteja no intervalo.
fonte