Por que os pontos de corte usados ​​para os fatores e valores p de Bayes são tão diferentes?

11

Estou tentando entender o fator Bayes (BF). Eu acredito que eles são como uma razão de verossimilhança de 2 hipóteses. Portanto, se BF for 5, isso significa que H1 é 5 vezes mais provável que H0. E o valor de 3-10 indica evidência moderada, enquanto> 10 indica evidência forte.

No entanto, para o valor P, tradicionalmente 0,05 é considerado como ponto de corte. Nesse valor de P, a razão de probabilidade H1 / H0 deve ser de cerca de 95/5 ou 19.

Então, por que um valor de corte> 3 é obtido para BF, enquanto um valor de corte> 19 é calculado para valores de P? Esses valores também não estão próximos.

rnso
fonte
2
Fico desconfortável ao dizer "se BF for , significa que é vezes mais provável que ". O fator de Bayes, pode ser uma razão de probabilidade marginal, mas ele não é um rácio de rácio de probabilidade ou probabilidades, e precisa de ser combinado com um antes de ser útilH 1 5 H 05H15H0
Henry
Se não temos nenhuma informação prévia específica, o que podemos dizer sobre o significado de AM?
rnso
Certamente, alguém tem "algumas" informações prévias, mesmo dizendo que não há nenhuma informação prévia específica. Ou seja, nesse caso, é razoável atribuir probabilidades iguais a cada hipótese de acordo com o princípio da indiferença. Esse é um exemplo simples de um chamado prioritário não informativo (reconhecidamente um nome impróprio).
dnqxt
Nesse caso, BF de 5 indicará uma hipótese com uma probabilidade 5x mais provável?
rnso
Sim, mas esse problema é muito mais complicado do que parece e entra na área de seleção de modelos nas estatísticas. Você foi avisado :))
dnqxt

Respostas:

10

Algumas coisas:

O BF fornece evidências a favor de uma hipótese, enquanto um teste de hipótese freqüente fornece evidências contra uma hipótese (nula). Então é como "maçãs para laranjas".

Esses dois procedimentos, apesar da diferença de interpretações, podem levar a decisões diferentes. Por exemplo, um AM pode rejeitar enquanto um teste de hipótese freqüentista não, ou vice-versa. Esse problema costuma ser chamado de paradoxo de Jeffreys-Lindley . Houve muitas postagens neste site sobre isso; ver, por exemplo aqui , e aqui .

"Nesse valor de P, a probabilidade H1 / H0 deve ser 95/5 ou 19." Não, isso não é verdade porque, aproximadamente . A computação de um valor de p e a realização de um teste freqüentista, no mínimo, não exigem que você tenha alguma idéia sobre . Além disso, os valores de p são frequentemente integrais / somas de densidades / pmfs, enquanto um BF não se integra no espaço de amostra de dados.p(yH1)1p(yH0)p(yH1)

Taylor
fonte
2
Taylor está dizendo que o limiar de evidência contra uma hipótese ( ) não pode ser diretamente comparado ao limiar de evidência de outra hipótese ( ), também não aproximadamente. Quando você para de acreditar em um efeito nulo, não precisa se relacionar com quando você começa a acreditar em uma alternativa. Este é exatamente por isso que o -valor não deve ser interpretado comoH 1H0H11 - ( crença em H 1 )p1(belief in H1)
Frans Rodenburg
1
Talvez isso possa ser esclarecedor: en.wikipedia.org/wiki/Misunderstandings_of_p-values O valor- freqüentista não é uma medida de evidência para nada. p
Frans Rodenburg
2
Desculpe, último comentário: o motivo pelo qual você não pode vê-lo como evidência a favor de é que é a chance de observar esse tamanho de efeito grande se for verdadeiro. Se é realmente verdadeiro, o valor- deve ser uniformemente aleatório, portanto seu valor não tem significado na probabilidade de . Essa sutileza na interpretação é uma das razões pelas quais os valores veem tanto mau uso. H 0H1 H0 p H 1 pH0pH1p
Frans Rodenburg
1
@ benzxyzzy: a distribuição de um valor- é uniforme apenas sob a hipótese nula, não sob a alternativa em que é fortemente inclinada para zero. p
Xi'an
1
@benxyzzy Para adicionar a outros: O objetivo de usar um valor- é que, sob a hipótese nula, ele é uniformemente aleatório; portanto, se você obtiver um valor- muito pequeno , isso sugere que talvez não seja uniformemente aleatório; talvez o valor nulo hipótese não era verdadeira. ppp
Jik
8

O fator BayesB01 pode ser transformado em probabilidade com pesos iguais como mas isso não os torna comparável com um valor- desde

P01=11+1B01
pp

  1. P01 é uma probabilidade no espaço de parâmetro, não no espaço de amostragem
  2. seu valor e alcance dependem da escolha da medida anterior; portanto, são relativos e não absolutos (e a menção de Taylor ao paradoxo de Lindley-Jeffreys é apropriada nesta fase )
  3. tanto e conter uma penalidade para a complexidade (navalha de Occam), integrando sobre o espaço de parâmetrosB01P01

Se você quiser considerar uma Bayesian equivalente à -valor, a posterior preditivo -valor (Meng, 1994) deve ser investigada onde denota a observação e é distribuído a partir do preditivo posterior mas isso não implica que os mesmos critérios "padrão" para rejeição e significância se apliquem a esse objeto.pp Q 01 = P ( B 01 ( X ) B 01 ( x obs ) ) x obs p

Q01=P(B01(X)B01(xobs))
xobsX
XΘf(x|θ)π(θ|xobs)dθ

Xi'an
fonte
Usando sua fórmula, P para BF de 3 e 10 resulta em 0,75 e 0,91, respectivamente. Por que devemos aceitá-las como evidência moderada, já que para o valor de P mantemos o ponto de corte de 0,95?
rnso
Por que é relevante nessa estrutura? ou mesmo? Decidir quando grande é grande o suficiente depende da função do seu utilitário. 0.95
Xian
A fórmula parece mais simples comoP = B/(B+1)
rnso
2

Alguma de sua confusão pode resultar de pegar o número 95/5 diretamente do fato de o valor de p ser 0,05 - é isso que você está fazendo? Eu não acredito que isso esteja correto. O valor p para um teste t, por exemplo, reflete a chance de obter a diferença observada entre médias ou uma diferença mais extrema se a hipótese nula for de fato verdadeira. Se você obtiver um valor p de 0,02, você diz 'ah, há apenas 2% de chance de obter uma diferença como essa ou uma diferença maior, se o nulo for verdadeiro. Isso parece muito improvável, então proponho que o nulo não seja verdadeiro! '. Esses números não são exatamente a mesma coisa que entra no fator Bayes, que é a razão das probabilidades posteriores dadas a cada hipótese concorrente. Essas probabilidades posteriores não são calculadas da mesma maneira que o valor p,

Como uma observação lateral, eu sugeriria uma forte proteção contra pensar em diferentes valores de AM como significando coisas particulares. Essas atribuições são completamente arbitrárias, assim como o nível de significância 0,05. Problemas como o p-hacking ocorrerão com a mesma facilidade com os fatores Bayes se as pessoas começarem a acreditar que apenas números específicos justificam consideração. Tente entendê-los pelo que eles são, que são algo como probabilidades relativas, e use seu próprio senso para determinar se você encontra um número de namorado convincente ou não.

Jamie
fonte