verificar um posterior é adequado

7

Há um problema de lição de casa em um livro que pede para verificar a propriedade de uma certa distribuição posterior, e estou tendo um pequeno problema com isso. A configuração é que você tem um modelo de regressão logística com um preditor e um uniforme inadequado antes de .R2

Especificamente, assumimos para que portanto a probabilidade é O problema é que suspeito que esse posterior seja realmente impróprio.i=1,,k

yiα,β,xiBinomial(n,invlogit(α+βxi)),
p(yα,β,x)=i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.

Para a situação específica em que , se usarmos a alteração das variáveis e , podemos ver que Na linha do asterisco, assumimos que 0 <y <n , mas, se não, então terminamos com a mesma coisa.k=1s1=invlogit(α+βx)s2=β

R2p(yα,β,x)dαdβ=R2[invlogit(α+βx)]y[1invlogit(α+βx)]nydαdβ=01s1y1(1s1)ny1ds1ds2(*)=B(y,ny)1ds2=.
0<y<n

Estou fazendo algo bobo aqui? Ou isso é um posterior impróprio?

Taylor
fonte
2
À primeira vista - sem considerar os detalhes -, é surpreendentemente estranho que (a) você integre valores positivos e negativos de β e (b) um fator de 1/β não apareça quando você altera variáveis. Talvez, então, um pouco de atenção à mecânica da integração resolva seu problema.
whuber
Não fiz nenhuma matemática para apoiar isso, mas tanto minha intuição quanto minha memória dizem que você está certo e que o posterior não precisa ser adequado. Por analogia, se você fixar , um plano anterior em é o anterior de Haldane, que nem sempre leva a posteriores adequados. β=0α
cara
2
Para , é possível ver diretamente da sua equação a probabilidade de que a densidade posterior seja constante ao longo das combinações de parâmetros para as quais assume valores constantes. Portanto, o posterior é realmente impróprio e tem a forma de uma crista para . Basicamente, qualquer linha de regressão ajustada à resposta observada em ajustará os dados. Mas para , eu ficaria surpreso se o posterior não for adequado, exceto em casos degenerados como ou em casos de separação linear. k=1p(α,β|y1,x1)α+βxik=1x1k>1x1=x2
Jarle Tufto 6/02/19
11
@ Xi'an é aí que as s veio1
Taylor
3
A explicação de @JarleTufto é completamente clara: a distribuição de depende apenas de , portanto, não pode trazer informações sobre e . Daí uma posterior imprópria. Também há um problema para mais observações se todos os forem todos iguais a ou todos iguais a . Yα+βxα βyi0n
Xian

Respostas:

3

Para , é possível ver diretamente da sua equação a probabilidade de que a densidade posterior seja constante ao longo de linhas paralelas nas quais assume valores constantes. Portanto, o posterior é realmente impróprio e tem a forma de uma crista para . Basicamente, qualquer linha de regressão adequada à resposta observada em sairá igualmente bem.𝑘=1𝑝(𝛼,𝛽|𝑦1,𝑥1)𝛼+𝛽𝑥𝑖𝑘=1𝑥1

Em seguida, suponha que temos observações. Considere a reparameterização dada por Como essa é uma transformação linear de com um determinante constante do anterior para também é uniforme sobre , desde que . Considere a reparameterização adicional, a transformação inversa do logit para . Claramente, também são a priori independentes, com densidades dadas por k=2

η1=α+βx1η2=α+βx2
α,βη1,η2R2x1x2
pi=11+eηi,
i=1,2p1,p2
π(pi)=π(ηi)|dηidpi|ddpilnpi1pi=1(1pi)pi
Estes são chamados de anteriores inadequados de Haldane , que podem ser interpretados como uma certa forma de limite da densidade de uma distribuição Beta, com ambos os parâmetros próximos de zero. Condicional nos dados , desde que , a densidade marginal posterior de cada seja distribuições Beta apropriadas com os parâmetros . Retrotransformando, as distribuições posteriores de e também devem ser adequadas. Isso ocorre, exceto em casos especiais, como umy1,y20<yi<npiyi,nyi(η1,η2)(α,β)yiassumindo um valor de 0 ou nesse caso, a função beta normalizante é infinita e a parte posterior de (e, portanto, a parte posterior de e ) é inadequada.nB(yi,nyi)piαβ

Para observações , a posterior também deve ser adequada, pois a densidade posterior não normalizada de é limitada pela posterior com base nas primeiras observações .k>2α,βk=2

Jarle Tufto
fonte
Não tenho certeza de que nossas duas respostas estejam em desacordo matematicamente. Estou dizendo que a integral é infinita quando cada , e você está dizendo que a integral é finita sempre que todo estiver estritamente entre os pontos finais. Além disso, isso pode ser algo que depende de quem você pergunta, mas fiquei com a impressão de que, se um posterior não for adequado para todos os pontos de dados possíveis, ele será definido como "impróprio". O prior de Haldane é um exemplo em que isso acontece. yi=nyi
Taylor
Mas suas desigualdades dizem que a integral do posterior não normalizado (para qualquer ) (o lado esquerdo da primeira desigualdade) é infinita, portanto há um desacordo. Não tenho certeza, mas o último passo que combina as duas integrais parece envolver não apenas o que você definiu como e mas também etc. etc. esse é o erro. yis1s2invlogit(α+βx(n))
Jarle Tufto 14/02/19
11
sim, você está certo. Os integrandos são diferentes nesses dois lugares, portanto você não pode combiná-los.
Taylor
Infelizmente, isso assume que é o caso mais comum. n>1
21419 Taylor
2

É impróprio, eu acredito. Eu só preciso provar que Denotar função Agora que é uma função monotonicamente crescente, quando , temos

αRβ>0p(yα,β,x)=+.
σ=invlogit
σβ>0
σ(α+βxi)>σ(αβmax|xi|)>0,
1σ(α+βxi)>1σ(α+βmax|xi|)>0.

Assim, a integral

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]yi[1σ(α+βmax|xi|)]niyi>αRβ>0[σ(αβmax|xi|)]maxni[1σ(α+βmax|xi|)]maxni>αRβ>0[σ(αβmax|xi|)]kmaxni[1σ(α+βmax|xi|)]kmaxni

São necessárias mais propriedades sobre : σ

(σ(x))N=1(1+ex)N>12N(max{1,ex})N=12N(max{1,eNx})>12Nσ(Nx)

Seja, , em seguida, ξ=αβmax|xi|η=α+βmax|xi|,N=kmaxni

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]N[1σ(α+βmax|xi|)]N<ξ<η<+[σ(ξ)]N[σ(η)]N>122Nξ+(+σ(Nξ)dξ) σ(Nη)dη=+

Silly Song
fonte
11
Eu fiz uma edição. Espero que esteja certo.
Silly Song
11
No segundo último passo, acho que os limites da integral dupla estão errados. Em vez disso, recebo Usando o Maple, acho que essa integral dupla é finita e é igual a . Então, tudo o que você pode dizer com base em sua derivação é que a constante de normalização da parte posterior de é maior que algo finito.
σ(Nη)ησ(Nξ)dξdη
π/(6N2)α,β
Jarle Tufto 01/03/19
1

Eu já aceitei uma resposta, mas queria ressaltar que o posterior não é adequado para todos os conjuntos de dados possíveis. O posterior é proporcional à probabilidade, que é Se , isso simplifica para

i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.
y1=y2==yk=n
i=1k[invlogit(α+βxi)]n,

e podemos ver que

i=1k[invlogit(α+βxi)]ndαdβ0i=1k[invlogit(α+βxi)]ndαdβ0[invlogit(α+βx(1))]nkdαdβ0[invlogit(r1)]nkdr1dr2=.

Taylor
fonte