Média de rebatidas bayesianas antes

23

Eu queria fazer uma pergunta inspirada em uma excelente resposta à pergunta sobre a intuição para a distribuição beta. Eu queria entender melhor a derivação da distribuição anterior da média de rebatidas. Parece que David está fazendo o backup dos parâmetros da média e do intervalo.

Supondo que a média seja 0.27 e o desvio padrão seja 0.18 , você pode retirar α e β resolvendo estas duas equações:

αα+β=0.27αβ(α+β)2(α+β+1)=0.182
Dimitriy V. Masterov
fonte
3
Honestamente, eu apenas continuei representando graficamente os valores em R até que parecesse correto.
David Robinson
1
onde você obtém o desvio padrão para 0,18?
appleLover
Como você chegou a esse desvio padrão? Você sabia disso com antecedência?
Maria Lavrovskaya 12/06

Respostas:

21

Notar que:

αβ(α+β)2=(αα+β)(1αα+β)

Isso significa que a variação pode, portanto, ser expressa em termos da média como

σ2=μ(1μ)α+β+1

Se você deseja uma média de .27 e um desvio padrão de .18 (variação .0324 ), basta calcular:

α+β=μ(1μ)σ21=.27(1.27).03241=5.083333

Agora que você sabe o total, α e β são fáceis:

α=μ(α+β)=.275.083333=1.372499β=(1μ)(α+β)=(1.27)5.083333=3.710831

Você pode verificar esta resposta em R:

> mean(rbeta(10000000, 1.372499, 3.710831))
[1] 0.2700334
> var(rbeta(10000000, 1.372499, 3.710831))
[1] 0.03241907
David Robinson
fonte
David, você segue alguma pesquisa de beisebol? Existem várias técnicas concorrentes disponíveis para encontrar o e β adequado , então eu queria saber se você tem alguma opinião sobre o assunto se está fazendo algo além de apenas tentar encontrar um gráfico que pareça razoável. αβ
Michael McGowan
Eu particularmente não sigo a sabre- métrica - na outra resposta, isso acabou por fornecer um exemplo muito conveniente de estimar p de um binômio com um anterior. Eu nem sei se é assim que é feito na sabre- métrica e, se for, sei que há muitos componentes que deixei de fora (jogadores com antecedentes diferentes, ajustes de estádio, ponderando hits recentes sobre os antigos ...)
David Robinson
3
Estou impressionado que seu olhar foi tão preciso.
Dimitriy V. Masterov
Oi David, como você obtém esses valores de e β = 3,71 para seus valores oculares no post vinculado de 81 e 219, respectivamente? α=1.37β=3.71
2828 Alex
1
@Alex A variação solicitada e o desvio padrão vêm da pergunta acima, que solicitou um SD de 0,18, não a publicação da distribuição beta. Se eu estivesse a calcular em vez de eyeballing eu poderia ter imaginado um cartão SD de algo como 0,03, o que teria dado valores de 59 e 160.
David Robinson
3

Queria adicionar isso como um comentário sobre a excelente resposta, mas demorou muito e ficará melhor com a formatação da resposta.

Algo a ter em mente é que nem todos são possíveis. Está claro μ [ 0 , 1 ] , mas não tão claras são as limitações para σ 2 .(μ,σ2)μ[0,1]σ2

Usando o mesmo raciocínio que Davi, podemos expressar

σ2(α,μ)=μ2(1μ)α+μ

Isso está diminuindo em relação a , então o maior σ 2 pode ser para um dado μ é:ασ2μ

limα0σ2(α,μ)=μ(1μ)

Este é apenas um supremo, uma vez que o conjunto de válido está aberto (ou seja, para Beta, devemos ter α > 0 ); esse limite é ele próprio maximizado em μ = 1αα>0 .μ=12

Observe o relacionamento com um VR Bernoulli correspondente. A distribuição Beta com média , uma vez que é forçada a assumir todos os valores entre 0 e 1, deve ser menos dispersa (ou seja, ter menor variação) do que o VR de Bernoulli com a mesma média (que tem toda a sua massa no final de o intervalo). De fato, enviando α para 0 e corrigindo β = 1 - μμαequivale a colocar cada vez mais a massa do PDF perto de 0 e 1, ou seja, aproximando-se de uma distribuição de Bernoulli, razão pela qual o supremo da variação é exatamente a variação correspondente de Bernoulli.β=1μμα

Em conjunto, eis o conjunto de médias e variações válidas para o Beta:

enter image description here

(Na verdade, isso é observado na página da Wikipedia para Beta )

MichaelChirico
fonte