Ao avaliar um estimador, os dois critérios usados provavelmente mais comuns são o risco máximo e o risco de Bayes. Minha pergunta se refere à última:
O risco de bayes sob o anterior é definido da seguinte forma:
Não entendi bem o que o anterior está fazendo e como devo interpretá-lo. Se eu tiver uma função de risco e plotá-la, intuitivamente eu usaria sua área como critério para julgar o quão "forte" o risco está sobre todos os valores possíveis de . Mas envolver o prior de alguma forma destrói essa intuição novamente, embora esteja próxima. Alguém pode me ajudar a interpretar o prior?
bayesian
decision-theory
Peter Series
fonte
fonte
Respostas:
[Aqui está um trecho do meu próprio livro, The Bayesian Choice (2007) , que argumenta a favor de uma abordagem teórica da decisão à análise bayesiana e, portanto, do uso do risco Bayes.]
Exceto pelas configurações mais triviais, geralmente é impossível minimizar uniformemente (em ) a função de perda quando é desconhecido. Para derivar um critério de comparação eficaz da função de perda, a abordagem frequentista propõe considerar, em vez disso, a perda média (ou risco freqüentista ) que é a regra de decisão, ou seja, a alocação de uma decisão para cada resultadod L(θ,d) θ
A função , de em , é geralmente chamada estimador (enquanto o valor é chamado estimativa de ). Quando não há risco de confusão, também denotamos o conjunto de estimadores por .δ X D δ(x) θ D
O paradigma frequentista baseia-se neste critério para comparar estimadores e, se possível, para selecionar o melhor estimador, com o raciocínio de que os estimadores são avaliados em seu desempenho de longo prazo para todos os valores possíveis do parâmetro . Observe, no entanto, que existem várias dificuldades associadas a essa abordagem.θ
Exemplo 2.4 - Considere e , duas observações de O parâmetro de interesse é (isto é, ) e é estimado pelos estimadores sob a perda geralmente chamado de perda de , que penaliza erros de estimativa, seja qual for a sua magnitude, em . Considerando o particular \ est sua função de risco éx1 x2
Pelo contrário, a abordagem bayesiana da teoria da decisão integra-se no espaço pois é desconhecido, em vez de integrar-se no espaço como é conhecido. Ele se baseia na perda esperada posterior que média do erro (isto é, a perda) de acordo com o distribuição posterior do parâmetro , condicionalmente ao valor observado} . Dado , o erro médio resultante da decisão é realmenteΘ θ X x
fonte
Citando a teoria clássica da decisão estatística de James O. Berger:
Sim, você pode avaliar para cada , mas assumiria implicitamente que cada valor possível de é igualmente provável. No cenário bayesiano, você escolhe que reflete as probabilidades de observar diferentes 's e inclui essas informações.R(θ,δ) θ θ π(θ) θ
fonte