Avaliando a qualidade das distribuições previstas

7

Eu tenho um conjunto de pontos de dados onde são as variáveis ​​independentes e acredito que cada pode ser modelado como sendo extraído de uma distribuição exponencial com os parâmetros .XEu,yEuxyEuλEu

Se eu usar o para prever , como posso avaliar a qualidade das minhas distribuições previstas em relação às observações ?XEuλEuyEu

Edit: Esta é essencialmente a mesma pergunta que Como avaliar a qualidade do estimador de probabilidade para experimentos de Bernoulli? mas em um contexto contínuo em vez de um contexto binomial. Não é óbvio para mim o que usar neste caso, em vez de entropia cruzada.

Thomas Johnson
fonte

Respostas:

7

A abordagem padrão para isso é usar a probabilidade logarítmica da distribuição exponencial. É exatamente assim que a entropia cruzada é derivada, é a probabilidade logarítmica da distribuição de Bernoulli.

No caso de uma distribuição exponencial, o pdf é:

f(y;λ)=λe-λy

Portanto, a probabilidade do log é:

eueu(λEu;yEu)=registro(f(yEu;λEu))=registro(λEu)-λEuyEu

Portanto, se são seus valores verdadeiros e são suas previsões, um modelo exponencial minimizaria:yEuλEu

eueu({λEu};{yEu})=Euregistro(λEu)-λEuyEu

Ajustar modelos maximizando a probabilidade logarítmica dessa maneira leva à teoria dos modelos lineares generalizados; o modelo exponencial é um caso especial.

Matthew Drury
fonte
3

A maneira padrão de avaliar distribuições preditivas é através de regras de pontuação . A probabilidade de log que Matthew Drury recomenda é um exemplo: é a regra de pontuação logarítmica . Há também outros. Merkle & Steyvers (2013, Decision Analysis ) discutem como diferentes regras de pontuação se unem e como escolher uma.

Mais informações podem ser encontradas na tag wiki , e temos várias perguntas relacionadas ao tag.

Stephan Kolassa
fonte