Um Modelo de Probabilidade consiste no trigêmeo , onde Ω é o espaço da amostra, F é uma σ- álgebra (eventos) e P é uma medida de probabilidade em F(Ω,F,P)ΩFσPF .
Explicação intuitiva . Um modelo de probabilidade pode ser interpretado como um conhecido variável aleatória . Por exemplo, seja X uma variável aleatória distribuída normalmente com média 0 e variação 1 . Nesse caso, a medida de probabilidade P está associada à Função de Distribuição Cumulativa (CDF) F atravésXX01PF
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
Generalizações . A definição do Modelo de Probabilidade depende da definição matemática de probabilidade; veja, por exemplo, Probabilidade Livre e Probabilidade quântica .
Um modelo estatístico é um conjunto S de modelos de probabilidade, ou seja, um conjunto de medidas / distribuições de probabilidade no espaço amostral .Ω
Esse conjunto de distribuições de probabilidade é geralmente selecionado para modelar um determinado fenômeno do qual temos dados.
Explicação intuitiva . Em um modelo estatístico, os parâmetros e a distribuição que descrevem um determinado fenômeno são desconhecidos. Um exemplo disto é a familia de distribuição normal com média e variância σ 2 ∈ R + , isto é, ambos os parâmetros não são conhecidos e se habitualmente pretende utilizar o conjunto de dados para estimar os parâmetros (por exemplo, seleccionando um elemento de S ) Esse conjunto de distribuições pode ser escolhido em qualquer Ω e F , mas, se não me engano, em um exemplo real, apenas aqueles definidos no mesmo par ( Ω , F )μ∈Rσ2∈R+SΩF(Ω,F) são razoáveis para considerar.
Generalizações . Este artigo fornece uma definição muito formal de Modelo Estatístico, mas o autor menciona que "o modelo bayesiano requer um componente adicional na forma de uma distribuição anterior ... Embora as formulações bayesianas não sejam o foco principal deste artigo". Portanto, a definição de modelo estatístico depende do tipo de modelo que usamos: paramétrico ou não paramétrico. Também no cenário paramétrico, a definição depende de como os parâmetros são tratados (por exemplo, Clássico vs. Bayesiano).
A diferença é: em um modelo de probabilidade, você sabe exatamente a medida de probabilidade, por exemplo, , onde μ 0 , σ 2 0 são parâmetros conhecidos., Enquanto em um modelo estatístico, você considera conjuntos de distribuições , por exemplo Normal ( μ , σ 2 ) , em que μ , σ 2 são parâmetros desconhecidos.Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2
Nenhum deles requer um conjunto de dados, mas eu diria que um modelo estatístico geralmente é selecionado para modelar um.