Diferenças entre um modelo estatístico e um modelo de probabilidade?

29

A probabilidade aplicada é um ramo importante da probabilidade, incluindo a probabilidade computacional. Como a estatística está usando a teoria das probabilidades para construir modelos para lidar com dados, como eu entendo, estou me perguntando qual é a diferença essencial entre o modelo estatístico e o modelo de probabilidade? O modelo de probabilidade não precisa de dados reais? Obrigado.

Honglang Wang
fonte

Respostas:

29

Um Modelo de Probabilidade consiste no trigêmeo , onde Ω é o espaço da amostra, F é uma σ- álgebra (eventos) e P é uma medida de probabilidade em F(Ω,F,P)ΩFσPF .

Explicação intuitiva . Um modelo de probabilidade pode ser interpretado como um conhecido variável aleatória . Por exemplo, seja X uma variável aleatória distribuída normalmente com média 0 e variação 1 . Nesse caso, a medida de probabilidade P está associada à Função de Distribuição Cumulativa (CDF) F atravésXX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

Generalizações . A definição do Modelo de Probabilidade depende da definição matemática de probabilidade; veja, por exemplo, Probabilidade Livre e Probabilidade quântica .

Um modelo estatístico é um conjunto S de modelos de probabilidade, ou seja, um conjunto de medidas / distribuições de probabilidade no espaço amostral .Ω

Esse conjunto de distribuições de probabilidade é geralmente selecionado para modelar um determinado fenômeno do qual temos dados.

Explicação intuitiva . Em um modelo estatístico, os parâmetros e a distribuição que descrevem um determinado fenômeno são desconhecidos. Um exemplo disto é a familia de distribuição normal com média e variância σ 2R + , isto é, ambos os parâmetros não são conhecidos e se habitualmente pretende utilizar o conjunto de dados para estimar os parâmetros (por exemplo, seleccionando um elemento de S ) Esse conjunto de distribuições pode ser escolhido em qualquer Ω e F , mas, se não me engano, em um exemplo real, apenas aqueles definidos no mesmo par ( Ω , F )μRσ2R+SΩF(Ω,F) são razoáveis ​​para considerar.

Generalizações . Este artigo fornece uma definição muito formal de Modelo Estatístico, mas o autor menciona que "o modelo bayesiano requer um componente adicional na forma de uma distribuição anterior ... Embora as formulações bayesianas não sejam o foco principal deste artigo". Portanto, a definição de modelo estatístico depende do tipo de modelo que usamos: paramétrico ou não paramétrico. Também no cenário paramétrico, a definição depende de como os parâmetros são tratados (por exemplo, Clássico vs. Bayesiano).

A diferença é: em um modelo de probabilidade, você sabe exatamente a medida de probabilidade, por exemplo, , onde μ 0 , σ 2 0 são parâmetros conhecidos., Enquanto em um modelo estatístico, você considera conjuntos de distribuições , por exemplo Normal ( μ , σ 2 ) , em que μ , σ 2 são parâmetros desconhecidos.Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

Nenhum deles requer um conjunto de dados, mas eu diria que um modelo estatístico geralmente é selecionado para modelar um.

Xi'an
fonte
2
@ HonglangWang Isso está correto até certo ponto. A principal diferença é que um modelo de probabilidade é apenas uma distribuição (conhecida), enquanto um modelo estatístico é um conjunto de modelos de probabilidade; os dados são usados ​​para selecionar um modelo desse conjunto ou um subconjunto menor de modelos que melhor (em certo sentido) descrevam o fenômeno (à luz dos dados).
2
Ω×Θ
1
P is indeed defined through the CDF. Now, the interpretation of Ω is the difficult one because, formally, P(Xx) means P(ωΩ:X(ω)x), then Ω are not observable values. F is a σalgebra which is the pre-image of the Borel σalgebra under X, again this are not observable. I am not sure how to explain this in an intuitive level.
2
@gung Ω depends on the application; it is not determined by theory. For instance, Ω could be a set of Brownian motions describing the price of a financial derivative and X could be the value attained at a fixed time t. In another application Ω could be a set of people and X could be the lengths of their forearms. Generally, Ω is a mathematical model of the physical objects of study and X is a numerical property of those objects. F is the set of possible events: those situations to which we want to ascribe probabilities.
whuber
2
@gung F is a sigma algebra: it's a collection of subsets (the "events"). In the financial application, it's a set of price histories; in the forearm measurements application, the events would be sets of people. We can talk about this more if you want in a chat room.
whuber