As respostas (definições) definidas na Wikipedia são indiscutivelmente um pouco enigmáticas para aqueles que não estão familiarizados com matemática / estatística mais alta.
Em termos matemáticos, um modelo estatístico é normalmente considerado como um par ( ), em que é o conjunto de observações possíveis, isto é, o espaço de amostragem, e é um conjunto de distribuição de probabilidades em .
Em probabilidade e estatística, uma distribuição de probabilidade atribui uma probabilidade a cada subconjunto mensurável dos possíveis resultados de um experimento aleatório, pesquisa ou procedimento de inferência estatística. São encontrados exemplos cujo espaço de amostra não é numérico, em que a distribuição seria uma distribuição categórica.
Eu sou um estudante do ensino médio muito interessado neste campo como hobby e atualmente estou lutando com as diferenças entre o que é um statistical model
e umprobability distribution
Meu entendimento atual e muito rudimentar é este:
modelos estatísticos são tentativas matemáticas para aproximar distribuições medidas
distribuições de probabilidade são descrições medidas de experimentos que atribuem probabilidades a cada resultado possível de um evento aleatório
confusão é ainda agravada pela tendência na literatura de ver as palavras "distribuição" e "modelo" usadas de forma intercambiável - ou pelo menos em situações muito semelhantes (por exemplo, distribuição binomial versus modelo binomial)
Alguém pode verificar / corrigir minhas definições e talvez oferecer uma abordagem mais formalizada (embora ainda em termos de inglês simples) para esses conceitos?
fonte
Respostas:
A distribuição de probabilidade é uma função matemática que descreve uma variável aleatória. Um pouco mais precisamente, é uma função que atribui probabilidades a números e sua saída precisa concordar com axiomas de probabilidade .
O modelo estatístico é uma descrição abstrata idealizada de algum fenômeno em termos matemáticos usando distribuições de probabilidade. Citando Wasserman (2013):
Em muitos casos, usamos distribuições como modelos (você pode verificar este exemplo ). Você pode usar a distribuição binomial como um modelo de contagem de cabeças em séries de lançamentos de moedas. Nesse caso, assumimos que essa distribuição descreve, de maneira simplificada, os resultados reais. Isso não significa que essa seja a única maneira de descrever esse fenômeno, nem que a distribuição binomial seja algo que possa ser usado apenas para esse fim. O modelo pode usar uma ou mais distribuições, enquanto os modelos bayesianos também especificam distribuições anteriores.
Mais formalmente, isso é discutido por McCullaugh (2002):
Portanto, os modelos estatísticos usam distribuições de probabilidade para descrever dados em seus termos. Modelos paramétricos também são descritos em termos de conjunto finito de parâmetros.
Isso não significa que todos os métodos estatísticos precisam de distribuições de probabilidade. Por exemplo, a regressão linear é frequentemente descrita em termos de suposição de normalidade , mas, na verdade, é bastante robusta para desviar-se da normalidade e precisamos supor sobre a normalidade dos erros para intervalos de confiança e teste de hipóteses. Portanto, para que a regressão funcione, não precisamos dessa suposição, mas para ter um modelo estatístico totalmente especificado, precisamos descrevê-lo em termos de variáveis aleatórias, então precisamos de distribuições de probabilidade. Escrevo sobre isso porque muitas vezes você pode ouvir as pessoas dizendo que usaram o modelo de regressão para seus dados - na maioria dos casos, eles querem dizer que descrevem dados em termos de relação linear entre valores-alvo e preditores usando alguns parâmetros, do que insistindo em condicionais normalidade.
McCullagh, P. (2002). O que é um modelo estatístico? Anais de estatística, 1225-1267.
Wasserman, L. (2013). Todas as estatísticas: um curso conciso de inferência estatística. Springer.
fonte
In much of the following, it is important to distinguish between the model as a function and the associated set of distributions
) Você está apenas comentando a ambiguidade inerente entre os dois significados que compartilham o mesmo termomodel
ou estou perdendo alguma coisa?Pense em como um conjunto de tickets . Você pode escrever coisas em um ticket. Normalmente, um ticket começa com o nome de uma pessoa ou objeto do mundo real que "representa" ou "modelos". Há muito espaço em branco em cada ticket para escrever outras coisas.S
Você pode fazer quantas cópias de cada ticket quiser. Um modelo de probabilidade para essa população ou processo do mundo real consiste em fazer uma ou mais cópias de cada ticket, misturá-las e colocá-las em uma caixa. Se você - o analista - puder estabelecer que o processo de retirar um ticket aleatoriamente desta caixa simula todo o comportamento importante do que você está estudando, então você pode aprender muito sobre o mundo pensando nessa caixa. Como alguns ingressos podem ser mais numerosos do que outros, eles podem ter chances diferentes de serem sorteados. A teoria da probabilidade estuda essas chances.P
Quando os números são escritos nos tickets (de maneira consistente), eles dão origem a distribuições (de probabilidade). Uma distribuição de probabilidade apenas descreve a proporção de tickets em uma caixa cujos números se encontram dentro de um determinado intervalo.
Como geralmente não sabemos exatamente como o mundo se comporta, precisamos imaginar caixas diferentes nas quais os tickets aparecem com diferentes frequências relativas. O conjunto destas caixas é . Vemos o mundo como sendo adequadamente descrito pelo comportamento de uma das caixas de P . É seu objetivo fazer palpites razoáveis sobre qual caixa é, com base no que você vê nos bilhetes que você retirou dela.P P
Como exemplo (que é prático e realista, não um brinquedo de livro didático), suponha que você esteja estudando a taxa de uma reação química, pois ela varia com a temperatura. Suponha que a teoria da química preveja que dentro da faixa de temperaturas entre 0 e 100 graus, a taxa é proporcional à temperatura.y 0 100
Você planeja estudar essa reação a e 100 graus, fazendo várias observações a cada temperatura. Portanto, você cria um número muito, muito grande de caixas. Você vai preencher cada caixa com ingressos. Há uma constante de taxa escrita em cada um. Todos os ingressos em qualquer caixa têm a mesma constante de taxa gravada neles. Caixas diferentes usam constantes de taxa diferentes.0 100
Usando a constante de taxa gravada em qualquer ticket, você também anota a taxa em e a taxa em 100 graus: chame esses y 0 e y 100 . Mas isso ainda não é suficiente para um bom modelo. Os químicos também sabem que nenhuma substância é pura, nenhuma quantidade é medida exatamente e outras formas de variabilidade observacional ocorrem. Para modelar esses "erros", você faz muitas cópias de seus tickets. Em cada cópia, você altera os valores de y 0 e y 100 . Na maioria deles, você os altera apenas um pouco. Em muito poucos, você pode alterá-los bastante. Você anota quantos valores alterados planeja observar a cada temperatura. Estes0 100 y0 y100 y0 y100 As observações representam possíveis resultados observáveis do seu experimento. Na caixa, vá para cada conjunto desses tickets: é um modelo de probabilidade para o que você pode observar para uma determinada taxa constante.
O que você não observar é modelado pelo desenho de um bilhete de que a caixa e só lendo as observações escritas lá. Você não consegue ver os valores subjacentes (verdadeiros) de ou y 100 . Você não consegue ler a constante da taxa (verdadeira). Isso não é permitido pelo seu experimento.y0 y100
Todo modelo estatístico deve fazer algumas suposições sobre os tickets nessas caixas (hipotéticas). Por exemplo, esperamos que, quando você modificou os valores de e y 100 , o fez sem aumentar nem diminuir consistentemente nenhum dos dois (como um todo, dentro da caixa): isso seria uma forma de viés sistemático.y0 y100
Como as observações escritas em cada ticket são números, elas dão origem a distribuições de probabilidade. As suposições feitas sobre as caixas são tipicamente formuladas em termos de propriedades dessas distribuições, como se elas devem ter uma média de zero, ser simétricas, ter uma forma de "curva em sino", não serem correlacionadas ou o que seja.
Isso é realmente tudo o que existe. Da mesma maneira que uma escala primitiva de doze tons deu origem a toda a música clássica ocidental, uma coleção de caixas contendo ingressos é um conceito simples que pode ser usado de maneiras extremamente ricas e complexas. Ele pode modelar praticamente qualquer coisa, variando de uma moeda a uma biblioteca de vídeos, bancos de dados de interações com sites, conjuntos de mecânica quântica e qualquer outra coisa que possa ser observada e gravada.
fonte
Modelos estatísticos paramétricos típicos descrevem como o (s) parâmetro (s) de uma distribuição depende de certas coisas, como fatores (uma variável que possui valores discretos) e covariáveis (variáveis contínuas). Por exemplo, se em uma distribuição normal você assume que a média pode ser descrita por algum número fixo (uma "interceptação") e algum número (um "coeficiente de regressão") multiplicado pelo valor de uma covariável, você obtém um modelo de regressão linear com um termo de erro normalmente distribuído. Para uma distribuição binomial, um modelo comumente usado ("regressão logística"π π/ (1-π) interceptar + β1 1covariável1 1+ …
fonte
Uma distribuição de probabilidade fornece todas as informações sobre como uma quantidade aleatória flutua. Na prática, geralmente não temos a distribuição de probabilidade completa de nossa quantidade de interesse. Podemos saber ou assumir algo sobre isso sem saber ou assumir que sabemos tudo sobre ele. Por exemplo, podemos assumir que alguma quantidade é normalmente distribuída, mas não sabemos nada sobre a média e a variação. Em seguida, temos uma coleção de candidatos para a distribuição; no nosso exemplo, todas as distribuições normais são possíveis. Essa coleção de distribuições forma um modelo estatístico. Nós o usamos reunindo dados e depois restringindo nossa classe de candidatos, para que todos os demais candidatos sejam consistentes com os dados em algum sentido apropriado.
fonte
Um modelo é especificado por um PDF, mas não é um PDF.
A distribuição de probabilidades (PDF) é uma função que atribui probabilidades a números e sua saída precisa concordar com axiomas de probabilidade, como Tim explicou .
Um modelo é totalmente definido por uma distribuição de probabilidade, mas é mais do que isso. No exemplo do lançamento de moedas, nosso modelo pode ser "a moeda é justa" + "cada lançamento é independente". Este modelo é especificado por um PDF que é um binomial com p = 0,5.
Uma distinção entre o modelo e o PDF é que um modelo pode ser interpretado como uma hipótese estatística. Por exemplo, no lançamento de moedas, podemos considerar o modelo em que a moeda é justa (p = 0,5), e que cada lançamento é independente (binomial), e dizer que esta é a nossa hipótese, que queremos testar contra uma hipótese concorrente. .
fonte
A model is specified by a PDF
Discordo. Um modelo também pode ser especificado por vários PDFs. E um modelo pode ser especificado por nenhum PDF: pense em algo como um SVM ou uma árvore de regressão.Você faz uma pergunta muito importante, Alan, e recebeu algumas boas respostas acima. Gostaria de oferecer uma resposta mais simples e também indicar uma dimensão adicional à distinção que as respostas acima não abordaram. Por simplicidade, tudo o que direi aqui se refere a modelos estatísticos paramétricos .
Portanto, minha breve resposta 1 à sua pergunta é: um modelo estatístico é uma família de distribuições.
O outro ponto que eu queria enfatizar diz respeito ao qualificador, estatístico . Como Judea Pearl aponta em sua "regra de ouro da análise causal" [1, p350],
Assim, minha resposta 2 à sua pergunta é: os modelos geralmente incorporam idéias causais que não podem ser expressas em termos puramente distributivos.
[1]: Pérola, Judéia. Causalidade: Modelos, Raciocínio e Inferência. 2ª edição. Cambridge, Reino Unido; Nova York: Cambridge University Press, 2009. Link para § 11.3.5, incluindo citado p. 351
fonte
causal
? Existe algum significado mais sutil para ele ou simplesmente se refere à noçãocausality
e relações vinculadas entrecauses
eeffects
? Obrigado pela sua resposta, btw.