A teoria das probabilidades é o estudo de funções não negativas que se integram / somam a uma?

26

Essa é provavelmente uma pergunta boba, mas a teoria da probabilidade é o estudo de funções que se integram / somam a uma?

EDITAR. Eu esqueci a não-negatividade. Então, a teoria das probabilidades é o estudo de funções não negativas que se integram / somam a uma?

dontloo
fonte
Sim, as probabilidades sempre somam uma. As probabilidades, por outro lado, não têm essa restrição.
Mike Hunter
2
A única resposta razoável para a pergunta, como declarada, é não, principalmente porque existem muitas funções que se integram a 1, mas para as quais não podem representar probabilidades para alguns e . Por exemplo, considere uma função que seja 1,5 entre 0 e 1 e -0,5 entre 1 e 2 e 0 em qualquer outro lugar. (mas também é indiscutivelmente "não" por outros motivos)fabf(u)duab
Glen_b -Reinstate Monica 14/03
2
Relacionados: stats.stackexchange.com/questions/214485/...
Ilmari Karonen
11
Existem trabalhos sérios sobre probabilidade negativa, por exemplo, Maurice S. Bartlett. doi.org/10.1017/S0305004100022398
Nick Cox
2
@dontloo, o que eu estava buscando agora está muito bem coberto pela citação do Tao na resposta de Chaconne.
Glen_b -Reintegra Monica 15/03

Respostas:

31

Em um nível puramente formal, poder-se-ia chamar a teoria das probabilidades de estudar os espaços de medida com a medida total um, mas isso seria como chamar a teoria dos números do estudo de cadeias de dígitos que terminam

- de Tópicos de Terry Tao na teoria da matriz aleatória .

Eu acho que isso é realmente fundamental. Se tivermos um espaço de probabilidade e uma variável aleatória com medida , o motivo uma densidade integra-se a uma é porque . E isso é mais fundamental do que pdfs vs pmfs.X : Ω R P X : = P X - um f = d P X(Ω,F,P)X:ΩRPX:=PX1 P(Ω)=1f=dPXdμP(Ω)=1

Aqui está a prova:

Rfdμ=RdPX=PX(R)=P({ωΩ:X(ω)R})=P(Ω)=1.

Isso é quase uma reformulação da resposta do AdamO (+1) porque todos os CDFs são codificados, e há uma relação individual entre o conjunto de CDFs em e o conjunto de todas as medidas de probabilidade em , mas como o CDF de um RV é definido em termos de sua distribuição, vejo os espaços de probabilidade como o lugar para "começar" com esse tipo de empreendimento. ( R , B )R(R,B)


Estou atualizando para elaborar a correspondência entre CDFs e medidas de probabilidade e como ambas são respostas razoáveis ​​para esta pergunta.

Começamos começando com duas medidas de probabilidade e analisando os CDFs correspondentes. Concluímos começando com um CDF e analisando a medida induzida por ele.

Seja e medidas de probabilidade em e e sejam seus respectivos CDFs (ou seja, e da mesma forma para ). e tanto representaria medidas pushforward de variáveis aleatórias (ou seja, distribuições), mas ele realmente não importa de onde eles vieram para isso.R ( R , B ) F Q F R F Q ( a ) = Q ( ( - , a ] ) R Q RQR(R,B)FQFRFQ(a)=Q((,a])RQR

A idéia principal é a seguinte: se e concordam com uma coleção de conjuntos suficientemente rica, eles concordam com a álgebra gerada por esses conjuntos. Intuitivamente, se tivermos uma coleção bem comportada de eventos que, através de um número contável de complementos, cruzamentos e uniões, formam todos , concordar com todos esses conjuntos não deixa espaço para discordar de nenhum Borel conjunto.R σ BQRσB

Vamos formalizar isso. Seja e deixe , isto é é o subconjunto de em que e concordam (e são definidos). Note-se que estamos permitindo-lhes a concordar em conjuntos de não-Borel desde como definido ISN 't necessariamente um subconjunto de . Nosso objetivo é mostrar que .L = { A R : Q ( A ) = R ( A ) } L P ( R ) Q R L B BLS={(,a]:aR}L={AR:Q(A)=R(A)}LP(R)QRLBBL

Acontece que (a gerada por ) é de fato , então esperamos que seja uma coleção suficientemente grande de eventos que, se todos os lugares em , em seguida, eles são forçados a ser igual em todos .σ S B S Q = R S Bσ(S)σSBSQ=RSB

Observe que é fechado sob interseções finitas e que é fechado sob complementos e interseções contáveis separadas (isso segue de -additivity). Isso significa que é um sistema e é um sistema . Pelo - teorema que, portanto, têm que . Os elementos deL σ S π L λ π λ σ ( S ) = BL S S Q R S B BSLσSπLλπλσ(S)=BLSestá longe de ser tão complexo quanto um conjunto arbitrário de Borel, mas como qualquer conjunto Borel pode ser formado a partir de um número contável de complementos, uniões e interseções de elementos de , se não houver uma única discordância entre e em elementos de , então este irá ser seguido através de não haver desacordos sobre qualquer .SQRSBB

Acabamos de mostrar que se então (em ), o que significa que o mapa para partir de para é uma injeção. Q = R B Q F Q P : = { P : P  é uma medida de probabilidade em  ( R , B ) } F : = { F : RR : F  é um CDF }FQ=FRQ=RBQFQP:={P:P is a probability measure on (R,B)}F:={F:RR:F is a CDF}

Agora, se quisermos pensar em outra direção, queremos começar com um CDF e mostrar que existe uma medida de probabilidade única tal que . Isto irá estabelecer que o nosso mapeamento é na verdade uma bijeção. Por este sentido, definimos sem qualquer referência a probabilidade ou medidas.Q F ( a ) = Q ( ( - , a ) ) Q F Q FFQF(a)=Q((,a])QFQF

Primeiro, definimos uma função de medida Stieltjes como uma função modo queG:RR

  1. G não diminui
  2. G é contínuo contínuo

(e observe como o càdlàg segue essa definição, mas devido à restrição extra não decrescente "a maioria" das funções do càdlàg não são funções de medida Stieltjes).

Pode-se mostrar que cada função Stieltjes induz uma medida única on definida por (veja, por exemplo , Probabilidade e Processos Aleatórios de Durrett, para detalhes sobre isso.) Por exemplo, a medida de Lebesgue é induzida por .μ ( R , B ) μ ( ( a , b ] ) = G ( b ) - G ( a ) G ( x ) = xGμ(R,B)

μ((a,b])=G(b)G(a)
G(x)=x

Agora, observando que um CDF é uma função Stieltjes com as propriedades adicionais que e , podemos aplicar esse resultado para mostrar que, para cada CDF , obtemos uma medida única em definida por lim x - F ( x ) : = F ( - ) = 0FlimxF(x):=F()=0F Q ( R , B ) Q ( ( a , b ) ) = F ( b ) - F ( a ) .limxF(x):=F()=1FQ(R,B)

Q((a,b])=F(b)F(a).

Observe como e então é uma medida de probabilidade e é exatamente a que teríamos usado para definir se estivéssemos indo na outra direção.Q ( ( - , - ] ) = F ( ) - F ( - ) = 1 Q FQ((,a])=F(a)F()=F(a)Q((,])=F()F()=1QF

Todos juntos temos visto agora que o mapeamento é 1-1 e em assim que nós realmente temos uma bijeção entre e . Trazendo isso de volta à questão real, isso mostra que poderíamos, de maneira equivalente, sustentar CDFs ou medidas de probabilidade como nosso objeto do qual declaramos que a probabilidade é o estudo (embora reconheça que esse é um empreendimento um tanto faceta). Pessoalmente, ainda prefiro espaços de probabilidade porque sinto que a teoria flui mais naturalmente nessa direção, mas os CDFs não estão "errados".P FQFQPF

jld
fonte
3
+1 para uma perspectiva mais ampla sobre o assunto; Você nota corretamente que o espaço de função càdlàg de Skorokhod é apenas uma noção atual do que implica a teoria das probabilidades, radicalmente diferente da de Borel, e as descobertas de Skorokhod datam apenas de aproximadamente 40 anos. Quem sabe o que o próximo século poderá descobrir?
14118 AdamO
11
@AdamO absolutamente, e existem os mais estranhos, como a probabilidade não-arquimediana, onde, mesmo que nunca se tornem a visão dominante (e que eu saiba, ninguém está tentando fazer isso seriamente), acho que eles me ajudam a entender melhor a formulação padrão ( por exemplo, o quão sério de um aditividade coisa sigma é)
JLD
Eu li o título da pergunta e pensei nessa citação de Terence Tao; deve ter lido anos atrás ( 2010 ), mas é realmente memorável. Como ele continua dizendo: Em um nível prático, o oposto é verdadeiro ...
ShreevatsaR 15/0318
Veja meu comentário sobre a questão: como teorias alternativas de probabilidade, como Bayesian (e Dempster-Shafer e Transferable Belief Model e Dezert-Smarandache Theory), probabilidades imprecisas, teoria da plausibilidade, etc. se relacionam com essa questão e discussão?
E. Douglas Jensen
@ E.DouglasJensen Não tenho certeza, estou abordando isso em termos dos axiomas padrão de Kolmogorov. Nesse contexto, acho que minha resposta é "correta", mas se estamos alterando os axiomas, suponho que todas as apostas estejam fora . Além disso, não estou sendo filosófico sobre isso, então, se estamos tentando conectar isso ao mundo real de alguma maneira, por exemplo, com perguntas como "qual é a probabilidade de o sol nascer", então tenho certeza de que mais complicado. No entanto, parece uma aposta bastante segura de que a probabilidade de que "qualquer coisa" aconteça seja o valor máximo (provavelmente ) e que não haja incerteza nisso.1
jld
12

Não; a distribuição Cantor é exatamente esse contra-exemplo. É uma variável aleatória, mas não tem densidade. Ele tem uma função de distribuição, no entanto. Eu diria, portanto, que a teoria das probabilidades é o estudo das funções càdlàg , inclusive do Cantor DF, que deixaram limites de 0 e limites de 1.

AdamO
fonte
Bom, nunca ouvi falar de funções de cadlag. No entanto, eles ainda assumem um espaço real e um métrico. Nem toda teoria das probabilidades é feita nesses espaços.
HRSE
11
Você pode, por exemplo, voltar a Terrence Fine, Theories of Probability. Observe também que as funções cadlag (pelo menos de acordo com o artigo da wikipedia) têm os números reais como domínio. Os "Fundamentos da Estatística" de LJ Savage dão conta da teoria da probabilidade (subjetiva) em espaços que não são necessariamente reais.
HRSE
11
@jwg Alguns outros comentários neste post abordam a probabilidade negativa, que parece ser útil na física quântica, embora minha mente simples não consiga entender uma coisa dessas.
Adamo
11
@HRSE obrigado pelas referências. Não encontrei nenhum deles on-line, mas procurei em alguns outros artigos desses autores, embora não tenha encontrado exemplos disso. Se estamos definindo uma variável aleatória como , o CDF é definido em termos da medida (não a medida em ) e uma vez que é valorizado verdadeiro é necessariamente uma medida em o que significa que podem alimentar que define como assim tem como domínio. Estou faltando alguma coisa?X : Ω R N P X : = P X - 1 P ( Ω , F ) X P XXX:ΩRnPX:=PX1P(Ω,F)XPX( - , a ] F R n(Rn,Bn)(,a]FRn
JLD
11
Eu acho que bem ordenado significa que cada subconjunto tem menos elemento, enquanto totalmente ordenado significa para todos e , exatamente um de , ou é válido, então é ambos, é apenas totalmente ordenado e também não é. Precisamos absolutamente multiplicar e adicionar probabilidades, para que, no mínimo, o codomain de seja um campo, mas não acho que tenha que ser totalmente ordenado ou completo. Medidas com valor complexo são um exemplo da primeira e medidas com valor hiperreal são um exemplo da segunda. Todos esses são espaços métricos (ou podem ser)yxyx > y x = y N R C Px<yx>yx=yNRCP
JLD
6

Tenho certeza de que você obterá boas respostas, mas fornecerá uma perspectiva um pouco diferente aqui.

Você pode ter ouvido matemáticos dizendo que a física é praticamente matemática, ou apenas uma aplicação da matemática às leis mais básicas da natureza. Alguns matemáticos (muitos?) Realmente acreditam que esse é o caso. Eu ouvi isso repetidamente na universidade. Nesse sentido, você está fazendo uma pergunta semelhante, embora não tão ampla quanto essa.

O físico geralmente nem se dá ao trabalho de responder a essa afirmação: é óbvio demais para eles que isso não é verdade. No entanto, se você tentar responder, fica claro que a resposta não é tão trivial, se você quiser torná-la convincente.

Minha resposta é que a física não é apenas um monte de modelos, equações e teorias. É um campo com seu próprio conjunto de abordagens, ferramentas, heurísticas e formas de pensar. Essa é uma das razões pelas quais, embora Poincare tenha desenvolvido a teoria da relatividade antes de Einstein, ele não percebeu todas as implicações e não procurou envolver todos. Einstein sim, porque ele era físico e entendeu imediatamente o que isso significava. Não sou fã dele, mas seu trabalho sobre o movimento browniano é outro exemplo de como um físico constrói um modelo matemático. Esse artigo é incrível e está cheio de intuição e traços de pensamento que são inconfundivelmente físicos.

Portanto, minha resposta é que, mesmo que a probabilidade lide com o tipo de funções que você descreveu, ainda não teria sido o estudo dessas funções. Nem é uma teoria de medidas aplicada a algumas subclasses de medidas. A teoria das probabilidades é o campo distinto que estuda as probabilidades, está ligada a um mundo natural através de decaimento radioativo, mecânica quântica e gases etc. propriedades também, mas enquanto estiver fazendo, ficaremos de olho no prêmio principal - as probabilidades.

Aksakal
fonte
11
+1 para trazer a realidade para uma luta matemática e realmente responder a pergunta com a única resposta razoável, ou seja, que qualquer reducionismo perde o ponto
JLD
@Chaconne eu aprendi uma palavra útil hoje reducionismo , irá incorporá-lo no meu vocabulário :)
Aksakal
+1, é o que eu estava tentando dizer com a minha resposta, mas disse com menos eficácia do que você imagina.
Nathaniel
4

Bem, parcialmente verdade, falta uma segunda condição. Probabilidades negativas não fazem sentido. Portanto, essas funções precisam atender a duas condições:

  • Distribuições contínuas:

    Df(x)dx=1andf(x)>0xD
  • Distribuições discretas:

    xDP(x)=1and0<P(x)1xD

Onde é o domínio em que a distribuição de probabilidade é definida.D

Carlos Campos
fonte
Muito obrigado Carlos pela resposta, na verdade eu quero saber e se a condição não negativa foi adicionada?
dontloo
11
Eu diria que a redução do campo de probabilidade para estudar as funções de densidade / massa de probabilidade (cumprindo as propriedades superiores) é muito vazia. Além disso, como foi afirmado pelo @AdamO, existem alguns casos de variáveis ​​aleatórias que não possuem função de densidade de probabilidade, mesmo que tenham um cdf bem definido.
Carlos Campos
@CarlosCampos: Em relação às probabilidades negativas: Eles realmente fazem sentido em alguns contextos, por exemplo, meias moedas. Veja en.wikipedia.org/wiki/Negative_probability para obter mais informações.
Inkane
3

Eu diria que não, isso não é fundamentalmente a teoria da probabilidade, mas eu a diria por razões diferentes das outras respostas.

Fundamentalmente, eu diria que a teoria das probabilidades é o estudo de duas coisas:

  1. Processos estocásticos e

  2. Inferência bayesiana.

Os processos estocásticos incluem coisas como rolar dados, sacar bolas de urnas etc., bem como os modelos mais sofisticados encontrados em física e matemática. A inferência bayesiana está raciocinando sob incerteza, usando probabilidades para representar o valor de quantidades desconhecidas.

Essas duas coisas estão mais intimamente relacionadas do que podem parecer à primeira vista. Uma razão pela qual podemos estudá-los sob o mesmo guarda-chuva é que aspectos importantes de ambos podem ser representados como funções não negativas que somam / integram a um. Mas a probabilidade não é apenas o estudo dessas funções - sua interpretação em termos de processos aleatórios e inferência também é uma parte importante dela.

Por exemplo, a teoria da probabilidade inclui conceitos como probabilidades condicionais e variáveis ​​aleatórias e quantidades como a entropia, a informação mútua e a expectativa e variação de variáveis ​​aleatórias. Embora se possa definir essas coisas puramente em termos de funções normalizadas não-negativas, a motivação para isso pareceria bastante estranha sem a interpretação em termos de processos aleatórios e inferência.

Além disso, algumas vezes se deparam com conceitos na teoria das probabilidades, particularmente no lado da inferência, que não podem ser expressos em termos de uma função não negativa que se normaliza para uma. Os chamados "priores impróprios" vêm à mente aqui, e AdamO deu a distribuição Cantor como outro exemplo.

Certamente, existem algumas áreas da teoria das probabilidades nas quais o principal interesse está nas propriedades matemáticas das funções não-negativas normalizadas, para as quais os dois domínios de aplicação que mencionei não são importantes. Quando esse é o caso, costumamos chamá-lo de teoria das medidas, e não de probabilidade. Mas a teoria da probabilidade também é - na verdade, eu diria principalmente - um campo aplicado, e as aplicações das distribuições de probabilidade são em si um componente não trivial do campo.

Nathaniel
fonte
2
Você tornou o domínio dos tópicos na teoria das probabilidades bastante restrito ...
Tim
@ Tim não de propósito - eu o dividi em duas áreas, mas pretendia que cada uma delas fosse interpretada de maneira muito ampla. Você pode me dar alguns outros tópicos que não se encaixam em nenhum dos títulos?
Nathaniel