Por que a soma das probabilidades em uma distribuição uniforme contínua não é infinita?

9

Função densidade de probabilidade

A função densidade de probabilidade de uma distribuição uniforme (contínua) é mostrada acima. A área sob a curva é 1 - o que faz sentido, pois a soma de todas as probabilidades em uma distribuição de probabilidade é 1.

Formalmente, a função de probabilidade acima (f (x)) pode ser definida como

1 / (ba) para x em [a, b]

e 0 caso contrário

Considere que eu tenho que escolher um número real entre a (digamos 2) eb (digamos 6). Isso torna a probabilidade uniforme = 0,25. No entanto, como há um número infinito de números nesse intervalo, a soma de todas as probabilidades não deveria somar ao infinito? O que eu estou negligenciando?

F (x) não é a probabilidade do número x ocorrer?

rahs
fonte
11
xf(x) não é uma função de probabilidade - é uma função de densidade de probabilidade . Ou seja, não fornece a probabilidade de ser um determinado número, mas a densidade de probabilidade ou a probabilidade por unidade de comprimento ao longo do eixo x. Você usa a integração para obter a probabilidade total desse tipo de função - não a soma. x
HelloGoodbye 28/08

Respostas:

18

a a + .1 a bf(x) descreve a densidade de probabilidade em vez de uma massa de probabilidade no seu exemplo. Em geral, para distribuições contínuas, os eventos - para os quais obtemos probabilidades - são intervalos de valores, como para a área sob a curva de a ou de a (embora esses intervalos não precisem ser contíguos) . Para distribuições contínuas, a probabilidade de ocorrência de qualquer valor único é geralmente 0.umauma+.1umab

Alexis
fonte
Existe uma maneira mais tecnicamente precisa de dizer o que você está tentando dizer? Estou preocupado a coisa "gama" vai jogar as pessoas, considerando distribuições contínuas podem ter deltas de Dirac ...
user541686
3
@ Mehrdad: O delta dirac não tem uma distribuição contínua. A maneira correta de atribuir probabilidades seria via . P(UMA)=UMA1 1dF
Alex R.
11
@AlexR .: Oof, presumi que por "distribuição contínua" você apenas quis dizer uma distribuição em um domínio contínuo, já que é a isso que as pessoas se referem quando dizem que o delta do Dirac é o análogo contínuo do delta do Kronecker. Obrigado por esclarecer.
user541686
@Mehrdad Eu estava pensando exatamente no delta de Dirac, mas espero que você observe o termo "em geral" e também o aparente nível de conhecimento estatístico do OP.
Alexis28 /
@Mehrdad A formulação técnica de uma variável aleatória é em termos de uma medida: existe uma função do conjunto de potências do espaço de eventos até o intervalo [0,1]. Uma função de densidade de probabilidade pode ser usada como uma medida (a medida de um conjunto é simplesmente a integral do PDF sobre esse conjunto), mas existem medidas, como o delta Dirac (um conjunto tem a medida 1 se contiver e caso contrário, é zero) que, estritamente falando, não funcionam no sentido tradicional. x0 0
Acumulação
11

Porque cada termo no somatório é ponderado pelo infinitesimal d . A importância disso é provavelmente mais facilmente entendida através de um exemplo muito básico.x

Considere usar o somatório de Riemann para calcular a área sob a seguinte região retangular (um retângulo foi escolhido para remover o aspecto de aproximação do somatório de Riemann, que não é o foco aqui): região retangular] Podemos calcular a área usando 2 sub-regiões ou 4 sub-regiões . No caso das 2 sub-regiões (denotado ), as áreas são dadas por enquanto que no caso de 4 sub-regiões (denotado ), as áreas são dadas por A área total em ambos os casos corresponde a Agora, tudo isso é bastante óbvio, mas gera uma questão sutilmente importante: por que essas duas respostas concordamA 1 = A 2 = 5 × 2 = 10 B i B 1 = B 2 = B 3 = B 4 = 5 × 1 = 5 2 i = 1 A i = 4 i = 1 B i = 20 0,5 x UMAEu

UMA1 1=UMA2=5×2=10
BEu
B1 1=B2=B3=B4=5×1 1=5
Eu=1 12UMAEu=Eu=1 14BEu=20
? Intuitivamente, deve ficar claro que funciona porque reduzimos a largura do segundo conjunto de sub-regiões. Poderíamos considerar fazer o mesmo com 8 sub-regiões, cada uma com uma largura de e novamente com 16 ... e poderíamos continuar esse processo até termos um número infinito de sub-regiões, cada uma com uma pequena largura de d . Desde que tudo esteja sempre corretamente ponderado, as respostas devem sempre concordar. Sem a ponderação correta, a soma seria simplesmente .0,5x

É por isso que sempre digo aos alunos que uma integral não é simplesmente o símbolo , mas o par de símbolos d x .dx

Zxv
fonte
5

1 1=0 0

f(x)=1 1x[0 0,1 1]f(x)=0 00,20,3

0,20,3f(x) dx=0,20,31 1 dx=[x]0,20,3=0,3-0,2=0,1

ou seja, você tem 10% de chance de obter um resultado nesse intervalo.

[1] Desculpe por todas as pessoas que sofreram ataques cardíacos devido à minha simplificação excessiva do cálculo.

Vigarista
fonte
0

Em geral, seu raciocínio falha nesta suposição:

No entanto, como há um número infinito de números nesse intervalo, a soma de todas as probabilidades não deveria somar ao infinito?

É um problema matemático, conhecido desde os Paradoxos de Zenão de Eléia .

Duas de suas alegações eram de que

  1. Uma flecha nunca pode atingir seu alvo
  2. Aquiles nunca ultrapassará uma tartaruga

Ambos foram baseados na alegação de que você pode construir uma sequência infinita de números positivos (no primeiro caso, dizendo que uma flecha precisa voar infinitamente vezes a metade do caminho restante até o alvo, no segundo, dizendo que Aquiles para alcançar a posição em que a tartaruga estava anteriormente e, enquanto isso, a tartaruga se move para uma nova posição que se torna nosso próximo ponto de referência).

Avançando rapidamente, isso levou à descoberta de somas infinitas.

Portanto, na soma geral do infinito, muitos números positivos não precisam necessariamente ser infinitos ; no entanto, pode não ser infinito apenas se (uma simplificação excessiva demais, desculpe por isso) quase todos os números na sequência estiverem muito próximos de 0, independentemente de quão perto de zero você os solicite.

O Infinito joga ainda mais truques. A ordem na qual você adiciona elementos da sequência também é importante e pode levar a uma situação em que a reordenação fornece resultados diferentes!

Explore um pouco mais sobre paradoxos do infinito . Você pode estar surpreso.

Ister
fonte
Não vejo uma maneira de interpretar a pergunta de tal maneira que o OP pense em somas contáveis.
Jik
0

f(x)pxf(x)=1 1b-umapx

Espero que isso faça sentido.

user3719750
fonte