Valor esperado vs. valor mais provável (modo)

15

O valor esperado de uma distribuição f(x) é a média, ou seja, o valor médio ponderado

E[x]=-+xf(x)dx

O valor mais provável é o modo, que é o valor mais provável.

No entanto, esperamos ver muitas vezes? Citando aqui :E[x]

Se os resultados não forem igualmente prováveis, a média simples deverá ser substituída pela média ponderada, que leva em consideração o fato de que alguns resultados são mais prováveis ​​que os outros. A intuição, no entanto, permanece a mesma: o valor esperado de é o que se espera que aconteça em média .xEux

Não consigo entender o que significa "acontecer em média", isso significa que, por exemplo, tomando uma medida muito tempo, espero ver mais do que outros valores de ? Mas não é essa a definição de modo?E[x]x

Então, como interpretar a afirmação? E qual é o significado probabilístico de ?E[x]


Eu também gostaria de mostrar um exemplo em que fico confuso. Estudando a , aprendi que o modo é , enquanto , onde são os graus de liberdade de dados.χ2χmode2=ν-2E[χ2]=νν

Ouvi na universidade que, ao fazer um depois de usar o método dos mínimos quadrados para ajustar um conjunto de dados, eu esperava obter porque "é o que acontece em geral".χ 2vmaxχ2χ2ν


Eu não entendi tudo isso ou o valor esperado é de alguma forma muito provável? (Mesmo que o valor mais provável seja o modo)

Sørën
fonte
4
Eu realmente gosto do poder da metáfora de tickets-in-a-box para esta pergunta, porque ela produz uma resposta simples e clara: a expectativa de uma variável aleatória é a soma de seus valores (conforme desenhada nos tickets) dividida por a contagem dos ingressos. É isso aí. Qualquer afirmação que não siga essa definição (ou equivalentes matemáticos mais sofisticados) é apenas uma heurística e pode muito bem estar incorreta em algumas circunstâncias.
whuber

Respostas:

18

Para uma distribuição Normal, o valor esperado, também conhecido como média, é igual ao modo.

Em geral, não apenas o valor esperado não é apenas o mais provável (ou a maior densidade), mas também pode não ter chance de ocorrer. Por exemplo, considere a variável aleatória X que é igual a 0 ou 2, cada um com probabilidade 0,5. Então EX = 1, mas o valor esperado, 1, tem 0 de probabilidade de ocorrer, enquanto 0 e 2 são os dois modos da distribuição.

A citação "o valor esperado de x é o que se espera que aconteça em média" é a linguagem leiga não técnica, que, como é evidente pela sua confusão, serve apenas para confundir as coisas. O valor esperado tem um significado muito específico na probabilidade como sendo a média matemática. Enquanto na linguagem dos leigos, um valor esperado ou "em média" pode ser algo que normalmente ocorre. Eles podem ser reconciliados se "em média" for interpretado como sendo a média matemática do que ocorre.

Expectativamente seu,

Joe Average

Mark L. Stone
fonte
1
Começa a pergunta: e a mediana, que é garantida como possível ?
estrela brilhante
Como o @TrevorAlexander disse, o modo também não oferece garantias. Considere o modo de distribuição contínua.
Tim
3
@ Trevor Alexander Sempre existe uma mediana possível (probabilidade ou densidade positiva). No entanto, nem todas as medianas são necessariamente possíveis. A mediana da variável aleatória X é qualquer ponto para o qual m e P ( X m ) 1 / 2 . Se X é igual a 1,2,3, ou 4, cada um com probabilidade 1/4, em seguida, qualquer número no intervalo [2,3] é uma mediana de X.P(Xm)1/2P(Xm)1/2
Mark L. Stone
5

O valor esperado é a priori muito abstrato e não há razão para pensar que é o resultado mais provável; como outros já apontaram, é fácil construir variáveis ​​aleatórias para as quais (e o mesmo com densidade se X for contínuo)

P(X=E(X))=0 0
X

A única justificativa para o valor esperado, e a razão pela qual "esperamos vê-lo com frequência", é a Lei dos grandes números :

se você tiver variáveis ​​independentes idênticas distribuídas X i , entãonXi

X1++XnnE(X)

(para um significado adequado de que não faz sentido investigar no momento)

O que isso significa? Imagine que você joga uma moeda com probabilidade da cabeça de aterrissagem, que iremos associar ao número1, e probabilidade1-pda cauda de aterrissagem (ou seja,0). Qual é o resultado mais provável? 1! (isto é, cabeça) Qual é o valor esperado? E(X)=1p+0(1-p)=pp>1211p0

E(X)=1p+0(1p)=p

Agora claramente "p" nunca acontecerá (é cabeça ou cauda, ​​0 ou 1).

Mas lance a moeda 10.000 vezes e registre as vezes em que apareceu acima do número total de jogadas. Esse número captura o que pensamos intuitivamente sobre a média ("número médio de cabeças"). E a lei dos números grandes diz que esse número estará próximo de E(X)=p

Formiga
fonte
Eu não diria que a lei dos grandes números é a única justificativa para o valor esperado. Por exemplo, en.wikipedia.org/wiki/… é uma justificativa para considerar os valores esperados das funções de utilidade (não estudei a prova, mas fico surpreso se, de alguma forma, se basear na lei de grandes números).
Juho Kokkala
3

Não gosto do termo "valor esperado" e não o usei para ensinar probabilidade. "Média aritmética" é melhor, na minha opinião, porque a média aritmética de um dado de 6 lados é 3,5, mas esse número não ocorre. Eu ouvi originalmente o termo "valor da expectativa" para o conceito quando estava na faculdade. Muitos termos técnicos não concordam com o óbvio significado não técnico. ("Ou" vem à mente.)

Observe que uma distribuição pode ter mais de um modo, mas a média aritmética é única. Modo, média e mediana são diferentes e têm usos diferentes.

ttw
fonte
1
Nice no "ou". Isso me fez pensar no meu curso de Programação Linear, no qual estudamos vários Teoremas da Alternativa. Eles tinham a forma "Ou A é verdadeiro ou B é verdadeiro, mas não ambos". É muito mais fácil expressá-lo como A xor B. Não ouço muito o uso de xor em conversas casuais nas ruas.
Mark L. Stone
2

A diferença é mais fácil de ver com distribuições discretas:

Considere dois conjuntos de valores em que cada número tem a mesma probabilidade de ser desenhado: {1,2,2,2,10} e {1,2,2,2,3}.

Ambos têm o mesmo modo (2), mas os valores esperados diferem. O valor esperado coloca peso extra em valores grandes, enquanto o modo simplesmente procura qual valor ocorre com frequência. Portanto, se você desenhar nessa distribuição várias vezes, a média da amostra ficaria próxima do valor esperado, enquanto o número inteiro mais comum a ocorrer seria o próximo ao modo.

mode=umargmaxf(x)xf(x)

O uso da linguagem para distinguir entre diferentes medidas de tendência central é um problema comum ao aprender estatística. Por exemplo, a mediana é outra medida que não é distorcida por valores grandes, como a média.

VCG
fonte