Informalmente, uma distribuição de probabilidade define a frequência relativa dos resultados de uma variável aleatória - o valor esperado pode ser pensado como uma média ponderada desses resultados (ponderada pela frequência relativa). Da mesma forma, o valor esperado pode ser pensado como a média aritmética de um conjunto de números gerado na proporção exata de sua probabilidade de ocorrência (no caso de uma variável aleatória contínua, isso não é exatamente verdadeiro, pois valores específicos têm probabilidade ).0
A conexão entre o valor esperado e a média aritmética é mais clara com uma variável aleatória discreta, onde o valor esperado é
E(X)=∑SxP(X=x)
onde é o espaço de amostra. Como exemplo, suponha que você tenha uma variável aleatória discreta tal que:XSX
X= ⎧⎩⎨123com probabilidade 1 / 8com probabilidade 3 / 8com probabilidade 1 / 2
Ou seja, a função de massa de probabilidade é , e . Usando a fórmula acima, o valor esperado éP( X= 1 ) = 1 / 8P(X=2)=3/8P(X=3)=1/2
E(X)=1⋅(1/8)+2⋅(3/8)+3⋅(1/2)=2.375
Agora considere os números gerados com frequências exatamente proporcionais à função de massa de probabilidade - por exemplo, o conjunto de números - dois s, seis oito s. Agora pegue a média aritmética desses números:{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123
1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375
e você pode ver que é exatamente igual ao valor esperado.
A expectativa é o valor médio ou média de uma variável aleatória e não uma distribuição de probabilidade. Como tal, é para variáveis aleatórias discretas a média ponderada dos valores que a variável aleatória assume onde a ponderação está de acordo com a frequência relativa de ocorrência desses valores individuais. Para uma variável aleatória absolutamente contínua, é a integral dos valores x multiplicada pela densidade de probabilidade. Os dados observados podem ser vistos como os valores de uma coleção de variáveis aleatórias independentes distribuídas de forma idêntica. A média da amostra (ou expectativa da amostra) é definida como a expectativa dos dados em relação à distribuição empírica dos dados observados. Isso torna simplesmente a média aritmética dos dados.
fonte
Vamos prestar muita atenção às definições:
Média é definida como a soma de uma coleção de números dividida pelo número de números na coleção. O cálculo seria "para i em 1 para n, (soma de x sub i) dividido por n".
O valor esperado (EV) é o valor médio de longo prazo das repetições do experimento que ele representa. O cálculo seria "para i em 1 a n, soma do evento x subi vezes sua probabilidade (e a soma de todos os p sub i deve = 1)".
No caso de um dado justo, é fácil ver que a média e o VE são os mesmos. Média - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5 e EV seria:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = soma (p * x) = 3,50
Mas e se o dado não fosse "justo"? Uma maneira fácil de fazer uma matriz injusta seria fazer um furo no canto na interseção das faces 4, 5 e 6. Além disso, digamos agora que a probabilidade de rolar um 4, 5 ou 6 em nosso dado torto novo e aprimorado é agora 0,2 e a probabilidade de rolar um 1, 2 ou 3 agora é 0,13. É o mesmo dado com 6 faces, um número em cada face e a média para esse dado ainda é 3,5. No entanto, depois de rolar esse dado muitas vezes, nosso VE agora é 3,8, porque as probabilidades dos eventos não são mais as mesmas para todos os eventos.
prob xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = soma (p * x) = 3,80
Novamente, tenhamos cuidado e voltemos à definição antes de concluir que uma coisa sempre será "a mesma" que outra. Veja como uma matriz normal é montada e faça um furo nos outros 7 cantos e veja como os EVs mudam - divirta-se.
Bob_T
fonte
A única diferença entre "média" e "valor esperado" é que a média é usada principalmente para distribuição de frequência e a expectativa é usada para distribuição de probabilidade. Na distribuição de frequências, o espaço amostral consiste em variáveis e suas frequências de ocorrência. Na distribuição de probabilidade, o espaço amostral consiste em variáveis aleatórias e suas probabilidades. Agora sabemos que a probabilidade total de todas as variáveis no espaço amostral deve ser = 1. Aqui reside a diferença básica. O termo denominador para expectativa é sempre = 1. (ou seja, somatório f (xi) = 1) No entanto, não existem restrições no somatório de frequência (que é basicamente o número total de entradas).
fonte