Para que problema ou jogo são as soluções ideais de variação e desvio padrão?

9

Para uma dada variável aleatória (ou uma população, ou um processo estocástico), a expectativa matemática é a resposta a uma pergunta. Que previsão pontual minimiza a perda quadrada esperada? . Além disso, é a solução ideal para um jogo. Adivinhe a próxima realização de uma variável aleatória (ou um novo sorteio de uma população), e eu o punirei pela distância ao quadrado entre o valor e o seu palpite, se você tiver desutilidade linear em termos de do castigo. A mediana é a resposta para uma pergunta correspondente sob perda absoluta e o modo é a resposta sob perda "tudo ou nada".

Perguntas: A variação e o desvio padrão respondem a perguntas semelhantes? O que eles são?

A motivação para esta pergunta decorre do ensino de medidas básicas de tendência e disseminação centrais. Enquanto as medidas de tendência central podem ser motivadas pelos problemas teóricos da decisão acima, pergunto-me como alguém poderia motivar as medidas de propagação.

Richard Hardy
fonte
11
Pergunta muito interessante. Minha abordagem inicial seria que o "jogo" é qualitativamente o mesmo que você já descreve, exceto que a pergunta espera (sem trocadilhos) que a resposta seja sobre uma faixa de valores em vez de um ponto, uma vez que se espalhou sem um ponto de partida. A referência é uma informação incompleta (se não sem sentido).
Emil
Note que a variação é em si uma expectativa - se então . Y=(Xμ)2Var(X)=E(Y)
Glen_b -Reinstala Monica
@Glen_b, você está certo, e eu entendi (eu deveria ter incluído isso no texto da pergunta). "Acho que a diferença entre o próximo valor e a expectativa e eu vou puni-lo quadraticamente" seria o jogo. Isso é o melhor que existe? Não parece um jogo muito prático ou muito divertido, IMHO.
Richard Hardy

Respostas:

2

Se entendi a pergunta como pretendida, você tem em mente uma configuração na qual é possível obter realizações independentes de qualquer variável aleatória com qualquer distribuição (com variação finita ). O "jogo" é determinada por funções e a ser descrito. Consiste nas seguintes etapas e regras:XFσ2(F)hL

  1. Seu oponente ("Natureza") revelaF.

  2. Em resposta, você produz um número sua "previsão".t(F),

Para avaliar o resultado do jogo, os seguintes cálculos são realizados:

  • Uma amostra de iid observações é extraída denX=X1,X2,,XnF.

  • Uma função predeterminada é aplicada à amostra, produzindo um número a "estatística".hh(X),

  • A "função de perda" compara sua "previsão" com a estatística produzindo um número não negativoLt(F)h(X),L(t(F),h(X)).

  • O resultado do jogo é a perda esperada (ou "risco")

    R(L,h)(t,F)=E(L(t(F),h(X))).

Seu objetivo é responder ao movimento da natureza especificando alguns que minimizam o risco.t

Por exemplo, no jogo com a função e qualquer perda da forma para um número positivo sua jogada ideal é escolher como a expectativa deh(X1)=X1L(t,h)=λ(th)2λ,t(F)F.

A questão diante de nós é:

Fazer existem e para o qual o movimento é óptima para escolher para ser a variância ?Lht(F)σ2(F)

Isso é prontamente respondido, exibindo a variação como uma expectativa. Uma maneira é estipular que e continue usando perda quadrática Ao observar que

h(X1,X2)=12(X1X2)2
L(t,h)=(th)2.

E(h(X))=σ2(F),

o exemplo permite concluir que este este respondem à pergunta sobre variância.hL


E o desvio padrão ? Novamente, precisamos apenas exibir isso como a expectativa de uma amostra estatística. No entanto, isso não é possível, porque mesmo quando limitamos à família de distribuições de Bernoulli , só podemos obter estimadores imparciais das funções polinomiais de mas não é uma função polinomial no domínio (Consulte Para a distribuição binomial, por que não existe um estimador imparcial para ? Para o argumento geral sobre distribuições binomiais , para o qual essa questão pode ser reduzida após a média deσ(F)F(p)p,σ(F)=p(1p)p(0,1).1/phXi.1/phsobre todas as permutações do)Xi.

whuber
fonte
Obrigado por uma clara articulação da minha pergunta e uma resposta igualmente clara. Você também teria um exemplo de que depende de todos os pontos de amostra, não apenas de dois? nhn
Richard Hardy
2
Existe uma maneira padrão de ir de para : calcule a estatística para todos os pares e a média. De fato, isso produz minha caracterização de covariância em stats.stackexchange.com/a/18200/919 . Para a teoria formal disso, leia sobre U statistics . n2n
whuber
11
Muito obrigado!
Richard Hardy