Eu tenho uma pergunta ingênua sobre a teoria da decisão. Calculamos as probabilidades de vários resultados assumindo decisões específicas e atribuímos utilitários ou custos a cada resultado. Encontramos a decisão ideal encontrando a que tem a maior utilidade esperada.
Mas por que devemos raciocinar dessa maneira? De fato, cada decisão tem uma distribuição de utilidade associada. Por que comparamos as distribuições de utilitários para escolhas diferentes apenas por uma única estatística resumida? E por que escolhemos a média em vez do modo ou mediana, etc?
Posso imaginar casos em que duas opções geram utilitários esperados idênticos, mas suas distribuições para o utilitário variam muito. Certamente, as decisões devem ser tomadas com base em toda a distribuição e não apenas nas expectativas?
Estamos dizendo que, para qualquer esquema para tomar decisões usando toda a distribuição, deve existir uma função de utilidade cuja utilidade máxima esperada daria resultados idênticos? Em caso afirmativo, não deveríamos construir utilitários fielmente e selecionar uma regra de decisão como desejássemos? Mais tarde, podemos converter nossos utilitários fiéis para aqueles que fornecem resultados idênticos com expectativa máxima.
Respostas:
O teorema da utilidade de Von Neumann-Morgenstern implica que, sob algumas suposições razoáveis (como o fato de que você é capaz de ordenar um conjunto de cenários da melhor para a pior, em que cada cenário resolve estocisticamente algum resultado), existe uma função de mapeamento de cada resultado possível para um valor real (o "utilitário"), de modo que você sempre prefere o cenário com o utilitário esperado mais alto. Portanto, faz sentido sempre selecionar a opção que maximiza a utilidade esperada.
O utilitário VNM leva isso em consideração para que, mesmo que você seja avesso ao risco , o cenário de utilitário esperado mais alto será o mais preferível.
Eu preferiria dizer que a estratégia de aproximar a utilidade de certos resultados via adivinhação ou algumas heurísticas humanas leva a uma tomada de decisão imperfeita, uma vez que a função de utilidade resultante difere da utilidade VNM ideal. Construir utilitários "fielmente" resolverá o problema e fará com que a maximização do utilitário produz a resposta certa.
fonte
Minha resposta pode surpreendê-lo. Responderei dentro da teoria da utilidade esperada e além dela.
Utilitário além do esperado
A teoria da utilidade esperada não é a única maneira de tomar decisões. Se você usa a teoria da utilidade ou não, depende dos aplicativos. Por exemplo, no gerenciamento de patrimônio, alguns consultores usam a teoria da perspectiva em vez da utilidade esperada. Kahneman recebeu o prêmio Nobel de Economia por seu trabalho nessa teoria. Ele trouxe aspectos comportamentais da tomada de decisão na economia além da teoria da utilidade esperada.
Praticamente, em uma abordagem tradicional de escolha de portfólio , os consultores de patrimônio tentam construir a função de utilidade do cliente e, em seguida, usam-na para selecionar o melhor portfólio na fronteira eficiente. Na abordagem da teoria da perspectiva, os consultores tentam construir a função de valor em vez da função de utilidade e usam a primeira para escolher o melhor portfólio.
Dentro da teoria da utilidade esperada
Agora, mesmo na teoria da utilidade tradicional, isso é resolvido. Por exemplo, eles têm uma noção de aversão ao risco e dominância estocástica . Uma pessoa avessa ao risco não escolherá a decisão apenas com base na utilidade esperada. Isso seria uma pessoa neutra ao risco . Pessoas avessas ao risco preferem decisões com menor entropia quando apresentadas com decisões com a mesma utilidade esperada, por exemplo. Isso é chamado de domínio estocástico.
A analogia seria olhar para duas distribuições nômicas com as mesmas dispersões médias, mas diferentes. Sim, essas são distribuições diferentes e a dispersão é importante em muitas aplicações. No entanto, isso não diminui a importância de conhecer a média. Para definir completamente a distribuição normal, você precisa conhecer a média e a dispersão, e a própria média nos informa muito sobre a distribuição. Da mesma forma, o utilitário esperado não é a única coisa que você precisará saber sobre a função de utilitário do agente, mas, no entanto, há muitas informações.
fonte
Em grande medida, essa é realmente uma pergunta sobre o valor esperado, que já foi discutido em outro local . Você está certo, que é e deve estar interessado em toda a distribuições, mas é difícil para comparar distribuições inteiras e comparando resumos de ponto único é muito mais fácil. Sim, você pode comparar outros resumos de pontos únicos e, em muitos casos, compará-los, mas o valor esperado possui várias propriedades agradáveis que o tornam um resumo de ponto único muito bom para uma variável aleatória. O valor esperado pondera os possíveis resultados por suas probabilidadese diz o que você poderia "esperar" a longo prazo. Se você joga contra o cassino, o valor esperado das possíveis vitórias e derrotas é negativo para você, por isso diz que, a longo prazo, você não deve esperar que o faça rico.
Deixe-me dar um exemplo muito rigoroso da teoria dos jogos. Imagine que você está pensando em jogar roleta russa ; você vai dar um tiro em sua direção usando um revólver de seis tiros com apenas uma bala na câmara. Se nada acontecer, você ganha $ 1000, caso contrário, você morre. O resultado do modo é que você ganha $ 1000, o mesmo com a mediana. O valor esperado deste jogo é 5/6 $ 1000 1/6× + × morte, você consideraria jogar? É claro que, na abordagem teórica do jogo, você deve considerar qual é a utilidade real do dinheiro ganho e qual é o preço da morte, mas acho que, sem ir mais fundo, você deve ver o ponto de usar o valor esperado como um resumo de um ponto aqui .
O valor esperado (e médio, seu estimador) é sensível a valores discrepantes e essa é uma das razões pelas quais o utiliza tanto. Você consideraria a concorrência se o preço fosse $ 1? Que tal US $ 1 000 000 000? Observe que se você estivesse usando o modo ou mediana como critério para o resultado "possível", não se importaria, pois, em cada caso, eles dizem que você ganha "em média". Você mudaria de idéia se estivesse fotografando com balas em branco? Observe que nem o modo nem a mediana não mudam se você estiver usando espaços em branco, pois eles não se importam com os resultados extremos, mas o valor esperado muda drasticamente * . O valor esperado (e médio) considera todosos possíveis resultados e ponderá-los por probabilidades, esse é o motivo para usá-lo no cenário de decisão.
Um exemplo mais realista seria a loteria com 1000 cupons e apenas um cupom vencedor. Digamos que o preço seja $ 1000, então o valor esperado é 999/1000 $ 0 1/1000 $ 1000 = $ 1, portanto, não vale a pena comprar um cupom se o preço não for menor que $ 1. Isso significa que, se você jogasse o jogo muitas e muitas vezes, ganharia algumas vezes e perderia muitas vezes, e o saldo geral do dinheiro investido e ganho seria de aproximadamente US $ 1. Se o prêmio mudasse para US $ 10.000, sem alterar o preço do cupom, a história seria diferente, pois o valor esperado mudaria para $× + × 10. Observe que, novamente, o modo ou a mediana são, em ambos os casos, US $ 0, portanto, são insensíveis aos pagamentos. Isso não está dizendo que eles são inúteis, mas mostra que o valor esperado é o que geralmente precisamos aqui.
* - Para ser honesto, este exemplo é enganador, pois você pode se matar com espaços em branco , mas, para argumentar, digamos que você tenha algum tipo de espaço em branco hipotético "seguro".
fonte
Em sua resposta, @shimao se concentrou no teorema da utilidade von Neumann-Morgenstern . O teorema realmente está no cerne do motivo pelo qual consideramos a utilidade esperada, em vez de qualquer outra estatística resumida da utilidade, ou mesmo de toda a distribuição da utilidade.
O teorema mostra, a partir de alguns axiomas, que, quando confrontado com a incerteza, um tomador de decisão deve escolher o curso de ação que maximiza a utilidade esperada. Eu acho que o axioma relevante para minha pergunta é o axioma da continuidade.
Nós classificar três opções possíveis em ordem, digamos, , onde indica que um resultado é pior do que ou não melhor do que resultado . O axioma da continuidade declara que deve existir uma probabilidade, , de tal forma que tomar a opção com probabilidade opção com probabilidade seja tão bom quanto a opção , ou seja, existe um tal queL⪯M⪯N A⪯B A B p L p N 1−p M p pL+(1−p)N∼M
Sem repetir a prova completa, fica claro que isso sugere por que a variação (ou qualquer outro momento adicional) da utilidade não importa. Não importa quão extremo resultados e são, nosso axioma é que deve existir uma probabilidade de tal forma que a escolha de tomar com probabilidade e de outra forma é tão bom uma escolha como furar com . Isso apesar do fato de que o primeiro poderia ter uma enorme variação na utilidade.L N L p N M
fonte
Existem alguns pequenos erros de linguagem que estão criando um pouco de confusão em relação à sua pergunta.
Utilitários não têm distribuição. Os resultados têm uma distribuição e, através do resultado, as ações, em alguns casos, têm uma distribuição. Utilitário é determinístico. Se fosse aleatório, seus sentimentos em relação a um resultado o assustariam constantemente. Por exemplo, você poderia ter a experiência de "uau, ter minhas pernas esmagadas em um acidente de automóvel foi uma experiência surpreendentemente boa!" O que é incerto é o resultado de uma ação.
Se excluirmos casos degenerados, onde as integrais divergem, e uma solução não existe, acho que também posso mostrar um caso em que a mediana maximiza a utilidade esperada.
Observe que . Achamos importante criar uma regra, que é a que estamos avaliando com o nosso utilitário, que encontrará com alguma consistência.U(δ(x),μ)=−L(δ(x),μ) μ
Queremos resolver:sujeito aminδL(δ,μ)=|δ(x)−μ| f(x|μ)=1π11+(x−μ)2.
Se assumirmos que o risco éPr(μ)∝1, ∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dx
e o risco integrado minimiza quando está no mínimo. Minimiza quando é a mediana.∫∞−∞∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dxdμ δ(x)
Você maximiza o utilitário esperado ao encontrar a mediana dos dados. Você não pode encontrar uma média para pois ela não existe. Por não ter significado, também não tem variação. Como não possui variação, não é possível minimizar a perda quadrática. Consequentemente, a utilidade quadrática, se fosse o caso real, seria minimizada por qualquer valor nos números reais.f(x|μ)=1π11+(x−μ)2,
Se você ignorar os casos degenerados, como no caso acima, o utilitário esperado terá uma vantagem inesperada sobre outros métodos. Considerando todas as possíveis regras de decisão e ações que podem ser tomadas, quando você usa o utilitário esperado, você termina com um pedido total. Você está correto, pode haver empates, mas, como o impacto de todos os parâmetros foi explicado, você seria indiferente entre as opções com o utilitário empatado.
A alternativa, usada na teoria da decisão freqüentista, é ordenar a função de risco por meio do domínio estocástico. Diz-se que uma decisão freqüentista é admissível se não puder ser dominada estocástica. Isso não permite um pedido total. No entanto, se primeira ordem estocástica domina , também é verdade que a utilidade esperada de escolher . Portanto, a alternativa fornece o mesmo resultado.δ(x) δ′(x) δ>δ′
Existem algumas outras soluções que podem ser usadas, mas elas são mapeadas para maximizar a utilidade esperada ou sugerem a razão pela qual você as usaria nos casos em que elas não o são. Para dar outro exemplo estatístico, imagine que você leu uma pesquisa que teve um tamanho de amostra de um milhão de observações usando métodos de máxima verossimilhança ou métodos bayesianos. Você replica o estudo com um tamanho de amostra de 100 e estima a média e a variação usando um estimador imparcial. Nem os estimadores bayesianos nem os de probabilidade máxima são imparciais no caso geral.
Você insiste em não combinar suas estimativas porque a outra estimativa é tendenciosa, enquanto a sua é imparcial. Os métodos bayesianos oferecem um método disciplinado para combinar as amostras em um estimador de ponto único, maximizando sua utilidade. Você insiste em perder as informações da amostra de um milhão de pessoas em favor da imparcialidade.
Agora, se o seu utilitário tivesse um viés muito forte em relação a estimadores imparciais, você maximizaria seu utilitário, não maximizando o utilitário do seu estimador. Mas, na ausência disso, o estimador tendencioso será muito mais preciso do que apenas na sua pequena amostra. Se a precisão maximiza seu utilitário, você acaba escolhendo um estimador que está maximizando o utilitário.
Não confunda a expectativa do utilitário com o valor esperado da ação. Essas são coisas diferentes.
Além disso, considere maximizar o utilitário esperado versus o utilitário mediano. Você pega a utilidade de todo resultado multiplicado pela probabilidade e a soma.E[U(x~)]=∫x~∈χU(x~)Pr(x~)dx~
Agora vamos pensar no utilitário mediano. seM[U(x~)]=c ∫caU(x~)Pr(x~)dx~=∫bcU(x~)Pr(x~)dx~.
O que isso significa? Você ficaria tão feliz se pousasse à esquerda quanto à direita de ? Por que você se importaria com isso?c
Se você escolheu uma ação que maximizou o utilitário esperado, não há nenhuma ação que você possa executar que acredite que o faria mais feliz. A utilidade mediana não permite uma maximização, pois a ação é escolhida pela força de estar no centro. Você sempre adotaria a ação que lhe dará 50% de chance de ser mais feliz do que o normal ou mais triste do que o normal. Que coisa mais estranha de se fazer!
EDIT Dos axiomas de Kolmogorov, a soma de uma distribuição deve ser igual a um. Considere um caso com dois conjuntos de ações, e , em que é o conjunto de ações que não são .a a′ a′ a
Focando em , vamos assumir que a função de utilitário é . Vamos supor que , quando a ação é , é extraído de .a −x2 x a f(x)=exp(−x),x>0
Observando que podemos prontamente confirmar que é uma função de densidade de probabilidade. A inclusão de resultados do utilitário em que confirma que não é uma distribuição.∫∞0exp(−x)dx=1, ∫∞0x2exp(−x)dx=−2, E(U(a))=−2.
Embora seja possível constituir uma distribuição por utilitários, ela não será necessariamente uma função, pois se , então não tem garantia de ser uma função.g(x)=U(x)Pr(x) g−1(x)
fonte