Por que as distribuições são importantes?

10

Isso pode ser o mesmo que as perguntas mais bobas já feitas neste fórum, mas, depois de ter recebido respostas sólidas e significativas para uma pergunta anterior, pensei em estender minha sorte novamente.

Há muito tempo fico confuso sobre a importância das distribuições estatísticas, especialmente no que se refere ao retorno de ativos e, mais especificamente, à alocação de ativos.

Minha pergunta para ser específico é: Suponha que eu tenho 20 anos de dados de devoluções mensais do S&P 500, por que devo assumir um certo tipo de distribuição (por exemplo, voo normal / Johnson / Levy etc.) para minha decisão de alocação de ativos quando posso simplesmente apenas tomar minhas decisões de alocação de ativos com base nos dados históricos que tenho comigo?

Bloodline
fonte
3
lembre-se de que, se você encontrou respostas úteis à sua pergunta anterior, pode marcá-las como 'aceitas' clicando na caixa de seleção ao lado da resposta. isso permite que outras pessoas saibam que sua pergunta foi resolvida.
21412 Jeff
2
Na verdade, há um post recente do JDCook sobre esse assunto. Para descrever sua relevância para a sua pergunta, citarei o primeiro parágrafo "Quando estatísticos analisam dados, eles não olham apenas os dados que você traz para eles. Eles também consideram dados hipotéticos que você poderia ter trazido. Em outras palavras , eles consideram o que poderia ter acontecido e o que realmente aconteceu ".
user603
Acredito que Taleb tinha algo convincente a dizer sobre os problemas de tomar decisões apenas a partir de dados históricos :-). (Os dados históricos geralmente não revelam diretamente os eventos raros, mas possivelmente fatais, do "cisne negro" até que seja tarde demais.)
whuber
2
... como a maioria dos perus virá a perceber em algumas semanas.
21912 Ryogi
Para expandir o ponto de @ user603 - você deseja fazer inferências fora de sua amostra. Em particular, o ponto de sua alocação de ativos está relacionado ao comportamento futuro , não ao passado. Isso inclui, por exemplo, como as coisas se comportam na cauda, ​​onde você tem poucas observações. Você pode trazer conhecimento / compreensão / preconceitos adicionais sobre o processo por meio de premissas distributivas. Se essas suposições estiverem próximas da direita, você poderá adicionar muitas informações.
Glen_b -Reinstala Monica

Respostas:

5

O uso de uma distribuição assumida (isto é, análise paramétrica) reduzirá o custo computacional do seu método. Estou assumindo que você gostaria de executar uma tarefa de regressão ou classificação. Isso significa que em algum momento você estimará a distribuição de alguns dados. Métodos não paramétricos são úteis quando os dados não estão em conformidade com uma distribuição bem estudada, mas geralmente levam mais tempo para computar ou mais memória para armazenar.

Além disso, se os dados são gerados por um processo que está em conformidade com uma distribuição, como eles são uma média de alguns processos uniformemente aleatórios, o uso dessa distribuição faz mais sentido. No caso da média de um conjunto de variáveis ​​uniformes, a distribuição correta provavelmente é a distribuição gaussiana.

James
fonte
0

Complementando a resposta de James : os modelos paramétricos também (geralmente) exigem menos amostras para ter um bom ajuste: isso pode aumentar seu poder de generalização: ou seja, eles podem prever novos dados melhor, mesmo estando errados. Obviamente, isso depende da situação, dos modelos e do tamanho da amostra.

loucura
fonte