Isso pode ser o mesmo que as perguntas mais bobas já feitas neste fórum, mas, depois de ter recebido respostas sólidas e significativas para uma pergunta anterior, pensei em estender minha sorte novamente.
Há muito tempo fico confuso sobre a importância das distribuições estatísticas, especialmente no que se refere ao retorno de ativos e, mais especificamente, à alocação de ativos.
Minha pergunta para ser específico é: Suponha que eu tenho 20 anos de dados de devoluções mensais do S&P 500, por que devo assumir um certo tipo de distribuição (por exemplo, voo normal / Johnson / Levy etc.) para minha decisão de alocação de ativos quando posso simplesmente apenas tomar minhas decisões de alocação de ativos com base nos dados históricos que tenho comigo?
fonte
Respostas:
O uso de uma distribuição assumida (isto é, análise paramétrica) reduzirá o custo computacional do seu método. Estou assumindo que você gostaria de executar uma tarefa de regressão ou classificação. Isso significa que em algum momento você estimará a distribuição de alguns dados. Métodos não paramétricos são úteis quando os dados não estão em conformidade com uma distribuição bem estudada, mas geralmente levam mais tempo para computar ou mais memória para armazenar.
Além disso, se os dados são gerados por um processo que está em conformidade com uma distribuição, como eles são uma média de alguns processos uniformemente aleatórios, o uso dessa distribuição faz mais sentido. No caso da média de um conjunto de variáveis uniformes, a distribuição correta provavelmente é a distribuição gaussiana.
fonte
Complementando a resposta de James : os modelos paramétricos também (geralmente) exigem menos amostras para ter um bom ajuste: isso pode aumentar seu poder de generalização: ou seja, eles podem prever novos dados melhor, mesmo estando errados. Obviamente, isso depende da situação, dos modelos e do tamanho da amostra.
fonte