Não consegui encontrar isso na literatura, mas isso provavelmente significa que estou procurando no lugar errado. Eu estou procurando encontrar a distribuição preditiva freqüentista, supondo que ela exista, para uma variável Cauchy unidimensional e n-dimensional.
O problema com a versão n-dimensional é que não há nada como uma matriz covariável; em vez disso, existe apenas um parâmetro de escala que torna os erros hiper-circulares. Eu pude ver isso interferindo na existência de um valor crucial.
EDITAR
Eu estou procurando prever partir de um conjunto de observações extraído de uma distribuição de Cauchy com centro e escala \ sigma, ou prever y_ {i + 1} a partir de alguma equação y = mx + b, onde x é extraído de uma distribuição de Cauchy como acima. Pode ser um vetor ou multidimensional, mas estou tentando determinar as propriedades relativas da previsão Bayesiana versus Frequentista. Meus dados são extraídos de um Cauchy truncado ou um Cauchy, dependendo de qual conjunto.
Um intervalo de previsão funcionará, pois apenas definirei o intervalo para 100%.
fonte
Respostas:
A solução geral para o seu problema é a estimativa de máxima verossimilhança (MLE) dos seus parâmetros . Uma vez que eles são obtidos comoθ θ^ , você os substitui no seu pdf pelos parâmetros desconhecidos, ou seja, estima o pdf da sua variável aleatória como f^(xi)=f(xi|θ^) . Isso permite que você construa a distribuição preditiva de sua variável aleatória Cauchy.
Para o caso univariado , este artigo é um excelente recurso . Para o Cauchy univariado com centroμ e escala σ , um tem um formulário fechado se você tiver 3 - 4 observações. Se você temn > 4 observações, o MLE existe∗ . Se você temn observações, você terá que resolver duas equações que são facilmente derivadas definindo a primeira derivada da probabilidade logarítmica como zero; veja aqui a forma exata. (Na notação deles,x0 0= μ e σ= γ .) A solução desse problema numericamente tem uma implementação na linguagem R, veja aqui .
Para o caso multivariado , tudo o que você precisa observar é que a distribuição multivariada de Cauchy é simplesmente uma distribuição multivariadat -distribuição em que o parâmetro grau de liberdade está definido como 1 1 , como já foi apontado nos comentários. Para os multivariadost , você pode fazer inferência do MLE como explicado excelentemente nesta resposta , que se baseia no artigo que eric_kernfeld apontou. Não encontrei uma implementação pronta para esse algoritmo, mas como você verá quando examinar a resposta fornecida no post, será realmente fácil implementá-la.
Diferença da previsão bayesiana : No cenário bayesiano, você colocaria um prévio nos parâmetrosμ e σ , modelando sua incerteza sobre eles como uma variável aleatória. Assim, você obterá distribuições posteriores para ambos os parâmetros, que indicam a certeza relativa que você tem sobre eles, dados seus dados. Se você tem a parte posteriorq( μ , σ|x1 1, ... ,xn) , você obtém sua distribuição preditiva como ∫f( x | μ , σ) q( μ , σ|x1 1, ... ,xn) dμ dσ , integrando sua incerteza. Por outro lado, a configuração do MLE fornecerá estimativas pontuais deμ e σ que você conecte no formulário funcional do seu pdf. Equivalentemente, você poderia dizer que o MLE leva a um posterior com massa pontual1 1 na tupla (μ^,σ^) e 0 0 probabilidade em qualquer outro valor. Assim, você ignora toda a incerteza de parâmetro nesse caso e depende do fato de queθ^ é assintoticamente equivalente a θ , significa que f^( x ) → f( X ) (uniformemente x )
fonte
Pode-se usar um método de Monte Carlo para obter estimativas empíricas para as relações entre osx1 1. . . .xEu e o intervalo de previsão para xi + n .
Motivação: Se estimarmos o intervalo de previsão com base nos quartis / CDF de uma distribuição que segue das estimativas de probabilidade máxima (ou outro tipo de estimativa de parâmetros), subestimamos o tamanho do intervalo. Efetivamente, na prática, o pontoxi + n cairá fora da faixa com mais frequência do que o previsto.
A figura abaixo demonstra o quanto subestimamos o tamanho do intervalo, expressando quantas vezes mais uma nova mediçãoxEu está fora do intervalo preditivo com base nas estimativas de parâmetros. (com base em cálculos com 2000 repetições para a previsão)
Por exemplo, se usarmos um intervalo de previsão de 99% (portanto, esperamos 1% de erros), obteremos 5 vezes mais erros se o tamanho da amostra for 3.
Esse tipo de cálculo pode ser usado para estabelecer relações empíricas sobre como podemos corrigir o intervalo, assim como os cálculos mostram que, para grandesn a diferença se torna menor (e em algum momento pode-se considerar irrelevante).
fonte
Parece que tudo que você precisa é estimar os parâmetros da distribuição de Cauchy a partir do conjunto de dadosxi . Aqui está o que Stephens propõe, não é o MLE, e o autor afirma que esse método é consistente e mais estável que o MLE, embora você deva levar em conta que isso foi escrito no século passado.
onde Cauchy é parametrizado da seguinte maneira:
Depois de ter a distribuição, sua previsão de pontos seráα^ . Observe que, como não há momentos, você não poderá mostrar que sua previsão é ótima no sentido usual, como minimizar o custo quadrado esperado.
fonte