Eu tenho uma situação em que sou capaz de estimar (o primeiro) momentos de um conjunto de dados e gostaria de usá-lo para produzir uma estimativa da função de densidade.
Eu já me deparei com a distribuição da Pearson , mas percebi que ela depende apenas dos 4 primeiros momentos (com algumas restrições nas possíveis combinações de momentos).
Também entendo que qualquer conjunto finito de momentos não é suficiente para "definir" uma distribuição específica, quando não se usa mais suposições. No entanto, eu ainda gostaria de ter uma classe mais geral de distribuições (além da família de distribuições Pearson). Olhando para outras questões, não consegui encontrar essa distribuição (veja: aqui , aqui , aqui , aqui , aqui e aqui ).
Existe alguma família de distribuição generalizada ("simples") que pode ser definida para qualquer conjunto de momentos? (talvez um conjunto de transformações que possam pegar uma distribuição normal padrão e transformá-la até confirmar com todo o conjunto de momentos)k
(Não me importo muito se assumirmos que os outros momentos são 0 ou não)
Obrigado.
ps: eu ficaria feliz por um exemplo extenso. De preferência com um exemplo de código R.
fonte
Respostas:
Método 1: Sistemas Pearson de ordem superior
O sistema Pearson é, por convenção, considerado a família de soluções para a equação diferencial:p(x)
onde os quatro parâmetros de Pearson podem ser expressos em termos dos quatro primeiros momentos da população.(a,c0,c1,c2)
Em vez de basear o sistema Pearson no quadrático , pode-se considerar o uso de polinômios de ordem superior como a pedra fundamental. Assim, por exemplo, pode-se considerar um sistema no estilo Pearson baseado em um polinômio cúbico. Esta será a família de soluções para a equação diferencial: p ( x )c0+c1x+c2x2 p(x)
que produz a solução:
Eu resolvi isso por diversão há algum tempo (tendo o mesmo sistema de pensamento do OP): a derivação e a solução são apresentadas no capítulo 5 do nosso livro; se estiver interessado, um download gratuito está disponível aqui:
http://www.mathstatica.com/book/bookcontents.html
Observe que, enquanto a família Pearson de segunda ordem (quadrática) pode ser expressa em termos dos 4 primeiros momentos, a família de estilo Pearson de terceira ordem (cúbica) requer os 6 primeiros momentos.
Método 2: expansões de Gram-Charlier
Expansões Gram-Charlier também são discutidos no mesmo capítulo 5 (ver secção 5.4) ... e também permitem construir uma densidade equipada, com base em arbitrariamente grandes momentos. Como o OP sugere, a expansão de Gram-Charlier expressa o pdf ajustado em função de uma série de derivadas do pdf normal normal, conhecido como polinômio Hermite. Os coeficientes de Gram-Charlier são resolvidos em função dos momentos da população ... e quanto maior a expansão, mais momentos são necessários. Você também pode querer analisar as expansões relacionadas à Edgeworth.kth
Momentos da população ou momentos da amostra?
Para o sistema no estilo Pearson: se os momentos da população são conhecidos, o uso de momentos mais altos deve produzir de forma inequívoca um melhor ajuste. Se, no entanto, os dados observados forem uma amostra aleatória retirada da população, existe um trade-off: um polinômio de ordem superior implica que momentos de ordem superior são necessários, e as estimativas deste último podem não ser confiáveis (têm alta variação), a menos que o tamanho da amostra seja 'grande'. Em outras palavras, dados de amostra fornecidos, o ajuste usando momentos mais altos pode se tornar 'instável' e produzir resultados inferiores. O mesmo vale para as expansões de Gram-Charlier: adicionar um termo extra pode realmente resultar em um ajuste pior, portanto, é necessário algum cuidado.
fonte