Pergunta simples, mas para a qual não encontrei a resposta exata em outro lugar. Quantos momentos de uma distribuição de probabilidade discreta com suporte finito são necessários para identificar exclusivamente a função exata da massa de probabilidade? Suponha que sabemos que a distribuição tem suporte no máximo pontos dentro de um intervalo limitado (para meus propósitos o intervalo é ), mas não sabemos os pontos.
É o caso de a distribuição ser identificada exclusivamente por alguns momentos? Minha hipótese é que podem ser os primeiros momentos . Como temos que identificar pontos de massa e suas probabilidades individuais, pode-se pensar que precisamos de equações e cada momento nos dá uma equação, mais a restrição que as probabilidades somam a . Mas essas equações não são lineares nos pontos de massa, portanto, não é imediatamente óbvio para mim que estamos identificados.
Estou ciente do Problema do Momento Hausdorff , por isso sei que uma sequência infinita de momentos identifica exclusivamente qualquer distribuição limitada, mas estou particularmente interessado em restringir ainda mais o domínio a distribuições com suporte finito. Qualquer referência também seria apreciada!
Obrigado!
fonte
Respostas:
Seja a distribuição suportada nos números que atribui probabilidades a cada Por definição, seu momento (bruto) do grau éF x1<x2<…<xn pi>0 xi. k
Começarei com uma série de observações sobre essa situação, cada uma interessada por si mesma. Uma ferramenta básica é a sequência de vetores para Escrevendo cada momento pode ser expresso como um produto vetorialxk=(xk1,xk2,…,xkn) k=0,1,…,n−1. p=(p1,p2,…,pn),
A coleção é linearmente independente.{x0,x1,…,xn−1} Para mostrar isso, assuma o contrário: ou seja, permita que os coeficientes nem todos sejam zero de tal modo que Escrito componente por componente, afirma que para cada Isso exibe cada como raiz do polinômioTal polinômio tem no máximo raízes distintas, contradizendo a distinção dock ∑k=0n−1ckxk=0.(1) (1) i=1,2,…,n, ∑k=0n−1ckxki=0. xi c(T)=cn−1Tn−1+cn−2Tn−2+⋯+c0. deg(c)≤n−1 n xi.
Todos os momentos são determinados pelos primeiros momentosn μ0,μ1,…,μn−1. O resultado anterior mostra que os vetores são uma base para Portanto, para qualquer é uma combinação linear deou seja, existem coeficientes (determinados exclusivamente pelo ) para os quais ConsequentementeX={xk,k=0,1,…,n−1}, Rn. m, xm xk, k=0,1,…,n−1; mak xi xm=ma0x0+ma1x1+⋯+man−1xn−1. μm=px′m=p∑i=0n−1makx′k=∑i=0n−1makpx′k=∑i=0n−1makμk.
Os números e os primeiros momentos determinamxi n p. De fato, os primeiros momentos são os coeficientes de na base dupla den p X.
Os primeiros momentos de determinam e são determinados pela distribuição deslocada por uma constanten F λ. Essa é a distribuição suportada em com probabilidades A demonstração é direta: use o teorema do para expandir em termos dex1−λ,x2−λ,…,xn−λ pi. (xi−λ)k x0i,x1i,…,xki.
Parte da pergunta é, se existem um vector de probabilidade positiva e pontos de suporte determinando uma distribuição possuindo a mesmos momentos que Suponha que exista. Mude ambas as distribuições por simplificando a situação para distribuições com suporte não negativo . Ao assumir arbitrariamente grande, os maiores pontos de suporte acabam dominando os momentos: Isso só é possível quando en′, q, y1<y2<…<yn′, G F. λ=−min(x1,y1), m qn′ymn′≈μm≈pnxmn qn′=pn yn′=xn. Continuando indutivamente, concluímos e isto é,n=n′, q=p, x1=y1: G=F.
Por fim, quantos momentos precisam ser conhecidos para determinar e ? Considere o mapa definido porSua derivada é a matrizp x f:Rn×Rn≈R2n→R2n f(p′,x′)=(px′0,px′1,…,px′2n−1)′. 2n×2n
com uma estrutura semelhante a Vandermonde, permitindo obter uma fórmula simples para seu determinante,
Como nenhum dos é zero e todos os são distintos, isso é diferente de zero. O teorema da função inversa implica que é invertível localmente: ou seja, desde que esteja no intervalo de , existe um inverso em uma vizinhança de Isso é,pi xi f μ=(μ0,μ1,…,μ2n−1) f f−1⊂Rn×Rn μ.
Como já mostramos, todas essas soluções correspondem à mesma distribuição: elas diferem apenas ao permutar os índices das variáveis.1,2,…,n
fonte