Quantos momentos definem exclusivamente uma distribuição com suporte finito?

Pergunta simples, mas para a qual não encontrei a resposta exata em outro lugar. Quantos momentos de uma distribuição de probabilidade discreta com suporte finito são necessários para identificar exclusivamente a função exata da massa de probabilidade? Suponha que sabemos que a distribuição tem suporte no máximo pontos dentro de um intervalo limitado (para meus propósitos o intervalo é ), mas não sabemos os pontos. $N$ $[0, 1]$

É o caso de a distribuição ser identificada exclusivamente por alguns momentos? Minha hipótese é que podem ser os primeiros momentos . Como temos que identificar pontos de massa e suas probabilidades individuais, pode-se pensar que precisamos de equações e cada momento nos dá uma equação, mais a restrição que as probabilidades somam a . Mas essas equações não são lineares nos pontos de massa, portanto, não é imediatamente óbvio para mim que estamos identificados. $2N-1$ $N$ $N$ $2N$ $1$

Estou ciente do Problema do Momento Hausdorff , por isso sei que uma sequência infinita de momentos identifica exclusivamente qualquer distribuição limitada, mas estou particularmente interessado em restringir ainda mais o domínio a distribuições com suporte finito. Qualquer referência também seria apreciada!

Obrigado!

probability moments simultaneous-equation housed_off_space
fonte

Se os pontos do conjunto de suporte estiverem uniformemente espaçados, posso provar que você só precisa conhecer os primeiros momentos . Isto é porque a função de geração de momento, então, ser um th polinomial grau de , neste caso, e qualquer polinomial de grau é determinado unicamente se conhecem os primeiros derivados num ponto, o que naturalmente é apenas quais são os momentos Não vejo uma maneira óbvia de provar isso no caso mais geral em que os pontos de suporte não são igualmente espaçados. Suspeito que você precise conhecer toda a sequência infinita de momentos.

N + 1

$N+1$

N

$N$

e^{t}

$e^t$

n

$n$

n + 1

$n+1$

Olooney 5/07

No caso não uniformemente espaçado, você tem um exemplo simples em que não é possível determinar os pontos de massa e seus pesos com momentos? Ou uma intuição de por que você acha que alguém precisaria da sequência infinita completa?

2 N + 1

$2N + 1$

Housed_off_space 5/07/19

Um exemplo contrário seria muito difícil de produzir; no mínimo, exigiria pelo menos três pontos de apoio, nem todos com proporções racionais. O conjunto não pode fornecer um exemplo de contador, porque esse também é um polinômio em . Um conjunto como pode fornecer um exemplo contrário.

{0, \frac{1}{3}, 1}

$\{0, \frac{1}{3}, 1\}$

e^{t / 3}

$e^{t/3}$

{0, \frac{π}{4}, 1}

$\{ 0, \frac{\pi}{4}, 1 \}$

21419 olooney

Eu acho que pode exigir uma sequência infinita, porque é isso que é verdade em geral. Para determinar exclusivamente uma função analítica (a função característica e mgf de uma distribuição discreta são analíticas porque é a soma de muitas funções analíticas finitas), precisamos conhecer 1) o valor da função em uma sequência infinita de pontos ou 2 ) todas as derivadas da função em um único ponto ou 3) o valor da função em qualquer disco aberto em torno de um ponto. Uma amostra finita, ou conhecendo apenas finitamente muitos derivados, não é suficiente para determiná-la exclusivamente.

28519 olooney

A razão pela qual podemos fazer com que os polinômios funcionem é porque eles têm uma estrutura especial - em particular, todo derivado após um certo ponto é zero. A estrutura da função característica também é especial: ela é da forma . Mas isso é especial o suficiente? Talvez; Só não sei como provar.

\sum_{k = 1}^{N} p_{k} e^{x_{k} t}

$\sum_{k=1}^N p_k e^{{x_k}t}$

28519 olooney

Seja a distribuição suportada nos números que atribui probabilidades a cada Por definição, seu momento (bruto) do grau é $F$ $x_1 \lt x_2 \lt \ldots \lt x_n$ $p_i \gt 0$ $x_i.$ $k$

μ_{k} = \sum_{i = 1}^{n} p_{i} x_{i}^{k} .

$\mu_k = \sum_{i=1}^n p_i x_i^k.$

Começarei com uma série de observações sobre essa situação, cada uma interessada por si mesma. Uma ferramenta básica é a sequência de vetores para Escrevendo cada momento pode ser expresso como um produto vetorial $\mathbf{x}_k = (x_1^k, x_2^k, \ldots, x_n^k)$ $k=0, 1, \ldots,n-1.$ $\mathbf{p} = (p_1,p_2,\ldots, p_n),$

μ_{k} = \sum_{i = 1}^{n} p_{i} x_{i}^{k} = p x_{k}^{'} .

$\mu_k = \sum_{i=1}^n p_i x_i^k = \mathbf{p}\, \mathbf{x}_k^\prime.$

A coleção é linearmente independente. $\{\mathbf{x}_0,\mathbf{x}_1, \ldots, \mathbf{x}_{n-1}\}$ Para mostrar isso, assuma o contrário: ou seja, permita que os coeficientes nem todos sejam zero de tal modo que Escrito componente por componente, afirma que para cada Isso exibe cada como raiz do polinômioTal polinômio tem no máximo raízes distintas, contradizendo a distinção do $c_k$
$\begin{matrix} (1) & \sum_{k = 0}^{n - 1} c_{k} x_{k} = 0 . \end{matrix}$ $\sum_{k=0}^{n-1} c_k \mathbf{x}_k = \mathbf{0}.\tag{1}$ $(1)$ $i=1,2,\ldots, n,$ $\sum_{k = 0}^{n - 1} c_{k} x_{i}^{k} = 0.$ $\sum_{k=0}^{n-1} c_k x_i^k = 0.$ $x_i$ $c(T)=c_{n-1}T^{n-1}+c_{n-2}T^{n-2}+\cdots + c_0.$ $\operatorname{deg}(c)\le n-1$ $n$ $x_i.$
Todos os momentos são determinados pelos primeiros momentos $n$ $\mu_0,\mu_1,\ldots,\mu_{n-1}.$ O resultado anterior mostra que os vetores são uma base para Portanto, para qualquer é uma combinação linear deou seja, existem coeficientes (determinados exclusivamente pelo ) para os quais Consequentemente $\mathcal{X} = \{\mathbf{x}_k,k=0,1,\ldots, n-1\},$ $\mathbb{R}^n.$ $m,$ $\mathbf{x}_m$ $\mathbf{x}^k,$ $k=0,1,\ldots,n-1;$ $\,_ma_k$ $x_i$
$x_{m} =_{m} a_{0} x_{0} +_{m} a_{1} x_{1} + \dots +_{m} a_{n - 1} x_{n - 1} .$ $\mathbf{x}_m = \,_ma_0\mathbf{x}_0 + \,_ma_1\mathbf{x}_1 + \cdots + \,_ma_{n-1}\mathbf{x}_{n-1}.$ $μ_{m} = p x_{m}^{'} = p \sum_{i = 0}^{n - 1}_{m} a_{k} x_{k}^{'} = \sum_{i = 0}^{n - 1}_{m} a_{k} p x_{k}^{'} = \sum_{i = 0}^{n - 1}_{m} a_{k} μ_{k} .$ $\mu_m = \mathbf{p}\,\mathbf{x}_m^\prime = \mathbf{p}\,\sum_{i=0}^{n-1}\,_ma_k \mathbf{x}_k^\prime = \sum_{i=0}^{n-1}\,_ma_k \mathbf{p}\,\mathbf{x}_k^\prime= \sum_{i=0}^{n-1}\,_ma_k \mu_k.$
Os números e os primeiros momentos determinam $x_i$ $n$ $\mathbf{p}.$ De fato, os primeiros momentos são os coeficientes de na base dupla de $n$ $\mathbf{p}$ $\mathcal X.$
Os primeiros momentos de determinam e são determinados pela distribuição deslocada por uma constante $n$ $F$ $\lambda.$ Essa é a distribuição suportada em com probabilidades A demonstração é direta: use o teorema do para expandir em termos de $x_1-\lambda, x_2-\lambda, \ldots, x_n-\lambda$ $p_i.$ $(x_i-\lambda)^k$ $x_i^0, x_i^1, \ldots, x_i^k.$

Parte da pergunta é, se existem um vector de probabilidade positiva e pontos de suporte determinando uma distribuição possuindo a mesmos momentos que Suponha que exista. Mude ambas as distribuições por simplificando a situação para distribuições com suporte não negativo . Ao assumir arbitrariamente grande, os maiores pontos de suporte acabam dominando os momentos: Isso só é possível quando e $n^\prime,$ $\mathbf{q},$ $y_1\lt y_2\lt \ldots \lt y_{n^\prime},$ $G$ $F.$ $\lambda=-\min(x_1,y_1),$ $m$

q_{n^{'}} y_{n^{'}}^{m} \approx μ_{m} \approx p_{n} x_{n}^{m}

$q_{n^\prime} y_{n^\prime}^m \approx \mu_m \approx p_n x_n^m$

q_{n^{'}} = p_{n}

$q_{n^\prime}=p_n$

y_{n^{'}} = x_{n} .

$y_{n^\prime} = x_n.$ Continuando indutivamente, concluímos e isto é,

n = n^{'},

$n=n^\prime,$

q = p,

$\mathbf{q}=\mathbf{p},$

x_{1} = y_{1} :

$\mathbf{x}_1=\mathbf{y}_1:$

G = F .

$G=F.$

Por fim, quantos momentos precisam ser conhecidos para determinar e ? Considere o mapa definido porSua derivada é a matriz $\mathbf{p}$ $\mathbf{x}$ $f:\mathbb{R}^n\times \mathbb{R}^n\approx \mathbb{R}^{2n}\to\mathbb{R}^{2n}$

f (p^{'}, x^{'}) = (p x_{0}^{'}, p x_{1}^{'}, \dots, p x_{2 n - 1}^{'})^{'} .

$f(\mathbf{p}^\prime, \mathbf{x}^\prime) = (\mathbf{p}\mathbf{x}_0^\prime, \mathbf{p}\mathbf{x}_1^\prime, \ldots, \mathbf{p}\mathbf{x}_{2n-1}^\prime)^\prime.$

2 n \times 2 n

$2n\times 2n$

D f (p^{'}, x^{'}) = (\begin{matrix} 1 & \dots & 1 & 0 & \dots & 0 \\ x_{1} & \dots & x_{n} & p_{1} & \dots & p_{n} \\ x_{1}^{2} & \dots & x_{n}^{2} & 2 p_{1} x_{1} & \dots & 2 p_{n} x_{n} \\ ⋮ & \dots & ⋮ & ⋮ & \dots & ⋮ \\ x_{1}^{2 n - 1} & \dots & x_{n}^{2 n - 1} & (2 n - 1) p_{1} x_{1}^{2 n - 2} & \dots & (2 n - 1) p_{n} x_{n}^{2 n - 2} \end{matrix})

$Df(\mathbf{p}^\prime, \mathbf{x}^\prime) = \pmatrix{1 & \cdots & 1 & 0 & \cdots & 0 \\ x_1 & \cdots & x_n & p_1 & \cdots & p_n \\ x_1^2 & \cdots & x_n^2 & 2p_1x_1 & \cdots & 2p_n x_n \\ \vdots & \cdots & \vdots & \vdots & \cdots & \vdots \\ x_1^{2n-1} & \cdots & x_n^{2n-1} & (2n-1)p_1x_1^{2n-2} & \cdots & (2n-1)p_nx_n^{2n-2}}$

com uma estrutura semelhante a Vandermonde, permitindo obter uma fórmula simples para seu determinante,

Det (D f (p^{'}, x^{'})) = - (p_{1} p_{2} \dots p_{n})^{2 n} {(\prod_{1 \leq i < j \leq n} (x_{i} - x_{j}))}^{4} .

$\operatorname{Det}\left(Df(\mathbf{p}^\prime, \mathbf{x}^\prime)\right) = -(p_1p_2\cdots p_n)^{2n} \left(\prod_{1\le i\lt j \le n}(x_i-x_j)\right)^4.$

Como nenhum dos é zero e todos os são distintos, isso é diferente de zero. O teorema da função inversa implica que é invertível localmente: ou seja, desde que esteja no intervalo de , existe um inverso em uma vizinhança de Isso é, $p_i$ $x_i$ $f$ $\mathbf{\mu}=(\mu_0,\mu_1,\ldots,\mu_{2n-1})$ $f$ $f^{-1}\subset\mathbb{R}^n\times \mathbb{R}^n$ $\mathbf{\mu}.$

Os primeiros momentos determinam um conjunto discreto de soluções correspondentes a esses momentos. $2n$ $\mu_0,\mu_1,\ldots,\mu_{2n-1}$ $(\mathbf{p},\mathbf{x})$

Como já mostramos, todas essas soluções correspondem à mesma distribuição: elas diferem apenas ao permutar os índices das variáveis. $1,2,\ldots, n$

whuber
fonte

Como passamos de localmente invertível para único? A função é localmente invertível perto de 0, mas isso não impede que também seja verdadeiro, porque está fora do bairro onde funciona. Por que não poderia haver algum ponto fora do bairro, de modo que também seja igual a ?

\sin (x)

$\sin(x)$

\sin (π) = 0

$\sin(\pi) = 0$

π

$\pi$

(- π / 2, π / 2)

$(-\pi/2, \pi/2)$

\sin^{- 1}

$\sin^{-1}$

(p^{″}, x^{″})

$(\mathbf{p}'', \mathbf{x}'')$

f (p^{″}, x^{″})

$f(\mathbf{p}'', \mathbf{x}'')$

(μ_{0}, . . ., μ_{2 n - 1})

$(\mu_0, ..., \mu_{2n-1})$

olooney 6/07/19

@olooney Eu provei a exclusividade primeiro, no sentido de que há uma distribuição única determinada pelas informações: veja o parágrafo começando com "parte da pergunta". Você está certo de que localmente invertível não define uma função única esse é o ponto da observação final. De fato, existemsoluções.

f :

$f:$

n!

$n!$

whuber

Quantos momentos definem exclusivamente uma distribuição com suporte finito?

Respostas: