Estatística suficiente, problemas específicos / intuição

Estou me ensinando algumas estatísticas por diversão e tenho alguma confusão em relação a estatísticas suficientes . Vou escrever minhas confusões em formato de lista:

Se uma distribuição tiver parâmetros, ela terá estatísticas suficientes? $n$ $n$
Existe algum tipo de correspondência direta entre as estatísticas suficientes e os parâmetros? Ou as estatísticas suficientes servem apenas como um pool de "informações" para que possamos recriar a configuração para calcular as mesmas estimativas para os parâmetros da distribuição subjacente.
Todas as distribuições têm estatísticas suficientes? ie o teorema da fatoração pode falhar?
Usando nossa amostra de dados, assumimos uma distribuição da qual é mais provável que os dados sejam e, em seguida, podemos calcular estimativas (por exemplo, o MLE) para os parâmetros para a distribuição. Estatísticas suficientes são uma maneira de poder calcular as mesmas estimativas para os parâmetros sem precisar confiar nos próprios dados, certo?
Todos os conjuntos de estatísticas suficientes terão uma estatística suficiente?

Este é o material que estou usando para tentar entender o assunto: https://onlinecourses.science.psu.edu/stat414/node/283

Pelo que entendi, temos um teorema de fatoração que separa a distribuição conjunta em duas funções, mas não entendo como somos capazes de extrair a estatística suficiente depois de fatorar a distribuição em nossas funções.

A questão de Poisson dada neste exemplo teve uma fatoração clara, mas foi afirmado que as estatísticas suficientes eram a média da amostra e a soma da amostra. Como soubemos que essas eram estatísticas suficientes apenas observando a forma da primeira equação?
Como é que é possível realizar as mesmas estimativas MLE usando estatísticas suficientes se a segunda equação do resultado fatoração, por vezes, vai depender dos valores de dados si mesmos? Por exemplo, no caso de Poisson, a segunda função dependia do inverso do produto dos fatoriais dos dados, e não teríamos mais os dados! $X_i$
Por que o tamanho da amostra não seria uma estatística suficiente em relação ao exemplo de Poisson na página da web ? Exigiríamos que reconstruísse certas partes da primeira função. Por que também não é uma estatística suficiente? $n$ $n$

mathematical-statistics sufficient-statistics Kimchi
fonte

Apenas uma pergunta rápida e esclarecedora - de qual "ângulo" você vem a suficiência? Máxima probabilidade? Bayesiano? Entropia máxima? Teoria da amostragem? Algo mais?

probabilityislogic

Eu estava vindo do ponto de vista do MLE, desculpe se minha postagem não foi a melhor, é a minha primeira postagem neste fórum!

Kimchi

Respostas:

Você provavelmente se beneficiaria da leitura sobre suficiência em qualquer livro sobre estatística teórica, onde a maioria dessas perguntas será abordada em detalhes. Resumidamente ...

$(0,\theta)$ $\theta$ $(\theta-1,\theta+1)$
Não sei o que você quer dizer com "correspondência direta"; a alternativa que você dá parece uma maneira justa de descrever estatísticas suficientes.
Sim: trivialmente os dados como um todo são suficientes. (Se você ouvir alguém dizer que não há estatística suficiente, isso significa que não há estatística de baixa dimensão.)
Sim, essa é a ideia. (O que resta - a distribuição dos dados depende da estatística suficiente - pode ser usada para verificar a suposição distributiva independentemente do (s) parâmetro (s) desconhecido (s).)
Aparentemente, não, embora eu entenda que os contra-exemplos não são distribuições que você provavelmente desejará usar na prática. [Seria bom se alguém pudesse explicar isso sem entrar muito na teoria da medida.]

Em resposta a outras perguntas ...

$\mathrm{e}^{-n\lambda}\cdot\lambda^{\sum{x_i}}$ $\lambda$ $\sum x_i$ $\sum x_i$ $\sum x_i$ $\sum x_i/n$ $(\sum x_i)^2$
$\tfrac{1}{x_1! x_2! \ldots x_n!}$ $\lambda$ $\lambda$ $f(x;\lambda)$
$n$

$\sum x_i$

$n$ $N$ $(\sum x_i,n)$ $n$ $\theta$ $\sum x_i$

Scortchi - Restabelecer Monica
fonte

Eu adoraria ver os contraexemplos de 5. Tentei provar o contrário por um tempo com o Lema de Zorn, mas ele quebra em um ponto. Mas, pelo que reuni, o contra-exemplo deve ser realmente esquisito. Você tem algum ponto de referência onde eu possa encontrá-lo? Não me importo que isso seja pesado na teoria da medida.

Sjm.majewski

@ sjm.majewski: Lehmann fornece a Pitcher (1957), "Conjuntos de medidas que não admitem estatísticas ou subcampos necessários e suficientes", Ann. Matemática. Statist. , 28 , p267-268; e Landers e Rogge (1973). "Sobre suficiência e invariância", Ann. Statist. , 1 , p543-544.

Scortchi - Restabelece Monica