Qual é o sentido intuitivo por trás do objetivo e da mecânica da estatística suficiente?

9

A definição de uma estatística suficiente é: Seja uma amostra aleatória de uma distribuição indexada por um parâmetro . Seja uma estatística. Suponha que, para todo e todo valor possível de , a distribuição conjunta condicional de desde que dependa apenas de mas não de . Então, é uma estatística suficiente para o parâmetro . θ T θ t t X 1 , . . . , X n T = t t θ T θX1,...,XnθTθtTX1,...,XnT=ttθTθ

Sinto que conheço várias peças do quebra-cabeça (como o teorema da fatoração) para entender estatísticas suficientes, mas não tenho a teoria geral em baixo.

Minhas principais perguntas são:

1) Por que eles dizem que é uma estatística suficiente para o parâmetro ? Se era a média populacional de uma distribuição normal, digamos , significa que sempre que queremos encontrar a probabilidade de, digamos, ocorrer de uma certa maneira, não precisamos o valor da média da população?q q u X 1 , . . . , X nTθθμX1,...,Xn

2) Na vida real, por que queremos usar uma estatística suficiente? Parece que apenas o cálculo da estatística não deve ser tão trabalhoso (como a soma dos X), então por que precisamos disso?

Obrigado!

user123276
fonte

Respostas:

7
  1. Não. O que eles dizem é que se é outra amostra aleatória da mesma população que os dados originais X 1 , , X n , ele contém uma quantidade igual de informações probabilísticas sobre θ . Portanto, podemos "recuperar os dados" se retermos T e descartar X 1 , ... , X n . É por isso que T é "suficiente".X1,,XnX1,,XnθTX1,,XnT

  2. Redução de dados. Se é suficiente, a "informação extra" transportada por X é inútil no que diz respeito a . Portanto, é natural considerar procedimentos de inferência que não usam essas informações irrelevantes extras. Isso leva ao Princípio da Su fi ciência: Qualquer procedimento de inferência deve depender dos dados apenas através de estatísticas suficientes.TXθ

Veja aqui mais detalhes sobre os princípios envolvidos na redução de dados.

Hibernando
fonte