Na medida em que meu conhecimento agregado (e escasso) sobre estatística permite, entendi que se são suas variáveis aleatórias, como o termo implica, elas são independentes e distribuídas de forma idêntica.
Minha preocupação aqui é a antiga propriedade das amostras de iid, que diz:
para qualquer coleção de st diferente de .
No entanto, sabe-se que o agregado de amostras independentes de distribuições idênticas fornece informações sobre a estrutura de distribuição e, como resultado, sobre no caso acima; portanto, não deve ser o caso em que: p ( X n | X I 1 , X i 2 , . . . , X i k ) = p ( x n ) .
Sei que sou vítima de falácia, mas não sei por quê. Por favor me ajude neste.
Respostas:
Eu acho que você está confundindo um modelo estimado de uma distribuição com uma variável aleatória . Vamos reescrever a suposição de independência da seguinte maneira: que diz que se você conhece a distribuição subjacente de (e, por exemplo, pode identificá-la por um conjunto de parâmetros ), a distribuição não muda, pois você observou algumas amostras dela. Xnθ
Por exemplo, pense em como a variável aleatória que representa o resultado do ésimo lançamento de uma moeda. Conhecer a probabilidade de cabeça e cauda da moeda (que, suponha, está codificada em ) é suficiente para conhecer a distribuição de . Em particular, o resultado dos lançamentos anteriores não altera a probabilidade de cabeça ou cauda para o ésimo lançamento e vale. n θ X n n ( 1 )Xn n θ Xn n ( 1 )
Observe, no entanto, que .P(θ|Xn)≠P(θ|Xi1,Xi2,…,Xik)
fonte
Se você adotar uma abordagem bayesiana e tratar parâmetros que descrevem a distribuição de como uma variável / vetor aleatório, as observações realmente não são independentes, mas seriam condicionalmente independentes, dado o conhecimento de portanto, aguentaria.θ P ( X n ∣ X n - 1 , … X 1 , θ ) = P ( X n ∣ θ )X θ P( Xn∣ Xn - 1, … X1, θ ) = P( Xn∣ θ )
Em uma abordagem estatística clássica, não é uma variável aleatória. Os cálculos são feitos como se soubéssemos o que é . Em certo sentido, você está sempre condicionando (mesmo que não saiba o valor).θ θθ θ θ
Quando você escreveu "... forneça informações sobre a estrutura de distribuição e, como resultado, sobre ", você estava adotando implicitamente uma abordagem bayesiana, mas não exatamente. Você está escrevendo uma propriedade de amostras de IID que um frequentista escreveria, mas a declaração correspondente em uma configuração bayesiana envolveria condicionamento em . θXn θ
Estatísticos bayesianos vs. clássicos
Seja o resultado de lançar uma moeda desigual e injusta. Não sabemos a probabilidade da moeda cair na cara.xEu
A idéia principal aqui é que o estatístico bayesiano estende as ferramentas de probabilidade para situações em que o estatístico clássico não . Para o freqüentador, não é uma variável aleatória porque possui apenas um valor possível ! Vários resultados não são possíveis! Porém, na imaginação bayesiana, vários valores de são possíveis, e o bayesiano está disposto a modelar essa incerteza (em sua própria mente) usando as ferramentas da probabilidade.θ θ
Para onde isso vai?
Digamos que jogamos a moeda vezes. Um flip não afeta o resultado do outro. O estatístico clássico chamaria esses flips independentes (e de fato são). Teremos: Onde é desconhecido parâmetro. (Lembre-se, nós não sabemos o que é, mas é não uma variável aleatória! É algum número.)P (n
Um bayesiano profundamente envolvido na probabilidade subjetiva diria que o que importa é a probabilidade da perspectiva dela! . Se ela vê 10 cabeças seguidas, uma 11ª cabeça é mais provável porque 10 cabeças seguidas levam a acreditar que a moeda é desequilibrada em favor das cabeças.
O que aconteceu aqui? O que está diferente?! Atualizando crenças sobre uma variável aleatória latente ! Se for tratado como uma variável aleatória, os flips não serão mais independentes. Mas, os flips são condicionalmente independentes, dado o valor de .θ θ θ
Condicionar em em certo sentido, conecta como o estatístico bayesiano e o estatístico clássico modelam o problema. Ou, em outras palavras, o freqüentista e o estatístico bayesiano concordarão se as condições bayesianas se mantêm em .θθ θ
Notas adicionais
Eu tentei o meu melhor para dar uma breve introdução aqui, mas o que eu fiz é, na melhor das hipóteses, bastante superficial e os conceitos são, em certo sentido, bastante profundos. Se você quiser mergulhar na filosofia da probabilidade, o livro de Savage de 1954, Foundation of Statistics é um clássico. Google para bayesian vs. frequentist e uma tonelada de coisas surgirão.
Outra maneira de pensar sobre os desvios da IID é o teorema de Finetti e a noção de permutabilidade . Em uma estrutura bayesiana, a permutabilidade é equivalente à independência condicional em alguma variável aleatória latente (neste caso, a desigualdade da moeda).
fonte