Para entender isso, você precisa primeiro declarar uma versão do Teorema do Limite Central. Aqui está a declaração "típica" do teorema do limite central:
Lindeberg – Lévy CLT. Suponha que seja uma sequência de variáveis aleatórias iid com e . Deixe . Então, quando
aproxima do infinito, as variáveis aleatórias convergem na distribuição para um normal isto é,X1,X2,…E[Xi]=μVar[Xi]=σ2<∞Sn:=X1+⋯+Xnnnn−−√(Sn−μ)N(0,σ2)
n−−√((1n∑i=1nXi)−μ) →d N(0,σ2).
Então, como isso difere da descrição informal e quais são as lacunas? Existem várias diferenças entre sua descrição informal e essa descrição, algumas das quais foram discutidas em outras respostas, mas não completamente. Portanto, podemos transformar isso em três perguntas específicas:
- O que acontece se as variáveis não forem identicamente distribuídas?
- E se as variáveis tiverem variação infinita ou média infinita?
- Quão importante é a independência?
Tomando estes de cada vez,
Não distribuídos de forma idêntica . Os melhores resultados gerais são as versões de Lindeberg e Lyaponov do teorema do limite central. Basicamente, desde que os desvios padrão não cresçam muito, você pode obter um teorema do limite central decente.
Lyapunov CLT. [5] Suponha que seja uma sequência de variáveis aleatórias independentes, cada uma com valor esperado finito e variação
Defina:X1,X2,…μiσ2s2n=∑ni=1σ2i
Se, para alguns , a condição de Lyapunov
está satisfeito, então uma soma de converge na distribuição para uma variável aleatória normal padrão, como n vai para o infinito:δ>0limn→∞1s2+δn∑i=1nE[|Xi−μi|2+δ]=0Xi−μi/sn
1sn∑ni=1(Xi−μi) →d N(0,1).
Variação infinita Teoremas semelhantes ao teorema do limite central existem para variáveis com variação infinita, mas as condições são significativamente mais estreitas do que para o teorema do limite central usual. Essencialmente, a cauda da distribuição de probabilidade deve ser assintótica para para . Nesse caso, summands dimensionados apropriados convergem para uma distribuição estável Levy-Alpha .|x|−α−10<α<2
Importância da independência Existem muitos teoremas de limite central diferentes para seqüências não independentes de . Todos eles são altamente contextuais. Como Batman aponta, há um para Martingales. Esta questão é uma área de pesquisa em andamento, com muitas, diferentes variações, dependendo do contexto específico de interesse. Esta pergunta sobre troca de matemática é outro post relacionado a essa pergunta.Xi
Embora eu tenha certeza de que já foi respondido antes, aqui está outro:
Existem várias versões do teorema do limite central, sendo a mais geral dada a função de densidade de probabilidade arbitrária, a soma das variáveis será distribuída normalmente com um valor médio igual à soma dos valores médios, e a variação sendo a soma das variações individuais.
Uma restrição muito importante e relevante é que a média e a variação dos pdfs fornecidos devem existir e devem ser finitas.
Portanto, basta pegar qualquer pdf sem valor médio ou variação - e o teorema do limite central não será mais válido. Então, pegue uma distribuição lorentziana, por exemplo.
fonte
Não, a CLT sempre se mantém quando suas premissas se mantêm. Qualificações como "na maioria das situações" são referências informais às condições sob as quais a CLT deve ser aplicada.
Por exemplo, uma combinação linear de variáveis independentes da distribuição Cauchy não adicionará a variável distribuída Normal . Uma das razões é que a variação não é definida para a distribuição de Cauchy , enquanto o CLT impõe certas condições à variação, por exemplo, que deve ser finito. Uma implicação interessante é que, como as simulações de Monte Carlo são motivadas pelo CLT, você deve ter cuidado com as simulações de Monte Carlo ao lidar com distribuições de cauda gorda, como Cauchy.
Observe que há uma versão generalizada do CLT. Funciona para variações infinitas ou indefinidas, como a distribuição de Cauchy. Ao contrário de muitas distribuições bem comportadas, a soma normalizada dos números de Cauchy permanece Cauchy. Não converge para gaussiano.
A propósito, não apenas as gaussianas, mas muitas outras distribuições possuem PDFs em forma de sino, por exemplo, Student t. É por isso que a descrição que você citou é bastante liberal e imprecisa, talvez de propósito.
fonte
Aqui está uma ilustração da resposta do querubim, um histograma de 1e5 é extraído de meios de amostra em escala (por ) de distribuições t com dois graus de liberdade, de modo que a variação não exista .n−−√
Se a CLT se aplicou, o histograma para tão grande quanto deve se parecer com a densidade de uma distribuição normal padrão (que, por exemplo, tem densidade no seu pico), o que evidentemente não.n n=1000 1/2π−−√≈0.4
fonte
sd(x)
para obter algo que, se o CLT funcionar, converge pelo teorema de Slutzky, para uma variável N (0,1). Eu queria manter o exemplo simples, mas é claro que você está certo.Um caso simples em que o CLT não pode ser mantido por razões muito práticas é quando a sequência de variáveis aleatórias se aproxima do limite de probabilidade estritamente de um lado . Isso é encontrado, por exemplo, em estimadores que estimam algo que se encontra em um limite.
O exemplo padrão aqui talvez seja a estimativa de em uma amostra de iid Uniforms . O estimador de máxima verossimilhança será a estatística de ordem máxima e se aproximará necessariamente apenas a partir de baixo: pensando ingenuamente, uma vez que seu limite de probabilidade será , o estimador não pode ter uma distribuição "ao redor" - e o CLT é se foi.θ U(0,θ) θ θ θ
O estimador adequadamente dimensionado tem uma distribuição limitadora - mas não da "variedade CLT".
fonte
Você pode encontrar uma solução rápida aqui.
Surgem exceções ao teorema do limite central
Existem outras exceções descritas na resposta do @cherub.
A mesma pergunta já foi feita em math.stackexchange . Você pode verificar as respostas lá.
fonte