Meu pai é um entusiasta da matemática, mas não está muito interessado em estatística. Seria interessante tentar ilustrar alguns dos maravilhosos bits de estatística, e o CLT é um candidato principal. Como você transmitiria a beleza matemática e o impacto do teorema do limite central a um não estatístico?
theory
central-limit-theorem
Vince
fonte
fonte
Respostas:
O que eu mais amei com o CLT são os casos em que não é aplicável - isso me dá uma esperança de que a vida seja um pouco mais interessante que a curva de Gauss sugere. Então, mostre a ele a distribuição Cauchy.
fonte
Para apreciar plenamente o CLT, ele deve ser visto.
Daí a noção da máquina de feijão e muitos vídeos do youtube para ilustração.
fonte
Frequentemente, quando os matemáticos falam sobre probabilidade, começam com uma distribuição de probabilidade conhecida e depois falam sobre a probabilidade de eventos. O verdadeiro valor do teorema do limite central é que ele nos permite usar a distribuição normal como uma aproximação nos casos em que não sabemos a verdadeira distribuição. Você poderia fazer ao seu pai uma pergunta estatística padrão (mas formulada como matemática) sobre qual é a probabilidade de que a média de uma amostra seja maior que um determinado valor se os dados vierem de uma distribuição com mu e sd médios sigma, e então ver se ele assume uma distribuição (que você diz que não sabemos) ou diz que ele precisa conhecer a distribuição. Em seguida, você pode mostrar que podemos aproximar a resposta usando o CLT em muitos casos.
Para comparar matemática com estatísticas, eu gosto de usar o teorema do valor médio da integração (que diz que para uma integral de a a b existe um retângulo de a a b com a mesma área e a altura do retângulo é a média da curva). O matemático analisa esse teorema e diz "legal, posso usar uma integração para calcular uma média", enquanto o estatístico olha para o mesmo teorema e diz "legal, posso usar uma média para calcular uma integral".
Na verdade, tenho tapeçarias com pontos cruzados em meu escritório do teorema do valor médio e do CLT (junto com o teorema de Bayes).
fonte
Gosto de demonstrar variação amostral e essencialmente o Teorema do Limite Central através de um exercício "em sala de aula". Todo mundo na classe dos digamos 100 alunos escreve sua idade em um pedaço de papel. Todos os pedaços de papel têm o mesmo tamanho e são dobrados da mesma maneira depois de calcular a média. Esta é a população e eu calculo a idade média. Em seguida, cada aluno seleciona aleatoriamente 10 pedaços de papel, escreve as idades e as devolve à bolsa. (S) ele calcula a média e passa a bolsa para o próximo aluno. Eventualmente, temos 100 amostras de 10 alunos, cada uma estimando a média da população que podemos descrever através de um histograma e algumas estatísticas descritivas.
Em seguida, repetimos a demonstração desta vez usando um conjunto de 100 "opiniões" que replicam algumas perguntas Sim / Não de pesquisas recentes. Por exemplo, se a eleição (geral britânica) fosse convocada amanhã, você consideraria votar no Partido Nacional Britânico. Os alunos experimentam 10 dessas opiniões.
No final, demonstramos variação de amostragem, o Teorema do Limite Central, etc. com dados contínuos e binários.
fonte
Brincar com o código a seguir, variar o valor
M
e escolher distribuições diferentes do uniforme pode ser uma ilustração divertida.fonte
Se você usa Stata, pode usar o comando -clt- que cria gráficos de distribuições de amostragem, consulte
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
fonte
Na minha experiência, o CLT é menos útil do que parece. Nunca se sabe no meio de um projeto se n é grande o suficiente para que a aproximação seja adequada à tarefa. E para testes estatísticos, o CLT ajuda a proteger o erro do tipo I, mas faz pouco para manter o erro do tipo II distante. Por exemplo, o teste t pode ter uma potência arbitrariamente baixa para grandes n quando a distribuição de dados é extremamente distorcida.
fonte