Estratégias para ensinar a distribuição amostral

30

A versão tl; dr Que estratégias bem-sucedidas você emprega para ensinar a distribuição amostral (por exemplo, uma média amostral) no nível de graduação introdutório?

O fundo

Em setembro, darei um curso introdutório de estatística para alunos do segundo ano de ciências sociais (principalmente ciências políticas e sociologia), usando A prática básica de estatística, de David Moore. Será a quinta vez que leciono este curso e um problema que sempre tive é que os alunos realmente lutaram com a noção da distribuição da amostra . Ele é coberto como pano de fundo para inferência e segue uma introdução básica à probabilidade, com a qual eles não parecem ter problemas após alguns soluços iniciais (e, basicamente, quero dizer básico- afinal, muitos desses alunos foram auto-selecionados em um fluxo de curso específico porque estavam tentando evitar qualquer coisa com uma vaga sugestão de "matemática"). Eu acho que provavelmente 60% deixam o curso sem um entendimento mínimo, cerca de 25% entendem o princípio, mas não as conexões com outros conceitos, e os 15% restantes entendem completamente.

O problema principal

O problema que os alunos parecem ter é com o aplicativo. É difícil explicar qual é o problema exato, além de dizer que eles simplesmente não entendem. De uma pesquisa realizada no último semestre e de respostas a exames, acho que parte da dificuldade é confusão entre duas frases sonoras relacionadas e semelhantes (distribuição de amostras e distribuição de amostras), por isso não usei a frase "distribuição de amostras" mais, mas certamente isso é algo que, apesar de confuso no início, é facilmente compreendido com um pouco de esforço e, de qualquer maneira, não pode explicar a confusão geral do conceito de uma distribuição amostral.

(Percebo que talvez eu e meus ensinamentos estejam em questão aqui! No entanto, acho que é razoável ignorar essa possibilidade desconfortável, pois alguns alunos parecem entender e, no geral, todo mundo parece se sair muito bem ...)

O que eu tentei

Eu tive que discutir com o administrador de graduação em nosso departamento para introduzir sessões obrigatórias no laboratório de informática, pensando que demonstrações repetidas poderiam ser úteis (antes de começar a ministrar este curso, não havia computação envolvida). Embora eu ache que isso ajude à compreensão geral do material do curso em geral, não acho que tenha sido ajudado com este tópico específico.

Uma idéia que tive é simplesmente não ensinar nada ou não dar muito peso a ela, uma posição defendida por alguns (por exemplo, Andrew Gelman ). Eu não acho isso particularmente satisfatório, pois tem o cheiro de ensinar ao menor denominador comum e, mais importante, nega alunos fortes e motivados que desejam aprender mais sobre aplicação estatística realmente entendendo como funcionam os conceitos importantes (não apenas a distribuição de amostras! ) Por outro lado, o estudante mediano parece compreender valores-p, por exemplo, então talvez eles não precisem entender a distribuição da amostra de qualquer maneira.

A questão

Quais estratégias você emprega para ensinar a distribuição amostral? Sei que existem materiais e discussões disponíveis (por exemplo, aqui e aqui e este documento que abre um arquivo PDF ), mas estou me perguntando se posso obter alguns exemplos concretos do que funciona para as pessoas (ou acho que até o que não funciona) então eu vou saber para não tentar!). Meu plano agora, ao planejar meu curso para setembro, é seguir o conselho de Gelman e "enfatizar" a distribuição da amostra. Eu vou ensiná-lo, mas assegurarei aos alunos que esse é um tipo de tópico apenas para a EFJ e não aparecerá em um exame (exceto, talvez, como uma questão de bônus ?!). No entanto, estou realmente interessado em ouvir outras abordagens que as pessoas usaram.

smillig
fonte
Você também pode fazer isso com distribuições de população não-normais para mostrar teorema do limite central
user41270
desculpe, isso deveria ter sido um comentário na minha resposta abaixo.
user41270

Respostas:

23

Na minha opinião, as distribuições de amostragem são a ideia principal da estatística 101. Você também pode pular o curso e pular esse problema. No entanto, eu estou muito familiarizado com o fato de os alunos simplesmente não entenderem, aparentemente, não importa o que você faça. Eu tenho uma série de estratégias. Isso pode levar muito tempo, mas eu recomendo pular / abreviar outros tópicos, para garantir que eles tenham uma idéia da distribuição da amostra. Aqui estão algumas dicas:

  • Diga claramente: primeiro mencionei explicitamente que existem três distribuições diferentes com as quais estamos preocupados: a distribuição da população, a distribuição da amostra e a distribuição da amostra. Digo isso repetidamente ao longo da lição, e depois repetidamente ao longo do curso. Toda vez que eu digo estes termos enfatizo o final distintivo: SAM- ple , samp- ling . (Sim, os alunos ficam cansados ​​disso; eles também entendem o conceito.)
  • Use figuras (figuras): Eu tenho um conjunto de figuras padrão que uso sempre que falo sobre isso. Ele tem as três distribuições representadas distintamente e normalmente rotuladas. (Os rótulos que acompanham esta figura estão no slide do powerpoint e incluem descrições curtas, para que não apareçam aqui, mas obviamente é: população no topo, amostras e distribuição de amostras.)
    insira a descrição da imagem aqui
  • Dê às atividades dos alunos: Na primeira vez em que você introduzir esse conceito, troque um monte de moedas (algumas moedas podem desaparecer) ou um monte de dados de seis lados. Peça aos alunos que se formem em pequenos grupos e gere um conjunto de 10 valores e faça a média deles. Em seguida, você pode fazer um histograma no quadro ou com o Excel.
  • Use animações (simulações): escrevo algum código (comicamente ineficiente) em R para gerar dados e exibi-lo em ação. Esta parte é especialmente útil quando você faz a transição para explicar o Teorema do Limite Central. (Observe as Sys.sleep()declarações, essas pausas me dão um momento para explicar o que está acontecendo em cada estágio.)
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • Restabeleça esses conceitos ao longo do semestre: trago a idéia da distribuição amostral novamente toda vez que falamos sobre o próximo assunto (embora normalmente apenas muito brevemente). O lugar mais importante para isso é quando você ensina ANOVA, pois, no caso da hipótese nula, realmente existe a situação em que você amostrou da mesma distribuição populacional várias vezes, e seu conjunto de grupos significa realmente uma distribuição empírica de amostragem. (Para um exemplo disso, consulte minha resposta aqui: Como o erro padrão funciona?. )
- Reinstate Monica
fonte
11
Esta é uma boa resposta (+1). Penso especialmente que as atividades e simulações são muito úteis para o ensino deste assunto. Em um curso introdutório que ensinei algumas vezes, usamos um applet da Web que permitia aos alunos visualizar como a estatística é calculada a partir da amostra e como o histograma da distribuição da amostra começa a tomar forma à medida que você repete isso muitas vezes. Eu acho que a atividade ajudou muito mais do que qualquer coisa que eu já disse para os alunos quando se trata de compreender as distribuições de amostragem :)
Macro
+1 Obrigado Gung, é uma ótima resposta! Obrigado por "me enviar o codez" também (nb. Usuários de Mac substituem windows(...)por quartz(...)). Seu ponto de vista sobre reforçar o conceito ao longo do semestre é particularmente útil. Penso que seguir estas orientações será realmente útil.
smillig
(+1) para o mantra "3-distribuições" e para o quadro relacional. Ninguém pode entender um conceito sem primeiro entender que é, de fato, um conceito distinto .
Alecos Papadopoulos
Eu achei a página " online stat book " da Rice University na distribuição de amostras muito útil para isso. A versão original, com muitos anos de idade, apresentava um applet Java, mas estou satisfeito por eles terem refazido o Javascript recentemente. O modo como funciona é essencialmente idêntico ao seu diagrama.
precisa
8

Tive alguma sorte em lembrar aos alunos que a distribuição amostral é a distribuição da estatística do teste com base em uma amostra aleatória . Os alunos pensam que o que aconteceria no próprio processo de amostragem era tendencioso - concentrando-se em casos extremos. Por exemplo, como seria a "distribuição de amostragem" se nosso processo de amostragem sempre escolhesse o mesmo subconjunto (especial). Então eu consideraria como seria a "distribuição de amostragem" se nosso processo de amostragem escolhesse apenas dois subconjuntos específicos (especiais) (cada um com probabilidade 1/2). É bastante simples calcular a média da amostra (especialmente para escolhas particulares de "especial" para a população subjacente).

Penso que para alguns estudantes (claramente não todos) isso parece ajudá-los com a ideia de que a distribuição da amostra pode ser muito diferente da distribuição da população. Também usei o exemplo do teorema do limite central que Michael Chernick mencionou com algum sucesso - especialmente com distribuições que claramente não são normais (as simulações realmente parecem ajudar).

shoda
fonte
Graham Cookson tem um bom exercício em sala de aula publicado como resposta em "Qual é a explicação do seu leigo favorito para um conceito estatístico difícil?" - um wiki da comunidade.
shoda 23/08/12
+1, falar sobre o que seria a distribuição amostral de amostras não aleatórias é uma boa ideia.
gung - Restabelece Monica
+1 Ótima idéia sobre a seleção de subconjuntos! Acho que este é o link que você está se referindo a @shoda: stats.stackexchange.com/a/554/9249
smillig
7

Começo de volta com o ensino da probabilidade. Eu não entro em muitas das definições e regras formais (apenas pouco tempo), mas mostro probabilidade por simulação. O problema de Monty Hall é um ótimo exemplo a ser usado, mostro através de simulação (e depois acompanhando a lógica) que a estratégia de alternar oferece uma maior probabilidade de vitória. Assinalo que por simulação fomos capazes de jogar o jogo várias vezes (sem risco ou recompensa) para avaliar as estratégias e isso nos permite escolher a melhor estratégia (se estivermos nessa situação). Escolher a melhor estratégia não garante uma vitória, mas nos dá uma chance melhor e ajuda a escolher entre as estratégias. A seguir, aponto que como isso se aplicará ao restante do curso é que ele nos ajudará a escolher estratégias em que haja um componente aleatório,

Então, quando apresento a distribuição de amostras, começo novamente com a simulação e digo que queremos desenvolver estratégias. Assim como no problema de Monty Hall, na vida real só poderemos colher 1 amostra, mas podemos simular várias amostras para nos ajudar a desenvolver uma estratégia. Em seguida, mostro simulações de muitas amostras da mesma população (população conhecida neste caso) e mostro as relações que aprendemos com as simulações (histograma da média amostral), ou seja, médias amostrais agrupadas em torno da média verdadeira (média das médias é média) , desvio padrão menor da distribuição de amostras para amostras maiores, mais normal para amostras maiores. O tempo todo eu falo sobre repetir as idéias da simulação para escolher estratégias, exatamente a mesma idéia que o problema de Monty Hall agora aplicado à amostra de meios, em vez de jogos. Mostro as regras oficiais e digo que, além das simulações, elas podem ser provadas matematicamente, mas não infligirei as provas para toda a turma. Ofereço que, se eles realmente quiserem ver as provas matemáticas, poderão chegar a um horário comercial e eu mostrarei a matemática (ninguém das aulas de introdução me aceitou ainda).

Então, quando chegamos à inferência, digo que só poderemos colher 1 amostra no mundo real, assim como jogaríamos apenas 1 vez (no máximo), mas podemos usar as estratégias que aprendemos ao simular muitas amostras para desenvolver uma estratégia (teste z, teste t ou fórmula de IC) que nos fornecerá as propriedades escolhidas (chance de estar correta). Assim como no jogo, não sabemos antes de começar se nossa conclusão final será correta (e geralmente ainda não sabemos depois), mas sabemos pelas simulações e distribuição de amostras qual é a probabilidade a longo prazo. essa estratégia.

100% dos alunos têm um entendimento perfeito? não, mas acho que mais deles têm a ideia geral de que podemos usar regras de simulação e matemática (que estão felizes por não terem que olhar, apenas confie no livro / instrutor) para escolher uma estratégia / fórmula que possua a propriedades desejadas.

Greg Snow
fonte
+1 Obrigado por compartilhar este conselho. Eu acho que você acertou em cheio com o problema de ser o elo entre o que podemos ensinar sobre qual é a distribuição da amostra e como isso pode ser extrapolado para a inferência de uma única amostra. Como você (e outras pessoas aqui) sugeriram, continuar reiterando o conceito várias vezes ao longo do curso é importante, mas não é feito com frequência (pelo menos não por mim, provavelmente porque eu já acho difícil o suficiente para caber em tudo que eu quero, e muito menos retornar aos conceitos já abordados!).
smillig
3

Esta é uma questão muito importante e bem pensada de sua parte. Eu acho que o conceito de distribuição de amostras é básico para entender a inferência e definitivamente deve ser ensinado.

Lecionei muitos cursos introdutórios de estatística, particularmente em bioestatística. Ensino o conceito de distribuição de amostras e tenho abordagens que considero boas, mas realmente não tenho um bom feedback para determinar o sucesso que tenho tido com elas. Enfim, aqui é o que eu faço.

Primeiro eu tento dar uma definição simples. A distribuição amostral é a distribuição que a estatística de teste teria se o processo amostral fosse repetido várias vezes. Depende da distribuição da população da qual se supõe que os dados sejam gerados.

Embora eu ache que essa seja uma definição tão simples quanto eu posso dar, percebo que não é muito simples e a compreensão do conceito não ocorrerá imediatamente na maioria dos casos. Portanto, siga isso com um exemplo básico que reforça o que é dito com a definição.

22

Então eu continuaria com uma aplicação importante, o teorema do limite central. Nos termos mais simples, o teorema do limite central diz que, para muitas distribuições que não são normais, a distribuição da amostra para a média da amostra estará próxima de uma distribuição normal quando o tamanho da amostra n for grande. Para ilustrar isso, faça distribuições como o uniforme (uma distribuição bimodal também seria boa de se olhar) e mostre como é a distribuição da amostra para a média para tamanhos de amostra de 3, 4, 5, 10 e 100. O aluno pode ver como a forma da distribuição muda de algo que não parece normal para n pequeno para algo que se parece muito com uma distribuição normal para n grande.

Para convencer o aluno de que essas distribuições de amostragem realmente possuem essas formas, faça com que os alunos realizem simulações, gerando muitas amostras de vários tamanhos e calculando os meios amostrais. Em seguida, peça que eles gerem histogramas para essas estimativas da média. Eu também sugeriria aplicar uma demonstração física mostrando como isso funciona usando uma placa de quincunx. Ao fazer isso, você aponta como o dispositivo gera amostras da soma dos ensaios independentes de Bernoulli, onde a probabilidade de ir para a esquerda ou direita em cada nível é igual a 1/2. As pilhas resultantes na parte inferior representam um histograma para esta distribuição de amostragem (o binômio) e sua forma pode parecer normal após um grande número de bolas pousar na parte inferior do quincunce,

Michael R. Chernick
fonte
Obrigado pelas sugestões valiosas. Eu realmente gosto da idéia de uma demonstração física real e definitivamente tentarei implementar algo assim (supondo que eu possa distraí-los do facebook por tempo suficiente ...), embora a conexão com a soma de ensaios independentes de Bernoulli esteja provavelmente um pouco acima da média deles. cabeças! Obrigado.
smillig
11
Mas ver a forma de distribuição normal do experimento é realmente revelador. Eu vi pela primeira vez um deles demonstrado no Museu de Ciências de Chicago quando eu era criança (cerca de 10 anos). Não sabia nada sobre estatísticas na época, mas nunca esqueceu a curva.
Michael R. Chernick
1

Eu acho que seria bom colocar uma "população" de números em uma sacola (variando, por exemplo, de 1 a 10). Você pode fazer suas próprias peças ou usar moedas, cartas de jogar etc.

Peça aos alunos que se sentem em grupos (5 ou mais) e cada um escolhe um número da sacola. Cada grupo calcula o valor médio para seu grupo. Diga a eles que, anteriormente, você calculou a média da população, plote-a em um histograma e peça a um membro de cada grupo e plote a média da amostra em um historograma em torno disso. Faça com que eles façam esse exercício algumas vezes para 'construir o histograma'.

Você poderá mostrar graficamente a variação nas médias da amostra em torno da média da população. Calcule a variação nas médias da amostra em comparação com a média da população. Eu acho que os alunos se lembram claramente de fazer um exercício tão prático e, como resultado, o conceito de variação amostral voltará a eles mais facilmente. Pode parecer um pouco infantil, mas os alunos às vezes apenas gostam de mudar algo ativo ... não há muitas oportunidades para fazer isso nas estatísticas.

user41270
fonte