Qual é a maneira mais fácil e limpa de explicar a alguém o conceito de variação? O que isso significa intuitivamente? Se alguém explica isso ao filho, como é que isso acontece?
É um conceito que tenho dificuldade em articular - especialmente quando relaciono variação ao risco. Eu o entendo matematicamente e também posso explicar dessa maneira. Mas, ao explicar os fenômenos do mundo real, como você faz entender a variação e sua aplicabilidade no "mundo real", por assim dizer.
Digamos que estamos simulando um investimento em uma ação usando números aleatórios (rolar um dado ou usar uma planilha do Excel, não importa). Obtemos algum "retorno do investimento" associando cada instância da variável aleatória a "alguma alteração" no retorno. Por exemplo.:
Rolar um 1 implica uma mudança de 0,8 por US $ 1 em investimento, uma mudança de 5 por 1,1 de US $ 1 e assim por diante.
Agora, se essa simulação for executada cerca de 50 vezes (ou 20 ou 100), obteremos alguns valores e o valor final do investimento. Então, o que 'variância' realmente nos diz se devemos calculá-lo a partir do conjunto de dados acima? O que alguém "vê" - Se a variação é 1,7654 ou 0,88765 ou 5,2342, o que isso significa? O que eu posso observar sobre esse investimento? Que conclusões posso tirar - em termos leigos.
Por favor, sinta-se livre para aumentar também a questão com o desvio padrão! Embora eu sinta que é 'mais fácil' de entender, mas algo que contribuiria para torná-lo também 'intuitivamente' claro seria muito apreciado!
Respostas:
Eu provavelmente usaria uma analogia semelhante à que aprendi a dar aos leigos ao introduzir o conceito de preconceito e variação: a analogia do alvo. Ver abaixo:
A imagem em particular acima é da Encyclopedia of Machine Learning , e a referência na imagem é "Introdução à prática de estatística", de Moore e McCabe .
EDITAR:
Aqui está um exercício que acredito ser bastante intuitivo: pegue um baralho de cartas (fora da caixa) e largue o baralho a uma altura de cerca de um pé. Peça ao seu filho para pegar os cartões e devolvê-los para você. Então, em vez de deixar o baralho cair, jogue-o o mais alto possível e deixe as cartas caírem no chão. Peça ao seu filho para pegar os cartões e devolvê-los para você.
A relativa diversão que eles têm durante as duas tentativas deve proporcionar uma sensação intuitiva de variação :)
fonte
Eu costumava ensinar estatística a um leigo por piadas, e descobri que eles aprendem muito.
Suponha que por variação ou desvio padrão a seguinte piada seja bastante útil:
Piada
Uma vez que dois estatísticos de altura de 4 pés e 5 pés precisam atravessar um rio de profundidade MÉDIA de 3 pés. Enquanto isso, um terceiro estatístico chega e diz: "o que você está esperando? Você pode facilmente atravessar o rio"
Estou assumindo que o leigo conheça o termo "médio". Você também pode fazer a mesma pergunta que eles atravessariam o rio nessa situação?
O que está faltando é 'variação' para decidir "o que fazer na situação?"
É tudo sobre suas habilidades de apresentação. No entanto, as piadas ajudam muito o leigo que quer entender as estatísticas. Espero que ajude!
fonte
Eu focaria no desvio padrão e não na variação; a variação está na escala errada.
Assim como a média é um valor típico, o DP é uma diferença típica (absoluta) da média. Não é diferente dobrar a distribuição na média e levar a média disso.
fonte
Eu discordo de muitas respostas que defendem as pessoas a pensarem puramente na variação como disseminada. Como as pessoas inteligentes (Nassim Taleb) apontaram, quando as pessoas pensam na variação como dispersa, elas simplesmente assumem que é MAD.
Variância é uma descrição de quão longe os membros estão da média e julga a importância de cada observação por essa mesma distância. Isso significa que observações distantes são julgadas mais importante. Daí quadrados.
Eu acho que a variação de uma variável uniforme contínua é a mais fácil de imaginar. Cada observação pode ter um quadrado desenhado para ela. Empilhar esses quadrados cria uma pirâmide. Corte a pirâmide ao meio para que metade do peso esteja de um lado e metade do outro. A face onde você a corta é a variação.
fonte
Talvez isso possa ajudar. Peço desculpas antecipadamente por que, como amador completo, eu possa entender isso errado.
Imagine que você peça a 1000 pessoas para adivinhar corretamente quantos feijões há em uma jarra cheia de jujubas. Agora imagine que você não está necessariamente interessado em saber a resposta correta (que pode ser de alguma utilidade), mas deseja entender melhor como as pessoas estimam a resposta.
A variação pode ser explicada a um leigo como a disseminação de respostas diferentes (da mais alta para a mais baixa). Você pode continuar acrescentando que, se pessoas suficientes forem questionadas, a resposta correta deve estar em algum lugar no meio da disseminação dos 'convidados' dados.
Refiro-me agora a alguns dos meus colegas mais estimados para julgamento
fonte
Eu estava sentado tentando entender a variação e o que finalmente fez com que ela se encaixasse no lugar era olhar graficamente.
Digamos que você desenhe uma linha numérica com quatro pontos, -7, -1, 1 e 7. Agora, desenhe um eixo Y imaginário com os mesmos quatro pontos ao longo da dimensão Y e use os pares XY para desenhar o quadrado para cada par de pontos. Você termina com quatro quadrados separados, consistindo em 49, 1, 1 e 49 quadrados menores, cada um. Cada um deles contribui para uma soma geral de quadrados que, por si só, podem ser representados como um quadrado grande de 10 x 10 com 100 quadrados menores no total.
Variação é o tamanho do quadrado médio que contribui para esse quadrado maior. 49 + 1 + 49 + 1 = 100, 100/4 = 25. Então 25 seria a variação. O desvio padrão seria o comprimento de um dos lados desse quadrado médio ou 5.
Obviamente, essa analogia não cobre todas as nuances do conceito de variação. Há muitas coisas que precisam ser explicadas, como por que geralmente usamos um denominador de n-1 para estimar o parâmetro populacional, em vez de simplesmente usar n. Mas, como um conceito básico, para definir o restante de um entendimento detalhado da variação, basta extraí-lo para que eu possa ver que isso ajudou imensamente. Ajuda a entender o que queremos dizer quando afirmamos que a variação é o desvio médio quadrático da média. Também ajuda a entender o relacionamento que SD tem com essa média.
fonte
Tenha muita prática ensinando leigos sobre desvio e variação padrão.
TL; DR; É algo como a média de distâncias da média. (o que é um pouco confuso e enganoso em uma versão concisa. Leia o artigo completo)
Suponho que leigo sabe sobre média. Dou uma palestra sobre a importância de conhecer o SD e estimar erros (veja PS abaixo). Então eu prometo que nenhum conhecimento alto de matemática ou estatística sagrada será usado - apenas um raciocínio seco e uma lógica pura.
O problema. Vamos dizer que temos um termômetro (eu escolho um dispositivo de medição dependendo do que for mais próximo do auditivo).
Fizemos medições de N da mesma temperatura e termômetro nos mostrando algo como 36,5, 35,9, 37,0, 36,6, ... (veja a foto). Sabemos que a temperatura real era a mesma, mas o termômetro depende um pouco de cada medição.
Como podemos estimar o quanto essa pequena escória está para nós?
Podemos calcular a média (veja a linha vermelha na figura abaixo). Podemos acreditar? Mesmo após a média, ela tem precisão suficiente para nossas necessidades?
A abordagem mais fácil . Podemos pegar o ponto mais distante, calcular a distância entre ele e a média (linha vermelha) e dizer que é assim que o termômetro está para nós, porque é o erro máximo que vemos. Pode-se adivinhar, não é a melhor estimativa. Se olharmos para a foto, a maioria dos pontos está em torno da média, como podemos decidir apenas um ponto? Na verdade, pode-se praticar razões de numeração pelas quais essa estimativa é grosseira e geralmente ruim.
Variância . Então ... vamos pegar todas as distâncias e calcular a distância média !
BTW, como calcular uma distância? Quando você ouve a "distância" em inglês (espanhol? Dinamarquês?), Ela se traduz em "subtrair" em matemática. Assim, começamos nossa fórmula com onde é a média e é uma das medidas.ˉ x x i(xi−x¯) x¯ xi
Então, pode-se imaginar que a fórmula da distância média estaria somando tudo e dividindo por N:
Mas há um problema. Podemos ver facilmente, por exemplo. que 36,4 e 36,8 estão à mesma distância de 36,6. mas se colocarmos os valores na fórmula acima, obtemos -0,2 e +0,2, e sua soma é igual a 0, que não é o que queremos.
Como se livrar do sinal? (Nesse momento, os leigos costumam dizer "Aceite valor absoluto" e recebem sugestões de que "aceitar um valor absoluto é um pouco artificial, qual é a outra maneira?"). Podemos quadrar os valores! Então a fórmula se torna:
Essa fórmula é chamada "Variação" nas estatísticas. E é muito melhor estimar a propagação de nossos valores de termômetro (ou o que seja), do que apenas percorrer a distância máxima.
Desvio padrão . Mas ainda há mais um problema. Veja a fórmula de variação. Quadrados fazem nossas unidades de medida ... quadradas. Se o termômetro medir a temperatura em ° C (ou ° F), nossa estimativa de erro será medida em (ou ). Como neutralizar os quadrados? - Use a raiz quadrada!°C2 °F2
Então, aqui chegamos à fórmula do desvio padrão, que geralmente é denotada como . E essa é a melhor maneira de estimar a precisão do nosso dispositivo.σ
Nesse ponto, um leigo entende muito claramente como chegamos aqui e como o desvio / variação padrão funciona. A partir deste ponto, eu geralmente vou para a regra 68-95-99.7, descrevendo também sobre amostragem e população, erro padrão versus termos de desvio padrão Etc.
PS Importância de conhecer o exemplo de conversa em SD:
Digamos que você tenha algum dispositivo de medição, que custou 1 000 000 $ . E dá a resposta: 42. Você acha que alguém pagou 1 000 000 $ por 42? Phooey! Um deles pagou 1.000.000 pela precisão dessa resposta. Porque o valor - não custa nada sem conhecer o seu erro. Você paga pelo erro, não pelo valor. Aqui está um bom exemplo de vida.
Na vida comum, na maioria das vezes usamos uma régua para medir a distância. A régua fornece precisão em torno de um milímetro (se você não estiver nos EUA). E se você tiver que ir além do milímetro e medir algo com precisão de 0,1 mm? - Você provavelmente usaria uma pinça. Agora, é fácil verificar que uma régua mais barata (mas ainda com precisão milimétrica) custa centavos, enquanto uma boa pinça custa dez dólares. 2 magnitudes de preço para 1 magnitude de precisão. E isso é muito usual de quanto você paga por um erro.
fonte
Eu acho que a frase-chave a ser usada ao explicar a variação e o desvio padrão é "medida de spread" . Na linguagem mais básica, a variação e o desvio padrão nos dizem o quão bem os dados estão espalhados. Para ser um pouco mais preciso, apesar de ainda abordar o leigo, eles nos dizem quão bem os dados estão espalhados pela média. De passagem, observe que a média é uma "medida da localização" . Para concluir a explicação para o leigo, deve-se destacar que o desvio padrão é expresso nas mesmas unidades que os dados com os quais trabalhamos e é por esse motivo que tomamos a raiz quadrada da variância. ou seja, os dois estão ligados.
Eu acho que essa breve explicação faria o truque. Provavelmente é um pouco semelhante a uma explicação introdutória do livro didático.
fonte
Considero a variação da distribuição como o momento de inércia com o eixo que na média da distribuição e cada massa é 1. Essa intuição tornaria concreto o conceito abstrato.
O primeiro momento é a média da distribuição e o segundo momento é a variação.
Referência: Um primeiro curso de probabilidade 8ª edição
fonte
Eu chamaria isso de diferença positiva média da média geral.
fonte