Entendendo "variação" intuitivamente

81

Qual é a maneira mais fácil e limpa de explicar a alguém o conceito de variação? O que isso significa intuitivamente? Se alguém explica isso ao filho, como é que isso acontece?

É um conceito que tenho dificuldade em articular - especialmente quando relaciono variação ao risco. Eu o entendo matematicamente e também posso explicar dessa maneira. Mas, ao explicar os fenômenos do mundo real, como você faz entender a variação e sua aplicabilidade no "mundo real", por assim dizer.

Digamos que estamos simulando um investimento em uma ação usando números aleatórios (rolar um dado ou usar uma planilha do Excel, não importa). Obtemos algum "retorno do investimento" associando cada instância da variável aleatória a "alguma alteração" no retorno. Por exemplo.:

Rolar um 1 implica uma mudança de 0,8 por US $ 1 em investimento, uma mudança de 5 por 1,1 de US $ 1 e assim por diante.

Agora, se essa simulação for executada cerca de 50 vezes (ou 20 ou 100), obteremos alguns valores e o valor final do investimento. Então, o que 'variância' realmente nos diz se devemos calculá-lo a partir do conjunto de dados acima? O que alguém "vê" - Se a variação é 1,7654 ou 0,88765 ou 5,2342, o que isso significa? O que eu posso observar sobre esse investimento? Que conclusões posso tirar - em termos leigos.

Por favor, sinta-se livre para aumentar também a questão com o desvio padrão! Embora eu sinta que é 'mais fácil' de entender, mas algo que contribuiria para torná-lo também 'intuitivamente' claro seria muito apreciado!

Doutorado
fonte
3
Não devemos fundir essa pergunta com a mesma que foi feita no ano passado?
whuber
1
@ Whuber Eu acho que estes devem ser mesclados. Tendo várias vezes a mesma pergunta (mesmo que aqui o contexto seja diferente) reduz a qualidade média das respostas.
robin Girard
2
Eu estou bem com a fusão, mas sei como calcular a variação e o uso também nas estatísticas. Eu quero ser capaz de articular esse conceito para pessoas que não sabem nada sobre isso e leva muito tempo para fazê-lo e, portanto, a pergunta. A intenção é bastante diferente da pergunta sobre SD, IMHO
PhD
2
Acho que nenhum de vocês está fazendo um bom trabalho em responder a isso de uma maneira que um leigo entenderia. Vejo muitas suposições sendo feitas e quase todas as respostas terminam com algo que precisa ser interpretado. Não estou reclamando, apenas tentando apontar isso. Eu também não posso responder à pergunta simplesmente. Talvez seja muito difícil?
Acho que nenhuma das respostas abaixo respondeu à pergunta aqui. A questão, como a interpreto, é mais sobre variação como número, quando é considerada grande ou pequena. A resposta principal abaixo, por exemplo, aborda a questão sobre o que significa grande variação versus variação pequena. Se eu lhe der um conjunto de dados que você não pode visualizar razoavelmente, para que você precise confiar nos números, como você pode saber se a variação é grande / pequena?
user31415

Respostas:

70

Eu provavelmente usaria uma analogia semelhante à que aprendi a dar aos leigos ao introduzir o conceito de preconceito e variação: a analogia do alvo. Ver abaixo:

insira a descrição da imagem aqui

A imagem em particular acima é da Encyclopedia of Machine Learning , e a referência na imagem é "Introdução à prática de estatística", de Moore e McCabe .

EDITAR:

Aqui está um exercício que acredito ser bastante intuitivo: pegue um baralho de cartas (fora da caixa) e largue o baralho a uma altura de cerca de um pé. Peça ao seu filho para pegar os cartões e devolvê-los para você. Então, em vez de deixar o baralho cair, jogue-o o mais alto possível e deixe as cartas caírem no chão. Peça ao seu filho para pegar os cartões e devolvê-los para você.

A relativa diversão que eles têm durante as duas tentativas deve proporcionar uma sensação intuitiva de variação :)

stemgal
fonte
1
Então o que isso significa'? Se alguém ver a variação estatística dos dardos no quadro, o que eles concluiriam? O que significa ter alta variância baixa / intuitivamente falando ...
PhD
1
Eu diria algo como: digamos que jogamos 4 dardos. O número de mãos necessárias para remover os dardos do tabuleiro aumenta de uma só vez, à medida que a variação das posições do dardo aumenta (Nota: argumento muito informal aqui, pois há vários contra-exemplos, como quando 3 dardos são agrupados e o último dardo é na parede a 3 pés do painel de controle).
2
Seu diagrama também parece ressonar a maneira clássica de distinguir precisão e exatidão! Apenas me atingiu!
PhD
2
AAAAAAAAAAAH! Bom exercício! Boa maneira de mostrar a alguém o que significa ter baixa / alta variação! A distância média do valor médio (média) dos pontos de dados :)
PhD
2
(1) O alvo-analógico para demonstrar a diferença entre viés e variância é simplesmente brilhante
Steffen
36

Eu costumava ensinar estatística a um leigo por piadas, e descobri que eles aprendem muito.

Suponha que por variação ou desvio padrão a seguinte piada seja bastante útil:

Piada

Uma vez que dois estatísticos de altura de 4 pés e 5 pés precisam atravessar um rio de profundidade MÉDIA de 3 pés. Enquanto isso, um terceiro estatístico chega e diz: "o que você está esperando? Você pode facilmente atravessar o rio"

Estou assumindo que o leigo conheça o termo "médio". Você também pode fazer a mesma pergunta que eles atravessariam o rio nessa situação?

O que está faltando é 'variação' para decidir "o que fazer na situação?"

É tudo sobre suas habilidades de apresentação. No entanto, as piadas ajudam muito o leigo que quer entender as estatísticas. Espero que ajude!

Biostat
fonte
1
Talvez eu não sou bom com piadas estatísticos (eu sou sou muito bom com os outros embora :). Mas acho que não entendo o que se entende por "o que fazer na situação"? O que 'exatamente' se deve fazer se tiver uma idéia da variação? Como alguém deve interpretar isso?
PhD
6
@ Nupul: Na verdade, "o que fazer na situação" significa que eles atravessam um rio ou não? Se você conhece a variação (ou DP), pode decidir facilmente. Suponha que a variância seja 0,25 (DP = 0,5), então eles podem atravessar o rio com segurança porque o intervalo de intervalo (não confunda isso com confiança O intervalo (IC)) é 3 + 0,5 ou 3-0,5 e suas alturas são 4 e 5. Se a variação é 4, então é melhor não atravessar o rio. A propósito, apenas aproveite as piadas aqui stats.stackexchange.com/questions/1337/statistics-jokes
Biostat
Perfeito! Deixa comigo! :) Isso faz muito sentido. Na verdade, combinando as respostas de várias pessoas me ajuda a enquadrar a compreender melhor ...
PhD
Ou, se os tubarões não comem "em média" as pessoas, isso é pouco conforto se elas forem muito mal-humoradas (comportamento altamente variável). Na analogia do rio, é sobre se você dará um passo que o colocará sobre sua cabeça.
Dean Radcliffe
12

Eu focaria no desvio padrão e não na variação; a variação está na escala errada.

Assim como a média é um valor típico, o DP é uma diferença típica (absoluta) da média. Não é diferente dobrar a distribuição na média e levar a média disso.

Karl
fonte
1
Acordado. Digamos que nos concentramos em SD. Minha pergunta ainda é sobre como fazer alguém entender o SD de maneira intuitiva, além de 'alto SD não parece bom ' ... como eu explicaria o SD a um leigo, já que é a raiz quadrada da variação !!!
PhD
@ Nupul - Leia meu segundo parágrafo: eu explicaria o SD como a diferença típica da média.
26411 Karl
4
"Não é diferente dobrar a distribuição na média e levar a média disso." Esse comentário, como o restante da sua postagem, parece descrever o desvio absoluto médio, não o desvio padrão.
Macro
3
@ Macro - sim; ao tentar explicar o SD, eu o aproximaria pelo MAD. Eu acho que é melhor não discutir sobre o valor médio da raiz quadrada versus o valor absoluto médio.
1919 Karl
7

Eu discordo de muitas respostas que defendem as pessoas a pensarem puramente na variação como disseminada. Como as pessoas inteligentes (Nassim Taleb) apontaram, quando as pessoas pensam na variação como dispersa, elas simplesmente assumem que é MAD.

Variância é uma descrição de quão longe os membros estão da média e julga a importância de cada observação por essa mesma distância. Isso significa que observações distantes são julgadas mais importante. Daí quadrados.

Eu acho que a variação de uma variável uniforme contínua é a mais fácil de imaginar. Cada observação pode ter um quadrado desenhado para ela. Empilhar esses quadrados cria uma pirâmide. Corte a pirâmide ao meio para que metade do peso esteja de um lado e metade do outro. A face onde você a corta é a variação.

arthur.00
fonte
2
Não sei por que essa resposta não foi mais votada. O argumento exposto no segundo parágrafo é crucial para entender a variação e diferenciá-la da MAD, que, como corretamente apontado, é o que as pessoas pensam intuitivamente quando são informadas sobre a "medida de expansão". E não está fora do leigo entender a idéia de que o peso dado à distância de um ponto da média não cresce linearmente, mesmo que eles não entendam os quadrados matematicamente.
Jeremy radcliff
3
"MAD" = en.wikipedia.org/wiki/Median_absolute_deviation para aqueles que estão se perguntando. Eu não acho que esses acrônimos devam ser assumidos em uma pergunta como esta.
5

Talvez isso possa ajudar. Peço desculpas antecipadamente por que, como amador completo, eu possa entender isso errado.

Imagine que você peça a 1000 pessoas para adivinhar corretamente quantos feijões há em uma jarra cheia de jujubas. Agora imagine que você não está necessariamente interessado em saber a resposta correta (que pode ser de alguma utilidade), mas deseja entender melhor como as pessoas estimam a resposta.

A variação pode ser explicada a um leigo como a disseminação de respostas diferentes (da mais alta para a mais baixa). Você pode continuar acrescentando que, se pessoas suficientes forem questionadas, a resposta correta deve estar em algum lugar no meio da disseminação dos 'convidados' dados.

Refiro-me agora a alguns dos meus colegas mais estimados para julgamento

Andrew V
fonte
5

Eu estava sentado tentando entender a variação e o que finalmente fez com que ela se encaixasse no lugar era olhar graficamente.

Digamos que você desenhe uma linha numérica com quatro pontos, -7, -1, 1 e 7. Agora, desenhe um eixo Y imaginário com os mesmos quatro pontos ao longo da dimensão Y e use os pares XY para desenhar o quadrado para cada par de pontos. Você termina com quatro quadrados separados, consistindo em 49, 1, 1 e 49 quadrados menores, cada um. Cada um deles contribui para uma soma geral de quadrados que, por si só, podem ser representados como um quadrado grande de 10 x 10 com 100 quadrados menores no total.

Variação é o tamanho do quadrado médio que contribui para esse quadrado maior. 49 + 1 + 49 + 1 = 100, 100/4 = 25. Então 25 seria a variação. O desvio padrão seria o comprimento de um dos lados desse quadrado médio ou 5.

Obviamente, essa analogia não cobre todas as nuances do conceito de variação. Há muitas coisas que precisam ser explicadas, como por que geralmente usamos um denominador de n-1 para estimar o parâmetro populacional, em vez de simplesmente usar n. Mas, como um conceito básico, para definir o restante de um entendimento detalhado da variação, basta extraí-lo para que eu possa ver que isso ajudou imensamente. Ajuda a entender o que queremos dizer quando afirmamos que a variação é o desvio médio quadrático da média. Também ajuda a entender o relacionamento que SD tem com essa média.

Calen
fonte
1
Bem-vindo ao Validação cruzada! Eu gosto da abordagem, mas pode ser ainda mais útil enfatizar que os pontos estão espalhados 'em torno de zero' (ou seja, eles têm média zero) e você está medindo a propagação em relação a um "átomo" localizado lá. (+1) e estou ansioso para receber mais respostas suas!
Matt Krause
4

Tenha muita prática ensinando leigos sobre desvio e variação padrão.

TL; DR; É algo como a média de distâncias da média. (o que é um pouco confuso e enganoso em uma versão concisa. Leia o artigo completo)

Suponho que leigo sabe sobre média. Dou uma palestra sobre a importância de conhecer o SD e estimar erros (veja PS abaixo). Então eu prometo que nenhum conhecimento alto de matemática ou estatística sagrada será usado - apenas um raciocínio seco e uma lógica pura.

  1. O problema. Vamos dizer que temos um termômetro (eu escolho um dispositivo de medição dependendo do que for mais próximo do auditivo).

    Fizemos medições de N da mesma temperatura e termômetro nos mostrando algo como 36,5, 35,9, 37,0, 36,6, ... (veja a foto). Sabemos que a temperatura real era a mesma, mas o termômetro depende um pouco de cada medição.

    Como podemos estimar o quanto essa pequena escória está para nós?

    Podemos calcular a média (veja a linha vermelha na figura abaixo). Podemos acreditar? Mesmo após a média, ela tem precisão suficiente para nossas necessidades?

    Valores do termômetro e sua média

  2. A abordagem mais fácil . Podemos pegar o ponto mais distante, calcular a distância entre ele e a média (linha vermelha) e dizer que é assim que o termômetro está para nós, porque é o erro máximo que vemos. Pode-se adivinhar, não é a melhor estimativa. Se olharmos para a foto, a maioria dos pontos está em torno da média, como podemos decidir apenas um ponto? Na verdade, pode-se praticar razões de numeração pelas quais essa estimativa é grosseira e geralmente ruim.

  3. Variância . Então ... vamos pegar todas as distâncias e calcular a distância média !

    BTW, como calcular uma distância? Quando você ouve a "distância" em inglês (espanhol? Dinamarquês?), Ela se traduz em "subtrair" em matemática. Assim, começamos nossa fórmula com onde é a média e é uma das medidas.ˉ x x i(xix¯)x¯xi

    Então, pode-se imaginar que a fórmula da distância média estaria somando tudo e dividindo por N:

    (xix¯)N

    Mas há um problema. Podemos ver facilmente, por exemplo. que 36,4 e 36,8 estão à mesma distância de 36,6. mas se colocarmos os valores na fórmula acima, obtemos -0,2 e +0,2, e sua soma é igual a 0, que não é o que queremos.

    Como se livrar do sinal? (Nesse momento, os leigos costumam dizer "Aceite valor absoluto" e recebem sugestões de que "aceitar um valor absoluto é um pouco artificial, qual é a outra maneira?"). Podemos quadrar os valores! Então a fórmula se torna:

    (xix¯)2N
    .

    Essa fórmula é chamada "Variação" nas estatísticas. E é muito melhor estimar a propagação de nossos valores de termômetro (ou o que seja), do que apenas percorrer a distância máxima.

  4. Desvio padrão . Mas ainda há mais um problema. Veja a fórmula de variação. Quadrados fazem nossas unidades de medida ... quadradas. Se o termômetro medir a temperatura em ° C (ou ° F), nossa estimativa de erro será medida em (ou ). Como neutralizar os quadrados? - Use a raiz quadrada!°C2°F2

    (xix¯)2N

    Então, aqui chegamos à fórmula do desvio padrão, que geralmente é denotada como . E essa é a melhor maneira de estimar a precisão do nosso dispositivo.σ

Nesse ponto, um leigo entende muito claramente como chegamos aqui e como o desvio / variação padrão funciona. A partir deste ponto, eu geralmente vou para a regra 68-95-99.7, descrevendo também sobre amostragem e população, erro padrão versus termos de desvio padrão Etc.

PS Importância de conhecer o exemplo de conversa em SD:

Digamos que você tenha algum dispositivo de medição, que custou 1 000 000 $ . E dá a resposta: 42. Você acha que alguém pagou 1 000 000 $ por 42? Phooey! Um deles pagou 1.000.000 pela precisão dessa resposta. Porque o valor - não custa nada sem conhecer o seu erro. Você paga pelo erro, não pelo valor. Aqui está um bom exemplo de vida.

Na vida comum, na maioria das vezes usamos uma régua para medir a distância. A régua fornece precisão em torno de um milímetro (se você não estiver nos EUA). E se você tiver que ir além do milímetro e medir algo com precisão de 0,1 mm? - Você provavelmente usaria uma pinça. Agora, é fácil verificar que uma régua mais barata (mas ainda com precisão milimétrica) custa centavos, enquanto uma boa pinça custa dez dólares. 2 magnitudes de preço para 1 magnitude de precisão. E isso é muito usual de quanto você paga por um erro.

MajesticRa
fonte
2

Eu acho que a frase-chave a ser usada ao explicar a variação e o desvio padrão é "medida de spread" . Na linguagem mais básica, a variação e o desvio padrão nos dizem o quão bem os dados estão espalhados. Para ser um pouco mais preciso, apesar de ainda abordar o leigo, eles nos dizem quão bem os dados estão espalhados pela média. De passagem, observe que a média é uma "medida da localização" . Para concluir a explicação para o leigo, deve-se destacar que o desvio padrão é expresso nas mesmas unidades que os dados com os quais trabalhamos e é por esse motivo que tomamos a raiz quadrada da variância. ou seja, os dois estão ligados.

Eu acho que essa breve explicação faria o truque. Provavelmente é um pouco semelhante a uma explicação introdutória do livro didático.

Graeme Walsh
fonte
-2

Eu chamaria isso de diferença positiva média da média geral.

mskw
fonte
1
Até você esclarecer os dois tipos de "média" que você quer dizer (o primeiro é a média e o segundo é a média aritmética), é quase certo que sua declaração será interpretada de maneira a torná-la incorreta. Além disso, o termo "diferença positiva" é estranho e ambíguo: você pretende considerar apenas os resíduos positivos? Ou tomar os valores absolutos dos resíduos? Ou alguma outra coisa? L2
whuber