Inspirado em " exemplos da vida real de distribuições comuns ", pergunto-me que exemplos pedagógicos as pessoas usam para demonstrar distorção negativa? Existem muitos exemplos "canônicos" de distribuições simétricas ou normais usadas no ensino - mesmo que aqueles como altura e peso não sobrevivam a um exame biológico mais próximo! A pressão arterial pode estar mais próxima da normalidade. Gosto de erros de medição astronômicos - de interesse histórico, intuitivamente, eles não têm mais probabilidade de estar em uma direção do que em outra, com pequenos erros mais prováveis que grandes.
Exemplos pedagógicos comuns para distorção positiva incluem a renda das pessoas; quilometragem em carros usados para venda; tempos de reação em um experimento de psicologia; Preços de casas; número de sinistros por um cliente de seguro; número de filhos em uma família. Sua razoabilidade física geralmente decorre de ser delimitada abaixo (geralmente por zero), com valores baixos sendo plausíveis, até comuns, mas valores muito grandes (às vezes com ordens de magnitude mais altas) são bem conhecidos.
Para desvios negativos, acho mais difícil dar exemplos inequívocos e vívidos que um público mais jovem (estudantes do ensino médio) possa captar intuitivamente, talvez porque menos distribuições da vida real tenham um limite superior claro. Um exemplo de mau gosto que me ensinaram na escola foi "número de dedos". A maioria das pessoas tem dez, mas algumas perdem um ou mais em acidentes. O resultado foi "99% das pessoas têm um número de dedos acima da média"! Polidactilia complica a questão, pois dez não é um limite superior estrito; como dedos ausentes e extras são eventos raros, pode não ser claro para os alunos qual efeito predomina.
Eu costumo usar uma distribuição binomial com alta . Porém, os estudantes geralmente acham que "o número de componentes satisfatórios em um lote é inclinado negativamente" menos intuitivo do que o fato complementar de que "o número de componentes defeituosos em um lote é inclinado positivamente". (O livro é com tema industrial; prefiro ovos quebrados e intactos em uma caixa de doze.) Talvez os alunos achem que o "sucesso" deve ser raro.
Outra opção é apontar que, se é inclinado positivamente, então é inclinado negativamente, mas colocá-lo em um contexto prático ("os preços negativos da casa são inclinados negativamente") parece condenado ao fracasso pedagógico. Embora haja benefícios em ensinar os efeitos das transformações de dados, parece aconselhável dar um exemplo concreto primeiro. Eu preferiria um que não pareça artificial, onde a inclinação negativa é bastante inequívoca e para a qual a experiência de vida dos alunos deve dar-lhes uma consciência da forma da distribuição.
fonte
Respostas:
No Reino Unido, preço de um livro. Existe um "preço de varejo recomendado", que geralmente será o preço modal, e praticamente em nenhum lugar você teria que pagar mais. Mas algumas lojas terão descontos e algumas terão descontos consideráveis.
Além disso, idade de aposentadoria. A maioria das pessoas se aposenta aos 65-68 anos, quando a pensão do estado entra em ação, pouquíssimas pessoas trabalham mais, mas algumas se aposentam aos 50 e muitos anos.
Também o número de GCSEs que as pessoas recebem. A maioria das crianças entra 8-10 e, portanto, obtém 8-10. Um pequeno número faz mais. No entanto, algumas crianças não passam em todos os exames, por isso há um aumento constante de 0 a 7.
fonte
Nick Cox comentou com precisão que "a idade da morte é negativamente distorcida nos países desenvolvidos", o que eu pensei que era um ótimo exemplo.
Descobri que os números mais convenientes em que pude colocar as mãos vieram do Australian Bureau of Statistics ( em particular, usei esta planilha do Excel ), já que as faixas etárias deles chegavam a 100 anos e o homem australiano mais velho tinha 111 anos , então eu sentiu-se confortável cortando a lixeira final aos 110 anos. Outras agências nacionais de estatística pareciam frequentemente parar aos 95 anos, o que tornava o escopo final desconfortavelmente amplo. O histograma resultante mostra uma distorção negativa muito clara, bem como algumas outras características interessantes, como um pequeno pico na taxa de mortalidade entre crianças pequenas, o que seria adequado para discussão e interpretação em classe.
Seguindo o código R com dados brutos, o
HistogramTools
pacote se mostrou muito útil para plotagem com base em dados agregados! Obrigado a esta pergunta StackOverflow por sinalizá-la.fonte
Aqui estão os resultados para os quarenta atletas que concluíram com sucesso um salto legal na fase de qualificação do salto em distância olímpico masculino de 2012, apresentados em um gráfico de densidade de grãos com um gráfico de tapete embaixo.
Parece ser muito mais fácil estar um metro atrás do principal grupo de concorrentes do que um metro à frente, o que explicaria a distorção negativa.
Suspeito que alguns dos grupos no topo se devam aos atletas que se qualificam para a qualificação (que exigiu um resultado entre os 12 primeiros ou um resultado de 8,10 metros ou mais), em vez de alcançar a maior distância possível. O fato de os dois primeiros resultados terem 8,11 metros, logo acima da marca de qualificação automática, é altamente sugestivo, assim como os saltos conquistados por medalhas na final foram mais longos e mais distribuídos em 8,31, 8,16 e 8,12 metros. Os resultados na final tiveram uma leve inclinação, não significativa e negativa.
Para efeitos de comparação, os resultados para o Heptathlon Olímpico em Seul 1988 estão disponíveis no
heptathlon
conjunto de dados no pacote de RHSAUR
. Nessa competição, não houve rodada de qualificação, mas cada evento contribuiu com pontos para a classificação final; as competidoras apresentaram distorção negativa pronunciada nos resultados do salto em altura e distorção negativa no salto em distância. Curiosamente, isso não foi replicado nos eventos de lançamento (tiro e dardo), embora também sejam eventos nos quais um número maior corresponde a um resultado melhor. As pontuações dos pontos finais também foram distorcidas de maneira negativa.Dados e código
fonte
Pontuações em testes fáceis ou, alternativamente, pontuações em testes para os quais os alunos são especialmente motivados, tendem a ficar distorcidas.
Como resultado, as pontuações no SAT / ACT de estudantes que ingressam em faculdades procuradas (e mais ainda, seus GPAs) tendem a ficar desequilibradas. Há muitos exemplos em collegeapps.about.com, por exemplo, uma trama da Universidade de Chicago SAT / ACT e GPA está aqui .
Da mesma forma, os GPAs de graduados geralmente são desviados para a esquerda, por exemplo, os histogramas abaixo dos GPAs de graduados brancos e negros de uma universidade com fins lucrativos, extraídos da Fig. 5 de Gramling, Tim. " Como cinco características dos alunos preveem com precisão as chances de conclusão da universidade com fins lucrativos ". SAGE Open 3.3 (2013): 2158244013497026.
(Não é difícil encontrar outros exemplos semelhantes.)
fonte
Na Análise de Fronteira Estocástica, e especificamente em seu foco historicamente inicial, a produção, a função de produção de uma empresa / unidade de produção em geral, é especificada estocamente como
Assim, a distorção negativa é, eu diria, a modelagem mais natural dos esforços da própria raça humana: sempre se desviando do ideal imaginado - na maioria dos casos, fica atrás dela (a parte negativa da densidade), enquanto em relativamente poucos casos, transcendendo seus limites percebidos (a parte positiva da densidade). Os próprios alunos podem ser modelados como uma função de produção. É simples mapear a perturbação simétrica e o erro unilateral para aspectos da vida real. Não consigo imaginar o quão mais intuitivo alguém pode ser sobre isso.
fonte
A inclinação negativa é comum na hidrologia de inundação. Abaixo está um exemplo de uma curva de frequência de inundação (South Creek na Mulgoa Rd, lat -33.8783, lon 150.7683) que tirei de 'Australian Rainfall and Runoff' (ARR), o guia para estimativa de inundações desenvolvido por Engineers, Austrália.
Há um comentário no ARR:
Muitas vezes, as inundações, em um local específico, são consideradas como tendo um limite superior chamado 'Máxima provável de inundação' (PMF). Existem maneiras padrão de calcular um PMF.
fonte
As mudanças no preço dos ativos (retornos) geralmente têm uma inclinação negativa - muitos pequenos aumentos de preços com algumas grandes quedas de preço. A inclinação parece valer para quase todos os tipos de ativos: preços de ações, preços de commodities, etc. A inclinação negativa pode ser observada nas variações mensais de preços, mas é muito mais evidente quando você começa a observar as variações diárias ou a cada hora. Eu acho que esse seria um bom exemplo, porque você pode mostrar os efeitos da frequência na inclinação.
Mais detalhes: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
fonte
A idade gestacional no parto (especialmente para nascidos vivos) é deixada assimétrica. Os bebês podem nascer vivos muito cedo (embora as chances de sobrevivência continuada sejam pequenas quando muito cedo), atingem um pico entre 36 a 41 semanas e caem rapidamente. É típico que as mulheres nos EUA sejam induzidas se 41/42 semanas, portanto, geralmente não vemos muitos partos depois desse ponto.
fonte
Nas pescarias, existem frequentemente exemplos de distorção negativa devido a requisitos regulatórios. Por exemplo, a distribuição do comprimento dos peixes liberados na pesca recreativa; porque, às vezes, há um comprimento mínimo que um peixe deve ter para que seja retido; todos os peixes abaixo do limite são descartados. Porém, como as pessoas pescam em locais onde costumam existir peixes de comprimento legal, há uma inclinação e um modo negativos em relação ao limite superior legal. O comprimento legal não representa um corte rígido. Por causa dos limites da bolsa (ou do número de peixes que podem ser levados de volta à doca), as pessoas ainda descartam peixes de tamanho legal quando capturam peixes maiores.
por exemplo, Sauls, B. 2012. Um resumo dos dados sobre a distribuição de tamanho e as condições de liberação das devoluções do Red Snapper de pesquisas sobre pesca recreativa no Golfo do México. SEDAR31-DW11. SEDAR, Charleston do Norte, SC. 29 pp.
fonte
Algumas ótimas sugestões foram feitas neste tópico. No tema da mortalidade relacionada à idade, as taxas de falha da máquina são frequentemente uma função da idade da máquina e se enquadram nessa classe de distribuição. Além dos fatores financeiros já observados, as funções e distribuições de perdas financeiras se assemelham a essas formas, particularmente no caso de perdas de valor extremo, por exemplo, conforme encontrado nas estimativas do BIS III (Banco de Liquidação Internacional) do déficit esperado (ES), ou no BIS II, o valor em risco (VAR) como insumo para requisitos regulatórios para alocações de reservas de capital.
fonte
A idade da aposentadoria nos EUA é negativamente distorcida. A maioria dos aposentados é mais velha, com alguns se aposentando relativamente jovens.
fonte
Na teoria da matriz aleatória, a distribuição Tracy Widom é inclinada à direita. Essa é a distribuição do maior valor próprio de uma matriz aleatória. Por simetria, o menor autovalor tem distribuição negativa de Tracy Widom e, portanto, é inclinado para a esquerda.
Isso se deve basicamente ao fato de que os autovalores aleatórios são semelhantes a partículas carregadas que se repelem, e, portanto, o maior autovalor tende a ser empurrado para longe do resto. Aqui está uma foto exagerada (tirada daqui ):
fonte