Por que as estatísticas são úteis quando muitas coisas importantes são únicas?

18

Não sei se sou só eu, mas sou muito cético em relação às estatísticas em geral. Eu posso entender isso em jogos de dados, jogos de pôquer, etc. Jogos repetidos muito pequenos, simples e principalmente independentes são bons. Por exemplo, um pouso de moeda em sua borda é pequeno o suficiente para aceitar a probabilidade de que o pouso da cara ou coroa seja ~ 50%.

Jogar um jogo de pôquer de US $ 10 com o objetivo de obter uma vitória de 95% é bom. Mas e se toda a sua economia de vida + mais depender de você conseguir ou não uma vitória? Como saber se você venceria em 95% do tempo nessa situação me ajudaria? O valor esperado não ajuda muito lá.

Outros exemplos incluem uma cirurgia com risco de vida. Como isso ajuda a saber que é uma taxa de sobrevivência de 51% versus uma taxa de sobrevivência de 99%, dados dados existentes? Nos dois casos, não acho que seja importante para mim o que o médico me diz, e eu aceitaria. Se os dados reais forem de 75%, ele poderia me dizer (com exceção da ética e da lei), que há uma chance de sobrevivência de 99,9999999%, para que eu me sinta melhor. Em outras palavras, os dados existentes não importam, exceto binomialmente. Mesmo assim, não importa se há uma taxa de sobrevivência de 99,9999999, se eu acabar morrendo.

Além disso, probabilidade de terremoto. Não importa se um forte terremoto aconteceu a cada x (onde x> 100) anos, em média. Não tenho idéia se um terremoto acontecerá na minha vida. Então, por que essas informações são úteis?

Um exemplo menos sério, digamos, 100% dos lugares que já visitei estão nas Américas, indiferentes a 100% dos lugares que já visitei na Europa e odeio 100% dos lugares que já visitei esteve na Ásia. Agora, isso não significa que eu não encontraria um lugar que eu amo na Ásia na minha próxima viagem ou odeio na Europa ou indiferente na América, apenas pela natureza de que as estatísticas não capturam todas as informações que eu tenho. e provavelmente nunca consigo capturar todas as informações necessárias, mesmo que tenha viajado para mais de x% de todos esses continentes. Só porque existem incógnitas em 1% x desses continentes em que eu não estive. (Sinta-se à vontade para substituir os 100% por qualquer outra porcentagem).

Entendo que não há maneira de fazer força bruta em tudo e que você precisa confiar nas estatísticas em muitas situações, mas como podemos acreditar que as estatísticas são úteis em nossa situação única, especialmente quando as estatísticas basicamente não extrapolam para eventos extremos?

Alguma idéia para superar meu ceticismo em relação às estatísticas?

statskeptic
fonte
5
(+1) Bem-vindo ao nosso site! Não é só você: essa é uma questão profunda que vai para os fundamentos da estatística.
whuber
3
O exemplo de "economia de vida" combina questões separadas. Na economia, um modelo comum de aversão ao risco racional é maximizar a utilidade esperada, não o dinheiro esperado, onde a utilidade é tipicamente uma função côncava (sublinear) como log (dinheiro). Isso significa que as perdas custam mais do que ganhos do mesmo tamanho e esse efeito é maior para alterações maiores. Isso é muito diferente de não acreditar que exista alguma diferença entre e , o que leva a um comportamento inconsistente e irracional. 50.%99%
Douglas Zare
@DouglasZare isso soa como uma área muito interessante. Você pode fornecer um artigo introdutório ao tópico da aversão ao risco individual em relação à economia de vida?
Steffen
@steffen: Este material é abordado em muitos textos básicos de economia. A teoria da maximização da utilidade esperada é vista por muitos como muito simples e insuficiente para explicar muitos fenômenos, mas é um importante ponto de partida para entender antes de passar para idéias como a teoria da perspectiva. Algo que é facilmente explicado pela maximização esperada da utilidade, em vez da maximização esperada do dinheiro, não deve ser visto como uma falha da teoria das probabilidades. pt.wikipedia.org/wiki/Expected_utility_hypothesis
Douglas Zare
Isso me parece um tópico e discussão importante que pode permanecer aberto. (Eu entenderia se as pessoas quisessem fazer CW, no entanto.)
gung - Reinstate Monica

Respostas:

25

Primeiro, acho que você pode estar confundindo "estatísticas", significando uma coleção de números ou outros fatos que descrevem um grupo ou situação, e "estatísticas", significando a ciência de usar dados e informações para entender o mundo diante da variação (outros podem ser capaz de melhorar minhas definições). Os estatísticos usam os dois sentidos da palavra, por isso não é surpreendente quando as pessoas os misturam.

A estatística (a ciência) tem muito a ver com escolher estratégias e escolher a melhor estratégia, mesmo que apenas a apliquemos uma vez. Em algumas ocasiões em que eu (e outros) ensino probabilidade, usamos o clássico problema de Monty Hall (3 portas, 2 cabras, 1 carro) para motivá-lo e mostramos como podemos estimar probabilidades jogando o jogo várias vezes (não por prêmios ) e podemos ver que a estratégia "alternar" vence 2/3 das vezes e a estratégia "permanecer" vence apenas 1/3 das vezes. Agora, se tivéssemos a oportunidade de jogar o jogo uma única vez, saberíamos algumas coisas sobre qual estratégia oferece melhores chances de ganhar.

O exemplo da cirurgia é semelhante, você só fará a cirurgia (ou não terá a cirurgia) uma vez, mas não quer saber qual estratégia beneficia mais pessoas? Se suas escolhas são cirurgia com alguma chance maior que 0% de sobrevivência ou nenhuma cirurgia e 0% de sobrevivência, sim, há pouca diferença entre a cirurgia ter 51% de sobrevivência e 99,9% de sobrevivência. Mas e se houver outras opções também, você pode escolher entre cirurgia, não fazer nada (que tem 25% de sobrevivência) ou uma mudança de dieta e exercício que tenha 75% de sobrevivência (mas exige esforço de sua parte), não você se preocupa se a opção de cirurgia tem 51% vs. 99% de sobrevivência?

Considere também o médico, ele estará fazendo mais do que apenas sua cirurgia. Se a cirurgia tiver 99,9% de sobrevida, ele não terá motivos para considerar alternativas, mas se tiver apenas 51% de sobrevida, embora possa ser a melhor opção hoje, ele deve procurar outras alternativas que aumentem essa sobrevida. Sim, mesmo com 90% de sobrevida, ele perderá alguns pacientes, mas qual estratégia lhe dá a melhor chance de salvar o maior número de pacientes?

Hoje de manhã eu usava o cinto de segurança enquanto dirigia (minha estratégia habitual), mas não sofri nenhum acidente; minha estratégia foi uma perda de tempo? Se eu soubesse quando iria sofrer um acidente, poderia economizar tempo apenas colocando o cinto de segurança nessas ocasiões e não em outras. Mas não sei quando vou sofrer um acidente, por isso vou manter minha estratégia de usar o cinto de segurança, porque acredito que me dará a melhor chance se eu estiver em um acidente, mesmo que isso signifique perder um pouco de tempo e esforço na alta porcentagem (espero 100%) de vezes que não há acidente.

Greg Snow
fonte
+1 Greg Bom post! Eu estava escrevendo o meu ao mesmo tempo que você. Podemos nos sobrepor um pouco, mas acho que nós dois tínhamos coisas a dizer que estavam certas e não se sobrepuseram. Não tenho certeza do que o OP pensa que são estatísticas. É bom que você tenha lhe dado o benefício da dúvida. Adotei uma abordagem mais irritada.
Michael R. Chernick
Olá Greg, gostei da sua resposta, mas posso argumentar assim: a estatística (a ciência) é em si uma estatística, funciona por x% do tempo (possivelmente alto x), mas há 1% x desconhecido / fatores aleatórios que sempre precisamos estar cientes. Dado que podemos modelar o desconhecido de qualquer maneira (possivelmente infinita), nunca conheceremos x. Espero que esses valores extremos nunca ocorram, mas devemos sempre estar atentos e errar com o conservador, especialmente se o evento for catastrófico (por exemplo, asteróides, produtos financeiros, acidentes nucleares para a sociedade e acidentes de carro para uso pessoal). Isso faz sentido?
statskeptic
@statskeptic, o que você diz se aplica a todas as áreas, não apenas às estatísticas. De fato, isso se aplica menos a estatísticas verdadeiras do que outros campos, porque quando as estatísticas são feitas corretamente, as suposições são claras. Na maioria das vezes as estatísticas falharam, não foram as técnicas, mas foram aplicadas incorretamente. Em qualquer campo que envolva incerteza (que é praticamente qualquer coisa que não seja religião ou matemática pura, e até mesmo algumas), você pode ter uma resposta que seja errada, inútil ou que use estatísticas.
Greg Snow
(+1) para as estatísticas serem "a ciência do uso de dados e informações para entender o mundo diante da variação"
passe pela metade de
4

Só porque você não usa estatísticas em sua vida diária não significa que o campo não o afeta diretamente. Quando você está no médico e eles recomendam um tratamento em detrimento do outro, você pode apostar que, por trás dessa recomendação, havia muitos ensaios clínicos que usavam estatísticas para interpretar os resultados de seus experimentos.

Acontece que o conceito de valor esperado também é muito útil, mesmo se você não o usar pessoalmente. Seu exemplo de aposta em sua economia de vida não leva em consideração o risco que você tem. Outras situações podem ter menos riscos adversos ou onde não há resultados catastróficos. Negócios, finanças, contextos atuariais e outros são exemplos disso. Talvez você esteja emitindo apólice de seguro residencial - então, de repente, saber a probabilidade de um terremoto ocorrer dentro de um determinado período de tempo é muito importante.

No final, as estatísticas são uma ótima maneira de lidar com a incerteza. No seu último exemplo, você criou alguns dados sobre lugares que gosta de viajar e afirmou que as estatísticas dizem que você nunca encontrará um lugar na Ásia que gosta. Isso está errado. É claro que esses dados farão com que você acredite que a Ásia tem menos chances de ter um lugar que você gosta, mas você pode definir sua crença anterior como o que quiser, e as estatísticas mostrarão como atualizar sua crença diante dos novos dados. Além disso, permite modificar sua crença de uma maneira baseada em princípios que lhe permitirá agir racionalmente na presença de incerteza.

jlund3
fonte
O exemplo itinerante foi apenas um exemplo inventado, mas a idéia é que as estatísticas não capturam o desconhecido. Seu exemplo de contextos comerciais me fez pensar no exemplo das companhias de seguros do WTC provavelmente estimou o custo / benefício de segurar o prédio sem levar em consideração os aviões que o destruíram, mas ainda assim é o que mais importa.
statskeptic
+1 @ jjund3 por abordar questões específicas dos POs e por misturar estatisticas bayesianas e freqüentistas sem nenhum conflito.
Michael R. Chernick
@statskeptic O seu ponto de vista de que as estatísticas não podem dar conta de todas as incertezas possíveis é bom. Mas não precisa ser completo e perfeito para ser útil. Nós temos conhecimento sobre terroristas. Antes do 11 de setembro, tínhamos exemplos de terroristas em missões suicidas e tivemos experiência com o ataque de aviões. As informações poderiam ter sido reunidas para determinar que colidir com um aplane no World Trade Center era uma possibilidade, embora provavelmente a tivéssemos avaliado como uma possibilidade remota.
Michael R. Chernick
Sabíamos que o World Trade Center era o alvo favorito dos terristas. Já fora atacado uma vez com uma bomba detonada no porão. O fato de a bomba não ter força suficiente para causar o dano desejado era pelo menos um indício de que na próxima vez algum método muito diferente seria usado. Obviamente, como costuma ser dito, a visão posterior é 20-20. Existem muitos exemplos em que o inesperado ou improvável acontece. Mas não no caso do desastre de Challanger. Lá, os engenheiros da Thiokol, mesmo com dados limitados, sabiam que havia alguns riscos de uma falha catastrófica devido à falha dos O-rings a baixa temperatura.
Michael R. Chernick
1
@statskeptic Seu argumento é muito semelhante ao ceticismo / contusão de estatísticas de Taleb em seu livro O Cisne Negro. Eu acho que muitos estatísticos, inclusive eu, abriram brechas em seu argumento, que diz basicamente que a estatística é inútil porque não pode prever esse evento raro e impensável (11 de setembro no seu exemplo, a quebra da bolsa de valores na dele).
Michael R. Chernick
1

O mundo é estocástico, não determinístico. Se fosse determinista, os físicos governariam o mundo e os estatísticos ficariam sem emprego. Mas a realidade é que os estatísticos estão em alta demanda em quase todas as disciplinas. Isso não quer dizer que não haja lugar para a física e outras ciências, mas a estatística trabalha de mãos dadas com a ciência e é a base de muitas descobertas científicas.

Chega de conversa e até detalhes. Trabalhei nos últimos 17 anos na indústria médica, primeiro em dispositivos médicos, depois em produtos farmacêuticos e agora em pesquisa médica geral. Drogas e dispositivos médicos que melhoram a qualidade de vida e freqüentemente salvam ou prolongam a vida são desenvolvidos e aprovados regularmente neste país e em todo o mundo. Nos EUA, a aprovação exige evidências de segurança e eficácia antes que o FDA permita a comercialização de um medicamento ou dispositivo médico. A evidência para o FDA vem de ensaios clínicos em fases. Todos os ensaios clínicos requerem métodos estatísticos e de análise válidos. Nada é perfeito. Os medicamentos funcionam bem para algumas pessoas, enquanto outros podem não responder ou terão eventos adversos (reações ruins que podem causar doenças ou morte). Os ensaios separam os medicamentos ineficazes dos eficazes. A maioria dos medicamentos falha e geralmente há um ciclo de dez anos, desde o desenvolvimento inicial até o final da fase III, com aprovação e comercialização no final do estudo. A vigilância pós-mercado, que também exige estatísticas, é aplicada para garantir que o medicamento funcione suficientemente bem para a população em geral. Às vezes, a população geral para a qual o medicamento é aprovado é um grupo menos restritivo do que os pacientes elegíveis para os ensaios clínicos. Às vezes, as drogas se tornam perigosas e são retiradas do mercado. As estatísticas ajudam em todos os aspectos da segurança de medicamentos. A vigilância pós-mercado, que também exige estatísticas, é aplicada para garantir que o medicamento funcione suficientemente bem para a população em geral. Às vezes, a população geral para a qual o medicamento é aprovado é um grupo menos restritivo do que os pacientes elegíveis para os ensaios clínicos. Às vezes, as drogas se tornam perigosas e são retiradas do mercado. As estatísticas ajudam em todos os aspectos da segurança de medicamentos. A vigilância pós-mercado, que também exige estatísticas, é aplicada para garantir que o medicamento funcione suficientemente bem para a população em geral. Às vezes, a população geral para a qual o medicamento é aprovado é um grupo menos restritivo do que os pacientes elegíveis para os ensaios clínicos. Às vezes, as drogas se tornam perigosas e são retiradas do mercado. As estatísticas ajudam em todos os aspectos da segurança de medicamentos.

Estatística não é perfeita. Vivemos com alguns erros devido à aleatoriedade e incerteza. Mas é controlado e nossas vidas são melhores e os erros são reduzidos do que seriam se a ciência estatística não estivesse envolvida.

Michael R. Chernick
fonte
Não me interpretem mal. Eu entendo que há estatística em tudo, mesmo a física com mecânica quântica tem tudo a ver com probabilidade e não há átomos suficientes para fazer computação sem estatística. Eu só quero descobrir como lidar com a aleatoriedade e a incerteza que podem influenciar a minha vida (ou de outras pessoas) mais do que qualquer estatística ou distribuição real.
statskeptic
Ok statskeptic, para que você não fique confuso. Mas por que é tão difícil ver como as estatísticas aumentam sua chance de sucesso. A teoria da probabilidade mostra as chances de ganhar jogos de azar. Se você pudesse usar a estratégia Beat the Dealer de Thorpe no blackjack e tiver um grande banco de fundos, poderá fazer uma fortuna a longo prazo. Os alunos do MIT provaram isso em Las Vegas, embora a vantagem na contagem tenha sido reduzida pelo uso da mistura de vários decks. É verdade. O cassino sabe que os contadores de cartas são uma ameaça.
Michael R. Chernick
Eles os procuram e, quando acham que encontram um, jogam-no para fora do cassino, sem fazer perguntas.
Michael R. Chernick
Além disso, por favor, não pense que estou tentando inflamar sua profissão. Existem computadores que estão computando estatisticamente para economizar energia, e eu respeito isso. Estou apenas tentando aprender como as pessoas com muito mais conhecimento do que eu nas estatísticas lidam com essas questões.
statskeptic
@statskeptic Eu vi o meu post original, peço desculpas pelos meus comentários iniciais. Eles foram devidamente editados por um moderador. Acho que não entendi o que você estava tentando dizer. Espero que tenhamos respondido bem à sua pergunta e aliviado um pouco do seu ceticismo.
Michael R. Chernick
1

Eu mesmo tenho as mesmas dúvidas sobre a utilidade da probabilidade e das estatísticas quando se trata de tomar decisões sobre um único evento. Na minha opinião, conhecer a probabilidade real ou estimada é extremamente importante quando o objetivo é estimar os resultados das amostras, sejam eles um único evento repetido várias vezes ou uma amostra afogada de uma determinada população. Em resumo, conhecer a probabilidade faz mais sentido para o cassino que, com base nos cálculos de probabilidade, pode estabelecer as regras que garantem que ele venceria a longo prazo (após muitas jogadas) e não para um jogador que finge jogar uma vez, então ele ganharia ou perderia (esses são os resultados quando o experimento é realizado uma única vez). Também é importante para os generais que consideram enviar seus soldados para uma batalha com o risco (probabilidade) de perder 10% deles, mas não para uma certa solda (digamos, John) que só vai morrer ou sobreviver. Existem muitos exemplos como esses na vida real.

O ponto que quero enfatizar é que, Probabilidade e Estatística, não só são úteis na vida real, mas, mais precisamente, são uma ferramenta para todas as pesquisas científicas modernas e regras de tomada de decisão. No entanto, não é correto dizer que racionalidade implica confiar na probabilidade de um único evento, sem a intenção ou a possibilidade de repeti-lo, para estimar o resultado. A tendência da probabilidade de influenciar a decisão de um determinado indivíduo, com base em seu grau de aversão ao risco, é obviamente subjetiva. A prevenção de riscos e o amante de riscos têm atitudes (decisões) diferentes em relação à mesma loteria (o mesmo valor esperado).

Mohamed Lemine
fonte
O ponto sobre aversão ao risco é interessante, em termos de como as pessoas reagem a um evento incerto. Mas observe que, quando os economistas consideram a escolha sob incerteza (por exemplo, mercadorias dependentes do estado do mundo), a verdadeira probabilidade entra em jogo através da linha de chances justas (uma restrição orçamentária que reflete os possíveis pacotes sob uma aposta atuarialmente justa). Os agentes se comportam não apenas de acordo com suas preferências (por exemplo, aversão ao risco), mas também de acordo com a interação de sua restrição orçamentária (a aposta disponível) e a avaliação da linha de chances justas.
Silverfish
Resumidamente, não é verdade que todas as pessoas avessas ao risco "nunca jogam" (no sentido mais amplo da palavra), apenas que não podem ser tentadas a jogar por probabilidades atuariais justas. Um prêmio de risco suficiente (dependente de seu grau de aversão ao risco) pode alterar essa decisão, no entanto. Como essa análise depende da percepção do agente sobre as probabilidades justas, mesmo em uma "oportunidade única", um agente racional pesará as probabilidades.
Silverfish
1- Não disse que pessoas avessas ao risco nunca jogam. 2-O que eu quis dizer com "subjetivo" é que conhecer o valor esperado de uma loteria não determina a atitude de uma pessoa em relação a ela. Todas as outras coisas iguais, essa atitude é uma função de uma característica pessoal, que é o grau de aversão ao risco que determina a utilidade esperada da aposta. 3-A racionalidade na teoria econômica depende de hipóteses e, portanto, é relativa. É por isso que dois indivíduos que mostram atitudes diferentes em relação ao mesmo valor esperado podem ser chamados de "racionais".
Mohamed Lemine
Gostaria de não perder o ponto central desta discussão, que está lidando com o fato de que eventos com probabilidade muito baixa podem ocorrer em qualquer trilha. e vice-versa.
Mohamed Lemine
-4

A longa e a curta é que a probabilidade é a generalização única da lógica verdadeira / falsa comum para graus de crença entre 0 e 1. Essa é a chamada interpretação bayesiana lógica da probabilidade, originada por RT Cox e posteriormente defendida por ET. Jaynes.

Além disso, sob premissas fracas, pode ser demonstrado que a maneira correta de ordenar resultados incertos por preferência é ordená-los pela utilidade esperada, com o esperado em relação à distribuição de probabilidade sobre os resultados.

Veja Robert Clemen, "Making Hard Decisions", para uma introdução e exposição sobre a análise de decisão aplicada, baseada na probabilidade bayesiana e na utilidade esperada.

Você está absolutamente certo em ser cético em relação às estatísticas freqüentistas convencionais; pelo projeto de seus inventores (RA Fisher, J. Neyman, E. Pearson), é limitado a eventos repetitivos. Mas muitos problemas cotidianos não envolvem eventos repetitivos. O que fazer? A abordagem típica é uma combinação de forçar pinos quadrados em orifícios redondos e mover as traves. Vergonhoso, realmente.

Robert Dodier
fonte
4
-1 Na ​​minha opinião, um retrato muito pobre e injusto das estatísticas freqüentistas. Eu não adotaria uma visão tão negativa da abordagem bayesiana. Mas os bayesianos (qualquer campo) não estão livres de críticas. O grau de crença deve ser o grampo da inferência? O grau de crença é subjetivo e pessoal, para que duas pessoas possam dar duas respostas diferentes? E a necessidade de uma distribuição prévia? Como deve ser escolhido? Muitas perguntas para qualquer paradigma de inferência. Mas não estamos além do estágio de discussões hostis sobre as fundações?
Michael R. Chernick
5
Há mais sobre o método científico para nos unir e dizer retumbantemente que a ESTATÍSTICA É IMPORTANTE ao enfrentar um cético. Em vez disso, você concorda com o cético, a fim de ter uma chance barata dos métodos freqüentistas! É isso que é vergonhoso.
Michael R. Chernick
@ MichaelChernick: (1) simplesmente gritar ESTATÍSTICA É IMPORTANTE dificilmente é um argumento que irá conquistar um cético. (2) A inferência bayesiana tem a mesma relação com os dados do problema que a lógica comum. Ou seja, dadas algumas premissas, você cria uma solução aplicando leis de probabilidade. Os dados (por exemplo, qualquer distribuição anterior) não estão certos nem errados; eles simplesmente são. Pessoas razoáveis ​​discordam sobre distribuições anteriores, assim como poderiam sobre outros dados de problemas.
Robert Dodier
2
Não me importo de entrar em uma discussão sobre as fundações. Este não é o lugar apropriado e o meu único ponto para você é que acho que você tomou uma atitude barata e que sua resposta foi inadequada. Isso não requer uma discussão sobre os fundamentos da estatística.
Michael R. Chernick
4
Abraço pessoal.
Brandon Bertelsen
-4

Sou cético em relação às estatísticas pelos seguintes motivos.

  1. Estou convencido de que alguém sem uma graduação em estatística não tem idéia do que está fazendo. Unf. existem milhões de pessoas em todo o mundo pesquisando sem uma pós-graduação em estatística. Eu era graduado em matemática na Universidade de Maryland College, Park. Tomei 4 400 aulas de matemática de nível. Tudo o que os professores fizeram foi ensinar como calcular coisas. Ninguém me ensinou como entender alguma coisa ou fazer qualquer análise estatística, exceto no teste de hipóteses, o que não faz sentido por 2 razões.
    1. Para cada teste de hipótese que me ensinaram, eu tive que fazer suposições de antemão. Ninguém me ensinou com quais suposições eu tinha que começar. 2. Valores P não fazem sentido logicamente. Uma pós-graduação em estatística pode ensinar qual é o valor de um p. No entanto, estou convencido de que nenhum estudante de graduação sabe como usá-lo. A definição de graduação assume uma probabilidade de algo que depende da hipótese estar correta. Logicamente, a definição não faz sentido. Pior ainda, ninguém nunca me disse de onde vem a probabilidade. Na verdade, enviei um e-mail para quase todo o meu departamento de matemática (mais de 200 pessoas) se alguém pudesse me dar uma resposta. As respostas mais populares e únicas foram "seria necessário ASSUMIR as taxas de erro para a probabilidade" (quando perguntei às pessoas como isso foi feito, todas elas me responderam "
    O mesmo aconteceu quando pesquisei no Google qual a significância do valor de um p. Isso me leva à conclusão ...

  2. Até um sig. número de professores de matemática e estatística não tem idéia de qual é a lógica por trás da estatística. Não espero que as pessoas tenham um conhecimento profundo. No entanto, tenho a sensação de que mesmo um sig. % de pesquisadores e professores não entendem a lógica subjacente às estatísticas.

  3. Erro estatístico não é a mesma coisa que erro real. Como as pessoas gostam de usar as estatísticas para derivar estimativas para coisas que são enormes, as pessoas gostam de usar o erro estatístico para "mascarar" o fato de que não têm idéia do erro real.

  4. As pessoas usam amostras pequenas para grandes populações porque a teoria estatística diz que eles podem. Aprendi com um dos meus cursos universitários, que as pessoas gostam de usar dados estimados em cerca de 30 escolas no país para mostrar que existem poucos incidentes violentos nas escolas em todo o país. Existem cerca de 100.000 escolas. Isso parece loucura. Todo um movimento popular é baseado em cerca de 30 escolas em todo o país.

  5. As pessoas gostam de tornar estatístico o ônus da prova. O Higgs Bossom nunca foi descoberto. Foi descoberto estatisticamente, mas isso não significa nada. Algo sendo descoberto puramente estatisticamente é inútil, porque ninguém sabe a precisão das estatísticas.

  6. As pessoas gostam de usar estatísticas para fazer descrições importantes. As estatísticas podem ser usadas como um guia, mas ninguém sabe o quão preciso é realmente. Só porque um problema parece impossível de resolver não significa que a estatística é a próxima melhor coisa. O fato de o teste de DNA ser baseado em estatística me dá calafrios. Posso receber a pena de morte só por causa das estatísticas? Um assassino poderia ser libertado da prisão por causa de estatísticas?

Acredito que as estatísticas podem ser úteis, mas apenas se não forem usadas como conclusão. Acredito que as estatísticas podem nos dizer quais são algumas das possibilidades. Então lógica, não lógica estatística, deve ser usada para provar quais possibilidades estão corretas.

Alexander Kao
fonte
1
"... inútil porque ninguém conhece a precisão das estatísticas", e suas queixas sobre tirar conclusões de evidências estatísticas como uma amostra de escolas ou DNA sugerem que você não confia em inferência estatística . No entanto, muitas vezes uma amostra limitada é toda a evidência disponível ou todos os dados que você pode se dar ao luxo de capturar. Como avaliar essas evidências? Enfrentamos incertezas, pois nossa amostra não reflete exatamente a população em geral. A inferência lida com essa incerteza, por exemplo, os intervalos de confiança medem a incerteza nas estatísticas da amostra, como a média da amostra (aproximadamente, a "precisão" das estatísticas é conhecida).
Silverfish
2
"os professores não entendem nenhuma lógica subjacente à estatística" - existem algumas filosofias radicalmente diferentes da estatística (ver, por exemplo, o debate bayesiano-freqüentista), mas a maioria das pessoas é pragmática sobre as técnicas que aplicam a um problema específico. Isso pode não ser muito importante, se é que existe, em um curso de graduação, mas a filosofia da estatística certamente não foi elaborada aleatoriamente no verso de um envelope um dia. Quanto aos valores-p, "Logicamente, a definição não faz sentido": talvez você deva consultar esta pergunta no CV .
Silverfish
1
Discursos especulativos não são considerados respostas apropriadas nos sites da SE. Eles podem ser divertidos - e podem conter algumas verdades, como eu acredito que este faz - mas no final eles morrem tristes, como na avaliação sombria da vida do homem em Macbeth, Ato V, cena 5, linhas 26-28 .
whuber