Como NÃO usar estatísticas

15

Essa é uma pergunta em aberto, mas quero deixar claro. Dada uma população suficiente, você poderá aprender alguma coisa (esta é a parte aberta), mas o que você aprender sobre sua população, quando isso será aplicável a um membro da população?

Pelo que entendi das estatísticas, nunca é aplicável a um único membro de uma população; no entanto, muitas vezes me encontro em uma discussão em que a outra pessoa diz "eu li que 10% da população mundial tem essa doença" e continuo a Conclua que cada décima pessoa na sala tem essa doença.

Entendo que dez pessoas nesta sala não são uma amostra grande o suficiente para a estatística ser relevante, mas aparentemente muitas não.

Depois, há essa coisa sobre amostras grandes o suficiente . Você só precisa investigar uma população grande o suficiente para obter estatísticas confiáveis. Isso, porém, não é proporcional à complexidade da estatística? Se estou medindo algo muito raro, isso não significa que preciso de uma amostra muito maior para poder determinar a relevância dessa estatística?

O fato é que eu realmente questiono a validade de qualquer jornal ou artigo quando há estatísticas envolvidas, da maneira como são usadas para criar confiança.

Isso é um pouco de fundo.

De volta à pergunta, de que maneira você NÃO pode ou NÃO pode usar estatísticas para formar um argumento . Neguei a pergunta porque gostaria de descobrir mais sobre equívocos comuns sobre estatísticas.

John Leidegren
fonte
2
Esta é apenas uma resposta muito parcial, por isso não vou publicá-la como resposta. Você ESTÁ correto que estatísticas complexas precisam de populações maiores; você está se referindo ao conceito de "graus de liberdade", que é simplesmente o número de variáveis ​​independentes menos uma. Além disso, ao fazer algo como um teste-p, seu limite de rejeição depende do número de graus de liberdade, além do valor-p que você escolheu (normalmente 0,05).
2
Se mais pessoas lerem o livro Como contar aos mentirosos, de Hooke, dos estatísticos , talvez não existam tantos "otários estatísticos" quanto o que temos agora no mundo.
JM não é estatístico
1
Acho que você pode se beneficiar de fazer esta pergunta no stats stackexchange - sinalizei a pergunta para que talvez ela seja movida para lá.
InterestedGuest
Eu nem sabia que tínhamos um fórum dedicado à análise estatística. Eu mover a pergunta: Se eu soubesse como ...

Respostas:

2

Para tirar conclusões sobre um grupo com base na população, o grupo deve ser representativo da população e independente. Outros já discutiram isso, então não vou me debruçar sobre essa peça.

Outra coisa a considerar é a não-intuitividade das probabilidades. Vamos supor que tenhamos um grupo de 10 pessoas independentes e representativas da população (amostra aleatória) e que sabemos que na população 10% têm uma característica específica. Portanto, cada uma das 10 pessoas tem 10% de chance de ter a característica. A suposição comum é que é bastante certo que pelo menos 1 terá a característica. Mas esse é um problema binomial simples, podemos calcular a probabilidade de que nenhum dos 10 tenha a característica, é de cerca de 35% (converge para 1 / e para um grupo maior / menor probabilidade) o que é muito maior do que a maioria das pessoas imaginaria. Há também uma chance de 26% de que 2 ou mais pessoas tenham essa característica.

Greg Snow
fonte
9

A menos que as pessoas na sala sejam uma amostra aleatória da população mundial, quaisquer conclusões baseadas em estatísticas sobre a população mundial serão muito suspeitas. Uma em cada cinco pessoas no mundo é chinesa, mas nenhum dos meus cinco filhos é ...


fonte
6
  1. Para abordar a aplicação excessiva de estatísticas em pequenas amostras, recomendo combater piadas conhecidas ("Estou tão empolgada que minha mãe está grávida de novo e meu irmão bebê é chinês." "Por quê?". é chinês ").

  2. Na verdade, eu recomendo piadas para abordar todos os tipos de equívocos nas estatísticas, consulte http://xkcd.com/552/ para correlação e causalidade.

  3. O problema dos artigos de jornal raramente é o fato de tratar um fenômeno raro.

  4. O paradoxo de Simpsons vem à mente como exemplo de que as estatísticas raramente podem ser usadas sem análise das causas.

Phira
fonte
2
A variação da piada "O bebê chinês" Eu ouvi tinha a gestante ter medo de que seu bebê pode ser considerado como um estrangeiro ilegal e, portanto, deportados ...
JM não é um estatístico
3

Existe um artigo interessante de Mary Gray sobre o uso indevido de estatísticas em processos judiciais e coisas assim ...

Gray, Mary W .; Estatística e Direito. Matemática. Mag. 56 (1983), n. 2, 67-81

Gerald Edgar
fonte
1

Análise estatística ou dados estatísticos?

Penso que este exemplo na sua pergunta se refere a dados estatísticos: "Eu li que 10% da população mundial tem essa doença". Em outras palavras, neste exemplo, alguém usa números para ajudar a comunicar a quantidade de maneira mais eficaz do que apenas dizer 'muitas pessoas'.

Meu palpite é que a resposta para sua pergunta está oculta na motivação do orador sobre o motivo pelo qual ela está usando números. Poderia ser para comunicar alguma noção melhor ou mostrar autoridade ou deslumbrar o ouvinte. A coisa boa sobre declarar números em vez de dizer "muito grande" é que as pessoas podem refutar o número. Veja a idéia de Popper sobre refutação.

b_dev
fonte
0

Hipótese: UMA

(Livro didático) Resultado: não rejeiteUMA (σ=c)

Sua declaração: UMA mantém com probabilidade σ!

Correto seria: Nesse caso, você não sabe nada. Se você quer "provar"UMA, sua hipótese deve ser ¬UMA; rejeite-o comσ to get the desired statement.

Raphael
fonte
0

From what I understand of statistics it's never applicable to a single member of a population

It's not true. It depends on the application.

Example: nuclear decay in physics. The rate of decay, defines the probability of a decay of every single nucleus. You take any nucleus and it'll have exactly the same probability of decay, which you established by experimentation on the sample.

Aksakal
fonte