Essa é uma pergunta em aberto, mas quero deixar claro. Dada uma população suficiente, você poderá aprender alguma coisa (esta é a parte aberta), mas o que você aprender sobre sua população, quando isso será aplicável a um membro da população?
Pelo que entendi das estatísticas, nunca é aplicável a um único membro de uma população; no entanto, muitas vezes me encontro em uma discussão em que a outra pessoa diz "eu li que 10% da população mundial tem essa doença" e continuo a Conclua que cada décima pessoa na sala tem essa doença.
Entendo que dez pessoas nesta sala não são uma amostra grande o suficiente para a estatística ser relevante, mas aparentemente muitas não.
Depois, há essa coisa sobre amostras grandes o suficiente . Você só precisa investigar uma população grande o suficiente para obter estatísticas confiáveis. Isso, porém, não é proporcional à complexidade da estatística? Se estou medindo algo muito raro, isso não significa que preciso de uma amostra muito maior para poder determinar a relevância dessa estatística?
O fato é que eu realmente questiono a validade de qualquer jornal ou artigo quando há estatísticas envolvidas, da maneira como são usadas para criar confiança.
Isso é um pouco de fundo.
De volta à pergunta, de que maneira você NÃO pode ou NÃO pode usar estatísticas para formar um argumento . Neguei a pergunta porque gostaria de descobrir mais sobre equívocos comuns sobre estatísticas.
Respostas:
Para tirar conclusões sobre um grupo com base na população, o grupo deve ser representativo da população e independente. Outros já discutiram isso, então não vou me debruçar sobre essa peça.
Outra coisa a considerar é a não-intuitividade das probabilidades. Vamos supor que tenhamos um grupo de 10 pessoas independentes e representativas da população (amostra aleatória) e que sabemos que na população 10% têm uma característica específica. Portanto, cada uma das 10 pessoas tem 10% de chance de ter a característica. A suposição comum é que é bastante certo que pelo menos 1 terá a característica. Mas esse é um problema binomial simples, podemos calcular a probabilidade de que nenhum dos 10 tenha a característica, é de cerca de 35% (converge para 1 / e para um grupo maior / menor probabilidade) o que é muito maior do que a maioria das pessoas imaginaria. Há também uma chance de 26% de que 2 ou mais pessoas tenham essa característica.
fonte
A menos que as pessoas na sala sejam uma amostra aleatória da população mundial, quaisquer conclusões baseadas em estatísticas sobre a população mundial serão muito suspeitas. Uma em cada cinco pessoas no mundo é chinesa, mas nenhum dos meus cinco filhos é ...
fonte
Para abordar a aplicação excessiva de estatísticas em pequenas amostras, recomendo combater piadas conhecidas ("Estou tão empolgada que minha mãe está grávida de novo e meu irmão bebê é chinês." "Por quê?". é chinês ").
Na verdade, eu recomendo piadas para abordar todos os tipos de equívocos nas estatísticas, consulte http://xkcd.com/552/ para correlação e causalidade.
O problema dos artigos de jornal raramente é o fato de tratar um fenômeno raro.
O paradoxo de Simpsons vem à mente como exemplo de que as estatísticas raramente podem ser usadas sem análise das causas.
fonte
Existe um artigo interessante de Mary Gray sobre o uso indevido de estatísticas em processos judiciais e coisas assim ...
Gray, Mary W .; Estatística e Direito. Matemática. Mag. 56 (1983), n. 2, 67-81
fonte
Quando se trata de lógica e bom senso, tenha cuidado, esses dois são raros. Com certas "discussões", você pode reconhecer algo ...... o objetivo do argumento é o argumento.
http://www.wired.com/wiredscience/2011/05/the-sad-reason-we-reason/
fonte
Análise estatística ou dados estatísticos?
Penso que este exemplo na sua pergunta se refere a dados estatísticos: "Eu li que 10% da população mundial tem essa doença". Em outras palavras, neste exemplo, alguém usa números para ajudar a comunicar a quantidade de maneira mais eficaz do que apenas dizer 'muitas pessoas'.
Meu palpite é que a resposta para sua pergunta está oculta na motivação do orador sobre o motivo pelo qual ela está usando números. Poderia ser para comunicar alguma noção melhor ou mostrar autoridade ou deslumbrar o ouvinte. A coisa boa sobre declarar números em vez de dizer "muito grande" é que as pessoas podem refutar o número. Veja a idéia de Popper sobre refutação.
fonte
Hipótese:UMA
(Livro didático) Resultado: não rejeiteUMA (σ= c )
Sua declaração:UMA mantém com probabilidade σ !
Correto seria: Nesse caso, você não sabe nada. Se você quer "provar"UMA , sua hipótese deve ser ¬ A ; rejeite-o comσ to get the desired statement.
fonte
It's not true. It depends on the application.
Example: nuclear decay in physics. The rate of decay, defines the probability of a decay of every single nucleus. You take any nucleus and it'll have exactly the same probability of decay, which you established by experimentation on the sample.
fonte