Pesquisas por aí (digamos, Gallup) mostram um número absurdamente baixo de pessoas em comparação com o tamanho da população (por exemplo, talvez mil pessoas entre centenas de milhões).
Agora, para mim, amostrar uma população como um meio de estimar as estatísticas da população faz sentido quando você tem um forte motivo para acreditar que as amostras são representativas da população (ou, de maneira semelhante, de outras amostras ) .
Por exemplo, a amostragem obviamente faz sentido para estudos médicos, porque sabemos a priori que todos os seres humanos têm genomas bastante semelhantes e que esse fator faz com que seus corpos se comportem de maneira semelhante.
Observe que isso não é algum tipo de acoplamento solto - o genoma é um fator determinante bastante forte .
No entanto, eu simplesmente não entendo o que justifica o uso de amostras baixas para coisas como pesquisas políticas.
Eu poderia comprar que talvez 80-90% das pessoas em qualquer bairro votem da mesma forma para o presidente (devido a contextos socioeconômicos / educacionais semelhantes), mas isso dificilmente parece justificar o número absurdamente baixo de amostras. Não há literalmente nenhuma razão convincente (pelo menos para mim) por que 1000 eleitores aleatórios devem se comportar como os 200 milhões de outros eleitores.
Para mim, você precisaria de pelo menos (digamos) 100 × esse valor. Por quê? Posso pensar em várias razões, por exemplo:
Existem ~ 22.000 delegacias apenas na Califórnia . As pessoas crescem de maneira tão diferente em suas origens econômicas e educacionais que uma pesquisa de tamanho 1000 parece ridiculamente pequena. Como você pode resumir delegacias inteiras com <1 pessoa em média?
As pessoas geralmente não podem mudar as respostas de seus corpos à medicina, mas podem mudar suas opiniões sobre política apenas pensando sobre isso. Do meu ponto de vista, não há fator forçador semelhante ao DNA na medicina quando você está lidando com política. Na melhor das hipóteses, eu imagino que deve haver pequenos bolsões de correlação.
No entanto, de alguma forma, pesquisas como essa parecem ... funcionar de qualquer maneira? Ou pelo menos as pessoas parecem pensar que sim?
Mas por que deveriam? Talvez eu fundamentalmente não entenda a amostragem ? Alguém pode explicar?
Eu simplesmente não posso levar a sério nenhuma das pesquisas que vejo, mas sinto que estou mais ou menos sozinha nisso ...
fonte
Respostas:
Parece que você está imaginando um modelo de amostragem muito simples.
O modelo mais simples para amostragem é chamado apropriadamente de Amostragem Aleatória Simples . Você seleciona um subconjunto da população (por exemplo, discando números de telefone aleatoriamente) e pergunta a quem responde como está votando. Se 487 dizem Clinton, 463 dizem Trump, e o restante dá uma resposta maluca, a empresa de pesquisa informa que 49% dos eleitores preferem Clinton, enquanto 46% preferem Trump. No entanto, as empresas de votação fazem muito mais do que isso. Uma amostra aleatória simples dá peso igual a todos os pontos de dados. No entanto, suponha que sua amostra contenha - por acaso - 600 homens e 400 mulheres, o que claramente não é representativo da população como um todo. Se os homens como um grupo se inclinarem de uma maneira, enquanto as mulheres se inclinarem da outra, isso influenciará seu resultado. No entanto, como temos boas estatísticas demográficas, você pode ponderar *as respostas contando as respostas das mulheres um pouco mais e as dos homens um pouco menos, para que a resposta ponderada represente melhor a população. As organizações de pesquisa têm modelos de pesagem mais complicados que podem fazer com que uma amostra não representativa se pareça com uma mais representativa.
A idéia de ponderar as respostas amostradas está em um terreno estatístico bastante firme, mas há alguma flexibilidade na escolha de quais fatores contribuem para os pesos. A maioria dos pesquisadores realiza a ponderação com base em fatores demográficos, como sexo, idade e raça. Dado isso, você pode pensar que a identificação partidária (democrata, republicana etc.) também deve ser incluída, mas acontece que a maioria das empresas de votação não a usa em seus pesos: a identificação ( partidária) do indivíduo está confusa à escolha do eleitor de uma maneira que a torne menos útil.
Muitos grupos de pesquisas também relatam seus resultados entre "prováveis eleitores". Nesses, os entrevistados são selecionados ou ponderados com base na probabilidade de que eles realmente apareçam nas pesquisas. Sem dúvida, esse modelo também é orientado por dados, mas a escolha precisa dos fatores permite certa flexibilidade. Por exemplo, incluir interações entre candidato e raça (ou gênero) não era sensato até 2008 ou 2016, mas suspeito que eles tenham algum poder preditivo agora.
Em teoria, você pode incluir todo tipo de coisa como fator de ponderação: preferência musical, cor dos olhos etc. No entanto, fatores demográficos são escolhas populares para fatores de ponderação, porque:
No entanto, os pesquisadores também veem as mesmas notícias que todo mundo vê e podem ajustar as variáveis de ponderação, se necessário.
Também existem alguns "fatores de falsificação" que às vezes são invocados para explicar os resultados da pesquisa. Por exemplo, às vezes os entrevistados relutam em dar respostas "socialmente indesejáveis". O Efeito Bradley postula que os eleitores brancos às vezes subestimam seu apoio a candidatos brancos que concorrem contra uma minoria para evitar parecer racista. É nomeado após Tom Bradley, um candidato governamental afro-americano que perdeu por pouco as eleições apesar de liderar confortavelmente nas pesquisas.
Finalmente, você está completamente correto de que o próprio ato de pedir a opinião de alguém pode mudar isso. As empresas de votação tentam escrever suas perguntas de maneira neutra. Para evitar problemas com a ordem das respostas possíveis, os nomes dos candidatos podem ser listados em ordem aleatória. Às vezes, várias versões de uma pergunta também são testadas uma contra a outra. Esse efeito também pode ser explorado para fins nefastos em uma pesquisa por push , em que o entrevistador não está realmente interessado em coletar respostas, mas em influenciá-las. Por exemplo, uma pesquisa por push pode perguntar "Você votaria no [Candidato A], mesmo que fosse relatado que ele era um molestador de crianças?".
* Você também pode definir metas explícitas para sua amostra, como incluir 500 homens e 500 mulheres. Isso é chamado de amostragem estratificada - a população é estratificada em diferentes grupos e cada grupo é então amostrado aleatoriamente. Na prática, isso não é feito com muita frequência nas pesquisas, porque você precisa se estratificar em muitos grupos exaustivos (por exemplo, homens com formação universitária entre 18 e 24 anos no Urban Texas).
fonte
Existe um teorema matemático chamado "lei dos grandes números". Imagine que você deseja determinar a probabilidade de uma moeda aparecer na cara. A "população" de lançamentos de moedas é infinita - muito maior que as mais de 300.000.000 de pessoas nos Estados Unidos. Mas, de acordo com a Lei dos Grandes Números, quanto mais moedas você fizer, mais precisa será sua estimativa.
A pesquisa ideal: na pesquisa ideal, os pesquisadores selecionavam aleatoriamente nomes do censo dos EUA, descobriam onde essas pessoas vivem, depois batiam à porta. Se a pessoa diz que planeja votar, o pesquisador pergunta em quem está votando e registra sua resposta. Pesquisas como esta são matematicamente garantidas para funcionar e a quantidade de erros em sua medição para qualquer nível de confiança pode ser calculada facilmente .
Aqui está o que o erro significa: Suponha que, com base na sua pesquisa, você tenha 52% de chance de o candidato Awesome McPerfect vencer, com um erro de 3% e 98% de confiança. Isso significa que você pode ter 98% de confiança de que a verdadeira parcela de eleitores que favorecem o candidato Awesome McPerfect está entre 49% e 55%.
Uma observação sobre erro e confiança Para um determinado tamanho de amostra, quanto mais confiante você estiver, maior será o seu erro. Pense nisso - você está 100% confiante de que a verdadeira proporção que suporta o canditate Awesome está entre 0% e 100% (maior erro possível) e você está 0% confiante de que a verdadeira proporção que suporta o canditate Awesome é exatamente 52.0932840985028390984308% (erro zero). Mais confiança significa mais erro, menos confiança significa menos erro. No entanto, a relação entre confiança e erro NÃO é linear! (Veja: https://en.wikipedia.org/wiki/Confidence_interval )
Pesquisas no mundo real: como é caro enviar helicópteros para todas as partes do país para bater nas portas de pessoas aleatórias (embora eu adorasse ver isso acontecer; se você é um bilhão de dólares e vê isso, por favor considere financiar isso), as pesquisas no mundo real são mais complexas. Vamos analisar uma das estratégias mais comuns - chamar eleitores aleatórios e perguntar em quem eles votariam. É uma boa estratégia, mas tem algumas falhas bem conhecidas:
Como diferentes demografias votam de maneiras diferentes, os pesquisadores precisam fazer o possível para controlar as diferenças em seus dados brutos (com base em quem decidiu atender o telefone) e nos resultados das eleições reais. Por exemplo, se 10% das pessoas que atenderam ao telefone eram hispânicos, mas 30% dos eleitores na última eleição eram hispânicos, então eles darão três vezes o peso aos eleitores hispânicos em sua pesquisa. Se 50% das pessoas que atenderam ao telefone tiverem mais de 60 anos, mas apenas 30% das pessoas que votaram nas últimas eleições tiverem mais de 60 anos, elas darão menos peso aos eleitores mais velhos que responderam. Não é perfeito, mas pode levar a alguns feitos impressionantes de previsão (Nate Silver previu corretamente os resultados em cada um dos 50 estados nas eleições de 2012 usando estatísticas,
Uma palavra de cautela para os sábios: os pesquisadores fazem as melhores previsões possíveis com base em como as coisas funcionaram no passado. De um modo geral , as coisas funcionam da mesma maneira que no passado, ou pelo menos a mudança é lenta o suficiente para que o passado recente (no qual eles se concentram mais) se pareça com o presente. No entanto, ocasionalmente há mudanças rápidas no eleitorado e as coisas dão errado. Talvez os eleitores de Trump tenham um pouco menos probabilidade do que o seu eleitor médio de atender o telefone, e a ponderação demográfica não explica isso. Ou talvez os jovens (que apóiam esmagadoramente Hillary) sejam ainda maisé improvável que atenda ao telefone do que os modelos prevêem, e os que atendem ao telefone têm maior probabilidade de serem republicanos. Ou talvez o oposto de ambos seja verdadeiro - não sabemos. coisas assim são variáveis ocultas que não aparecem na demografia comum coletada.
Nós iria saber se nós enviou pesquisadores para bater nas portas aleatórias (ahem, billionare imaginário lendo este), desde então, não teria de coisas de peso com base em dados demográficos, mas até então, dedos cruzados.
fonte
Em primeiro lugar, isso está além dos seus pontos principais, mas vale a pena mencionar. No teste médico, você pode ter 1000 pessoas testando um medicamento que pode ser administrado a 10000 pessoas que estão doentes anualmente. Você pode olhar para isso e pensar "Isso está sendo testado em 10% da população"; na verdade, a população não é de 10.000 pessoas, são todos os futuros pacientes, portanto o tamanho da população é infinito. 1000 pessoas não são grandes em comparação com os infinitos usuários em potencial da droga, mas esses tipos de estudos funcionam. Não é importante se você testar 10%, 1% ou 0,1% da população; o que é importante é o tamanho absoluto da amostra, e não o tamanho dela em comparação com a população.
A seguir, seu ponto principal é que existem muitas variáveis confusas que podem influenciar o voto das pessoas. Você está tratando os 22.000 distritos da Califórnia como 22.000 variáveis, mas na verdade elas são apenas algumas variáveis (renda e educação, como você mencionou). Você não precisa de uma amostra representativa de cada distrito, apenas de amostras suficientes para cobrir a variação devido à renda, educação, etc.
Editar:
A fórmula acima estava assumindo que cada variável de confusão é igualmente importante. Se quisermos considerar centenas de coisas que podem adicionar variação aos resultados, essa suposição não é válida (por exemplo, talvez os usuários do twitter ofereçam mais um candidato, mas sabemos que o uso do twitter não é tão importante quanto o sexo).
fonte