Neste post, fazemos uma pergunta sobre um fenômeno natural chamado de seres humanos que tentam encontrar uma decisão contando votos . O incidente específico de um fenômeno natural desse tipo é sobre o caso do Brexit .
Nota: a questão não é sobre política. O objetivo é tentar discutir esse fenômeno natural do ponto de vista estatístico, com base em observações.
A questão específica é:
- Pergunta: O que significa o voto de Brexit para sair ? Por exemplo, significa que o público realmente quer sair da UE? Significa simplesmente que o público não tem certeza e precisa de mais tempo para pensar? Ou é outra coisa?
Suposição 1: não há erro no processo de votação.
statistical-significance
voting-system
homem das cavernas
fonte
fonte
Respostas:
Concordo com o @Underminer que não há erro de amostragem, mas não porque a amostra é grande, mas porque não houve amostragem envolvida . Ninguém foi amostrado para votar. Obviamente, havia uma fração desprezível de pessoas que queriam votar, mas não conseguiram (por exemplo, sofrer um acidente de carro neste dia) ou que fizeram votos inválidos, mas essa é a única "amostra" aqui.
O resultado é exato, não há nenhum erro envolvido, pois toda a população participou da votação (alguns participaram por não participar). Algumas pessoas decidiram votar, outras não. Alguns decidiram votar em licença, outros não. Democracia não é sobre significância estatística, mas sobre o que realmente aconteceu . A votação não se destina a aprender sobre a opinião das pessoas, mas a tomar uma decisão. Na verdade, as pessoas às vezes não votam de acordo com o que pensam, mas para manifestar ou alcançar algo . Por exemplo, nas eleições, as pessoas podem votar não em seu candidato preferido, mas em seu segundo preferido, se acharem que ele tem maiores chances de ganhar.
fonte
51,9% é a porcentagem de eleitores que querem sair . Como o tamanho da amostra é tão grande (> 33 milhões), não há virtualmente nenhum erro de amostragem aleatória.
O teste de significância estatística tentaria determinar se a diferença de permanecer e sair poderia ser explicada apenas por um erro de amostragem aleatória, e a diferença certamente seria significativa (consulte a resposta do homem das cavernas).
O problema dessa abordagem é que a significância estatística pressupõe fortemente que a amostra é representativa de toda a população (toda a Grã-Bretanha), não apenas dos que votam.
A taxa de não resposta (aquelas que não votam) é de extrema importância para determinar se mais da metade de toda a Grã-Bretanha quer 'sair' e é difícil de medir. O viés de não resposta é criado quando subgrupos com menor probabilidade de votar têm visões sistematicamente diferentes. Com base nas pesquisas de saída, por exemplo, os millennials eram menos propensos a votar, mas mais propensos a votar para permanecer , o que influencia os resultados ao tentar representar a população de toda a Grã-Bretanha.
Por esse motivo, o teste de significância estatística no sentido tradicional é em grande parte inadequado .
Pressupostos: Precisamos definir alguns termos para que tudo isso faça sentido e evite discussões políticas sobre o que a votação está tentando realizar. Aqui estão as minhas definições:
População: todas as pessoas que vivem na Grã-Bretanha
Quadro de Amostragem: Toda pessoa elegível para votação capaz de votar
Metodologia de amostragem: resposta voluntária, o ato de votar está participando da pesquisa
Amostra: Os indivíduos que realmente votam
Nesta configuração, a proporção da amostra pode ser usada (para melhor ou para pior) para estimar a porcentagem de todas as pessoas que se inclinam para permanecer (ou sair ).
fonte
Você pergunta
Isso significa que 51,9% dos eleitores votaram para sair.
Os votos compuseram votos "deixar" e 1617421887 votos "restantes", indicando 1216146297 eleitores elegíveis não votaram e aproximadamente 18 milhões de habitantes não são eleitores elegíveis. Como nem a coleta de eleitores reais nem a coleta de eleitores elegíveis é "o público" e nem é uma amostra representativa (aleatória, imparcial, escolha um adjetivo relevante) do "público", o voto de 51,9% do Brexit não é relevante para o seu segundo e perguntas subsequentes.12931353 18
Talvez fosse possível construir um questionário que respondesse às suas perguntas. Parece que não foi o que aconteceu no referendo implementado.
fonte
TL; DR
Simulei uma população insegura abaixo (abaixo dos detalhes ) por vezes e depois medi a probabilidade de observar um voto de folga de ≥ 51,9 % nessa população simulada insegura . Isso me deu a probabilidade simulada de que uma população insegura possa obter um voto de licença de 51,9 % ou mais.R=1000 ≥51.9% 51.9%
Essa probabilidade simulada de licença na população insegura é .0
Talvez redundante, mas eu também fiz o mesmo, mas com permanecem para medir a probabilidade de que tal não tem certeza população para obter uma voto permanecem .≤48.1%
Essa probabilidade simulada de permanecer na população insegura também é .0
Portanto, concluo que o voto do Brexit não é um efeito colateral barulhento de uma população insegura ou confusa . Parece haver uma razão sistemática que os leva a deixar a UE.
Carreguei o código do simulador aqui: https://github.com/Al-Caveman/Brexit
Detalhes
Dada a suposição 1 , as possíveis respostas (ou hipótese) são:
Nota: é impossível que o público queira permanecer com confiança porque descartamos erros de votação.
Para responder a essa pergunta (ou seja,H0 ou H1 ), tento medir:
Se essa probabilidade for baixa o suficiente, podemos concluir que o público quer sair com confiança (ou seja, H 1 ). No entanto, se essa probabilidade for grande o suficiente, podemos concluir que o público não tem certeza sobre a decisão do Brexit (ou seja, H 0 ).H1 H0
Para medir essa probabilidade, precisamos conhecer a distribuição de uma população britânica insegura em um sistema de votação binário como o Brexit. Portanto, meu primeiro passo é simular essa distribuição seguindo a suposição abaixo:
Na minha opinião, essa suposição é justa / razoável.
Além disso, modelamos as licenças e permanecemos campanhas como dois processos distintos, como a seguir:
Onde:
sujeito à seguinte restrição:
Por exemplo, se , significa que de uma população de 3 , um votou sim para sair e dois votaram não para sair .Oleave=[1,0,0] 3
Da mesma forma, seOremain=[0,1,0] , it means that out of a population of 3 , one has voted yes to remain and two have voted no to remain.
Therefore, we define the output arrays as follows:
Finally, we define thepleave value of the leave process as follows:
Likewise, we define thepremain value of the remain process as follows:
To answer that, I simulated the above in C usingR=1,000 and the output is:
In other words:
fonte
You could ask a slightly different question: Assuming that 50% of a very large population voted "Yes", and you asked a random sample of size S, what is the probability that 51.9% of your sample responded "Yes", depending on the sample size?
The expected value of number of "Yes" votes is 0.5 S. The variance is 0.25 S. The standard definition is 0.5S1/2 . A deviation of the actual from the expected number of "Yes" votes more than 6.1 standard deviations has a chance of one in a billion.
We have this when 0.019 S (difference between 50% and 51.9%) is 6.1 * 0.5 *S1/2 , or S = (6.1∗0.5/0.019)2 or S ≈ 25,800.
fonte
Esta é outra solução usando um método analítico em vez de uma simulação.
Anteriormente, simulei uma população insegura para ser aquela em que seu voto é uma hipótese aleatória. Tão foran Para muitos eleitores, uma população insegura tenderia a votar em deixar ou permanecer por0,5 do tempo.
Para que uma população insegura obtenha exatamente51,9 % voto em licença , é preciso haver17 , 421 , 887 1s em Osair . A probabilidade disso é0,533 , 568 , 184 . Da mesma forma, a probabilidade de obter17 , 421 , 887 + 1 votos também é 0,533 , 568 , 184 . Isso continua.
Essa é a probabilidade de obter≥17,421,887 votes:
(8.39663381928984×10−10105024 calculated by Wolframalpha)
And this is the probability of having≥51.9% of an unsure population vote leave.
fonte