Ao aprender o curso da amostragem, encontro as duas declarações a seguir:
1) O erro de amostragem leva a maior parte da variabilidade, os erros sem amostragem levam a viés.
2) Devido ao erro de não amostragem, uma amostra geralmente é mais precisa que um CENSO.
Não sei como entender essas duas afirmações. Qual é a lógica subjacente para obter essas duas instruções?
estimation
sampling
survey
bias
user785099
fonte
fonte
Respostas:
Uma amostra pode ser mais precisa que um censo (tentado) se o fato do exercício ser um censo aumentar o viés do erro de não amostragem. Isso poderia acontecer, por exemplo, se o censo gerar uma campanha política adversa defendendo a não resposta (algo menos provável de acontecer com uma amostra). A menos que isso aconteça, não vejo por que se espera que uma amostra tenha menos erro de não amostragem que um censo; e, por definição, terá mais erro de amostragem. Portanto, além de circunstâncias bastante incomuns, eu diria que um censo será mais preciso do que uma amostra.
Considere uma fonte comum de erro sem amostragem - não resposta sistemática, por exemplo, por um grupo sociodemográfico específico. Se as pessoas do grupo X provavelmente recusarem o censo, elas também recusarão a amostra. Mesmo com poststratification amostragem de peso-se as respostas das pessoas do grupo X quem você se convencer de responder às suas perguntas, você ainda tem um problema, porque esses poderiam ser o segmento de X que são pró-pesquisas. Não há maneira real de contornar esse problema a não ser ser o mais cuidadoso possível com o design do instrumento e o método de entrega.
De passagem, isso chama a atenção para um possível problema que poderia tornar uma tentativa de censo menos precisa do que uma amostra. As amostras rotineiramente têm ponderação pós-classificação para a população, o que atenua os problemas de viés de questões como a do meu parágrafo acima. Uma tentativa de censo que não obtém retorno de 100% é apenas uma amostra grande e deve, em princípio, estar sujeita ao mesmo processamento; mas porque é visto como um "censo" (e não como uma tentativa de censo), isso pode ser negligenciado. Portanto, esse censo pode ser menos preciso do que a amostra adequadamente ponderada. Mas, neste caso, o problema é a técnica de processamento analítico (ou omissão de), não algo intrínseco ao fato de ser uma tentativa de censo.
Eficiente é outra questão - como Michelle diz, uma amostra bem conduzida será mais eficiente que um censo e poderá ter precisão suficiente para fins práticos.
fonte
Eu acho que existem situações práticas em que uma amostra pode ser mais precisa. Por exemplo, fizemos um estudo em uma cidade de um país em desenvolvimento, com muitas pessoas vivendo em lugares não registrados e pessoas constantemente indo e vindo e sendo tímidas em responder. Tentar realmente fazer um censo exigiria um esforço hercúlea e, dados nossos recursos, teria que ser feito ao longo de alguns meses, quando as pessoas iriam e viriam. Com uma amostra, poderíamos gastar mais tempo para garantir que chegássemos o mais perto possível da resposta completa - porque poderíamos explicar o que estávamos fazendo - e poderíamos fazê-lo em um período de tempo muito menor, o que eliminaria o problema de pessoas entrando e saindo da cidade.
Portanto, acho que a resposta depende mais da logística do que você está fazendo e das várias fontes de erro de não amostragem.
De fato, outra fonte foi que nossa pesquisa era complexa e tivemos que treinar os entrevistadores, e seria muito difícil encontrar e financiar entrevistadores treináveis suficientes naquele país.
fonte
Ao amostrar seres humanos para pesquisas, as amostras geralmente sofrem tanto de erro de amostragem (estamos apenas obtendo estimativas) quanto de erro de não amostragem (por exemplo, pessoas que se recusam a responder a uma pesquisa, não amostrando o quadro de amostra necessário devido a considerações práticas, como custo, ou incapacidade de identificar a população com precisão, a fim de coletar a amostra). Feito corretamente, com altas taxas de resposta, uma amostra é mais eficiente que um censo. Mas é incorreto supor que nenhuma amostra contém erro de não amostragem.
fonte
Eu acho que a chave está na resposta de Peter Ellis: "tentativa". Quando você faz a amostragem corretamente, você se preocupa com os detalhes da não resposta, descobre os estratos e os procura, etc. Quando você decide fazer um censo, é fácil ignorar esses problemas, pois você está recebendo "todos". O problema é que você provavelmente não está recebendo todo mundo, mas não está pensando em quem realmente não está recebendo.
Também existem questões estatísticas com amostras extremamente grandes (como uma proporção da população amostrada). Não sou sofisticado o suficiente para entendê-los, mas, no mínimo, você tem problemas com os cálculos de variação. (Pacotes como R
survey
compensam essas coisas em grandes subpopulações de uma pesquisa, e foi aí que eu aprendi sobre isso.)Como uma questão secundária, se o erro fora da amostra incluir problemas devido ao controle de qualidade em várias etapas do processo, ter muito mais dados (censo) tornaria muito mais difícil o nível de controle de qualidade que você teria (com o mesmo recursos) em um conjunto menor de dados (amostra).
Imagine se você tivesse os recursos (financeiros e de pessoal) que o US Census Bureau usava para um censo, mas você estava apenas fazendo uma pesquisa com 1.000 adultos aleatórios. Eu acho que você teria um controle de qualidade muito melhor e uma análise muito melhor dos problemas envolvidos e dos próprios dados.
fonte
Eu pensei que a razão pela qual a amostragem pode ser (não é) mais precisa do que o censo realmente tinha um componente que é atribuível à natureza de um censo versus uma amostra, e que pode ser atribuído como a causa de um censo que potencialmente tem um viés maior (obviamente não amostragem, por definição): em um censo, o número da população é geralmente desconhecido. Portanto, minimizar ou controlar o viés de não resposta é muito mais difícil do que fazê-lo com uma amostra de tamanho conhecido.
fonte