Digamos que você tenha uma grande amostra aleatória de jogadores de futebol na Europa, mas você só está interessado no que acontece na Espanha. Você poderia reduzir sua amostra para jogadores da Espanha e ainda chamá-la de amostra aleatória (mas de uma população diferente)? Caso contrário, como você chamaria essa subamostra e quais precauções específicas você deve tomar para poder inferir a população de jogadores de futebol espanhol?
Meu sentimento é que usar essa subamostra seria bom desde que seja grande o suficiente, mas talvez esteja faltando alguma coisa.
sampling
sample
resampling
Antoine Vernet
fonte
fonte
Respostas:
De um modo geral, o que você realmente deseja de uma amostra é ser "representativo". A amostragem aleatória é um bom caminho, pois permite a todos os sujeitos a mesma probabilidade de serem amostrados; Na esperança de que todos os atributos e relações de atributos existentes na população existam na amostra. Tornando-o "representativo". No seu caso, se você acredita que todos os jogadores espanhóis tiveram uma chance a priori de ser sorteado na (sub) amostra, então é "aleatório".
Em relação às considerações de tamanho: Uma única observação ainda pode ser uma "amostra aleatória". Amostras maiores são necessárias quando você deseja mais precisão e, principalmente, quando procura relações raras na população, que podem não estar presentes em uma amostra pequena.
fonte
Supondo que não haja vieses na técnica de amostragem, isso deve ser bom. Algumas perguntas a serem feitas podem ser:
-> A pesquisa foi realizada em espanhol, se solicitado? (Viés de idioma) -> A pesquisa foi realizada por telefone ou pessoalmente? Se por telefone e telefones celulares foram excluídos, é mais ou menos provável que os jogadores espanhóis possuam telefones celulares do que os jogadores no resto da Europa e por que razões? -> A taxa pela qual os jogadores espanhóis se recusaram a responder às perguntas da pesquisa foi diferente da taxa para os jogadores como um todo? -> No geral, que proporção de jogadores espanhóis foi amostrada?
Sem saber a composição exata dos dados, é difícil dizer mais. Há algum problema específico com o qual você se preocupa?
fonte