Estou trabalhando em um aplicativo de pesquisa de saúde aberto, planejado para ser usado em países em desenvolvimento.
A idéia básica é que as entrevistas da pesquisa sejam de crowdsourcing - elas são realizadas por voluntários desorganizados que enviam dados dos formulários das entrevistas realizadas usando seus dispositivos móveis, e cada pesquisa é acompanhada pelos dados de GPS do local da entrevista.
Pesquisas tradicionais compiladas por agências governamentais geralmente são implementadas usando algum modelo de amostragem padrão - geralmente um modelo de amostragem probabilística. Isso requer muito planejamento centralizado que nem sempre pode ser executado. (mencionei isso para colocar minha pergunta no contexto certo)
Podemos dizer que um voluntário implementará uma amostra de conveniência em sua área. Ele entrevistará arbitrariamente o número de pessoas que pode alcançar.
O problema básico é: como entender e caracterizar o modelo geral de amostragem desse sistema de levantamento? Existem metodologias ou modelos compostos para lidar com esses casos?