Alguém conhece um método para comparar duas variáveis com um teste do qui quadrado se as variáveis são de pesquisas diferentes com svydesign()
declarações diferentes ? Estou procurando testar uma diferença em uma distribuição variável em duas ondas de uma pesquisa, mas a svychisq()
declaração é limitada a um objeto de design.
É legítimo empilhar as duas variáveis em uma nova data.frame
, criar uma nova svydesign
declaração com os pesos coletivos e depois executar o teste?
r
chi-squared
survey
david rae
fonte
fonte
Respostas:
Se você estiver seguindo o caminho de empilhar os conjuntos de dados juntos, deverá definir super-estratos correspondentes aos dois conjuntos / ondas de dados, para
svydesign()
que eles saibam que são independentes. Assim, seu novosvydesign
terá estratos = cruzamento de ano e estratos, as PSUs dos desenhos originais e os pesos dos desenhos originais.Como sugeri no comentário, outras maneiras de combinar estimativas e testes foram propostas na literatura. Wu (2004) usa a probabilidade empírica com base em variáveis comuns entre os dois conjuntos de dados.
Para variáveis contínuas, idealmente, você desejaria usar o teste Kolmogorov-Smirnov com dados "simples", mas não sei se as extensões funcionam para os dados da pesquisa; Eu duvido. Portanto, pode ser necessário converter suas variáveis contínuas em ordinais em, digamos, grupos de percentis ou compartimentos de largura igual do intervalo de variáveis (onde a função acima do tamanho da amostra é um número comum de compartimentos para um histograma ) e aplique o Rao-Scott a eles.[ log2( n ) ] χ2
fonte