Projeto de pesquisa qui quadrado

8

Alguém conhece um método para comparar duas variáveis ​​com um teste do qui quadrado se as variáveis ​​são de pesquisas diferentes com svydesign()declarações diferentes ? Estou procurando testar uma diferença em uma distribuição variável em duas ondas de uma pesquisa, mas a svychisq()declaração é limitada a um objeto de design.

É legítimo empilhar as duas variáveis ​​em uma nova data.frame, criar uma nova svydesigndeclaração com os pesos coletivos e depois executar o teste?

david rae
fonte
2
Isso deve ser migrado para o site statVSE CrossValidated. Vou esperar que seja migrado, mas comece a ler isso enquanto isso: citeulike.org/user/ctacmo/article/8898414
StasK:
@StasK qualquer link sem paywall?
Anthony Damico 17/07/2013
@AnthonyDamico, pergunte à Statistical Society of Canada: - \. Também pode estar na página de Wu.
StasK 17/07
1
O que você quer dizer com "comparar"? Essas variáveis ​​contínuas, variáveis ​​ordinais, variáveis ​​nominais? Não há suficiente na sua pergunta para ser respondida adequadamente.
StasK 24/07
@StasK, obrigado pela ajuda, só para ficar claro, esta comparação é para ordinal, bem como variáveis contínuas
david rae

Respostas:

3

Se você estiver seguindo o caminho de empilhar os conjuntos de dados juntos, deverá definir super-estratos correspondentes aos dois conjuntos / ondas de dados, para svydesign()que eles saibam que são independentes. Assim, seu novo svydesignterá estratos = cruzamento de ano e estratos, as PSUs dos desenhos originais e os pesos dos desenhos originais.

Como sugeri no comentário, outras maneiras de combinar estimativas e testes foram propostas na literatura. Wu (2004) usa a probabilidade empírica com base em variáveis ​​comuns entre os dois conjuntos de dados.

Para variáveis ​​contínuas, idealmente, você desejaria usar o teste Kolmogorov-Smirnov com dados "simples", mas não sei se as extensões funcionam para os dados da pesquisa; Eu duvido. Portanto, pode ser necessário converter suas variáveis ​​contínuas em ordinais em, digamos, grupos de percentis ou compartimentos de largura igual do intervalo de variáveis ​​(onde a função acima do tamanho da amostra é um número comum de compartimentos para um histograma ) e aplique o Rao-Scott a eles.[registro2(n)]χ2

StasK
fonte