Aqui está o meu contexto para esta pergunta: Pelo que sei, não podemos executar uma regressão ordinária de mínimos quadrados em R ao usar dados ponderados e o survey
pacote. Aqui, temos que usar svyglm()
, que em vez disso executa um modelo linear generalizado (que pode ser a mesma coisa? Estou confuso aqui em termos do que é diferente).
No OLS e através da lm()
função, calcula um valor ao quadrado R, cuja interpretação eu entendo. No entanto, svyglm()
parece não calcular isso e, em vez disso, me fornece um desvio, que minha breve viagem pela Internet me diz que é uma medida de qualidade de ajuste que é interpretada de maneira diferente de um quadrado-R.
Então eu acho que basicamente tenho duas perguntas sobre as quais eu esperava obter alguma orientação:
- Por que não podemos executar o OLS no
survey
pacote, enquanto parece que isso é possível com dados ponderados no Stata? - Qual é a diferença de interpretação entre o desvio de um modelo linear generalizado e um valor do quadrado r?
Respostas:
svyglm
fornecerá um modelo linear se você usar ofamily = gaussian()
que parece ser o padrão da vinheta da pesquisa (na versão 3.32-1). Veja o exemplo onde eles encontram oregmodel
.Parece que o pacote apenas garante que você use os pesos corretos quando chamar
glm
. Assim, se o seu resultado for contínuo e você assumir que ele é normalmente distribuído por iid, você deve usá-lofamily = gaussian()
. O resultado é um modelo linear ponderado. Esta respostaafirmando que você realmente pode fazer isso com o
survey
pacote. Quanto à seguinte perguntafamily = gaussian()
O desvio é apenas a soma dos erros quadrados quando você usa
family = gaussian()
.Ressalvas
Suponho que você queira um modelo linear da sua pergunta. Além disso, nunca usei o
survey
pacote, mas o examinei rapidamente e fiz suposições sobre o que ele faz, que afirmo em minha resposta.fonte