Alguém poderia oferecer algumas dicas sobre como usar o weights
argumento na lm
função de R ? Digamos, por exemplo, você estava tentando ajustar um modelo nos dados de tráfego e tinha várias centenas de linhas, cada uma representando uma cidade (com uma população diferente). Se você quisesse que o modelo ajustasse a influência relativa de cada observação com base no tamanho da população, você poderia simplesmente especificar weights=[the column containing the city's population]
? É esse o tipo de vetor que pode ser inserido weights
? Ou você precisaria usar uma função / pacote / abordagem R completamente diferente?
Curioso para saber como as pessoas lidam com este - não o vi coberto em nenhum dos tutoriais de modelagem linear que vi por aí. Obrigado!
fonte
lm
resumo, se eles são escalados vs não ...lm
resumo? Os coeficientes ou os erros padrão?O que você sugere deve funcionar. Veja se isso faz sentido:
A segunda linha produz o mesmo intercepto e inclinação que a terceira linha (distinta do resultado da primeira linha), fornecendo uma observação relativamente duas vezes o peso de cada uma das outras duas observações, semelhante ao impacto de duplicar a terceira observação.
fonte
summary
saída é diferente para a segunda e a terceira linha, especialmente para o valor p do coeficiente, imagino que isso acontecerá se as duas instruções se referirem ao mesmo conjunto de dados. Eu postei uma pergunta sobre isso em stackoverflow.com/questions/10268689/weighted-regression-in-r