Em resposta a uma pergunta sobre seleção de modelos na presença de multicolinearidade , Frank Harrell sugeriu :
Coloque todas as variáveis no modelo, mas não teste o efeito de uma variável ajustada para os efeitos das variáveis concorrentes ... Os testes de chunk de variáveis concorrentes são poderosos porque variáveis colineares unem forças no teste geral de associação de vários graus de liberdade, em vez de competindo entre si como quando você testa variáveis individualmente.
O que são testes de chunk ? Você pode dar um exemplo de sua aplicação r
?
Respostas:
@ mark999 forneceu uma excelente resposta. Além de testar conjuntamente termos polinomiais, você pode testar em conjunto ("teste de bloco") qualquer conjunto de variáveis. Suponha que você tenha um modelo com variáveis colineares concorrentes: circunferência do tríceps, cintura, circunferência do quadril, todas as medidas do tamanho do corpo. Para fazer um teste geral de tamanho do corpo, você pode fazer
NA
tricep, waist, hip
fonte
O comentário da macro está correto, assim como o de Andy. Aqui está um exemplo.
Em vez de considerar os termos
x2
ex2^2
separadamente, o "teste de chunk" é o teste de 2 df que testa a hipótese nula de que os coeficientes desses termos são zero (acredito que é mais comumente chamado de "teste F linear geral" ) O valor de p para esse teste é o 0,0037 dado poranova(ols1)
.Observe que no
rms
pacote, você precisa especificar osx2
termospol(x2, 2)
paraanova.rms()
saber que eles devem ser testados juntos.anova.rms()
fará testes semelhantes para variáveis preditivas que são representadas como splines cúbicos restritos usando, por exemplorcs(x2, 3)
, e para variáveis preditivas categóricas. Também incluirá termos de interação nos "chunks".Se você quisesse fazer um teste de chunk para variáveis preditivas gerais "concorrentes", como mencionado na citação, acredito que você precisaria fazê-lo manualmente, ajustando os dois modelos separadamente e depois usando
anova(model1, model2)
. [Editar: isso está incorreto - veja a resposta de Frank Harrell.]fonte