Eu tenho um modelo (misto) em que um dos meus preditores deve, a priori, estar relacionado quadraticamente ao preditor (devido à manipulação experimental). Por isso, gostaria de adicionar apenas o termo quadrático ao modelo. Duas coisas me impedem de fazê-lo:
- Acho que li em algum lugar que você sempre deve incluir o polinômio de ordem inferior ao ajustar polinômios de ordem superior. Esqueci onde a encontrei e, na literatura em que olhei (por exemplo, Faraway, 2002; Fox, 2002), não consigo encontrar uma boa explicação.
- Quando adiciono ambos, o termo linear e o quadrático, ambos são significativos. Quando adiciono apenas um deles, eles não são significativos. No entanto, uma relação linear de preditor e dados não é interpretável.
O contexto da minha pergunta é especificamente um modelo misto lme4
, mas eu gostaria de obter respostas que pudessem explicar por que é ou por que não é adequado incluir um polinômio de ordem superior e não um polinômio de ordem inferior.
Se necessário, posso fornecer os dados.
regression
polynomial
Henrik
fonte
fonte
Respostas:
1. Por que incluir o termo linear?
É esclarecedor notar que um relacionamento quadrático pode ser escrito de duas maneiras:
(onde, equacionando coeficientes, encontramos e ). O valor corresponde a um extremo global do relacionamento (geometricamente, localiza o vértice de uma parábola).−2a2b=a1 a2b2+c=a0 x=b
Se você não incluir o termo linear , as possibilidades serão reduzidas paraa1x
(onde agora, obviamente, e supõe-se que o modelo contenha um termo constante ). Ou seja, você força .c=a0 a0 b=0
À luz disso, a pergunta 1 resume-se à certeza de que o extremo global deve ocorrer em . Se você é, pode omitir com segurança o termo linear . Caso contrário, você deve incluí-lo.x=0 a1x
2. Como entender as mudanças de significado à medida que os termos são incluídos ou excluídos?
Isso é discutido em detalhes em um thread relacionado em https://stats.stackexchange.com/a/28493 .
No presente caso, o significado de indica que há curvatura no relacionamento e o significado de indica que é diferente de zero: parece que você precisa incluir os dois termos (assim como a constante, é claro).a2 a1 b
fonte
@whuber deu uma resposta realmente excelente aqui. Eu só quero adicionar um pequeno ponto complementar. A pergunta afirma que "uma relação linear de preditor e dados não é interpretável". Isso sugere um mal-entendido comum, embora eu normalmente o ouça do outro lado ('qual é a interpretação do termo ao quadrado [cúbico, etc.]?').
Quando temos um modelo com várias covariáveis diferentes , cada termo beta geralmente pode ter sua própria interpretação. Por exemplo, se:
então podemos atribuir interpretações separadas para cada beta / termo. Por exemplo, se o GPA do ensino médio de um aluno fosse 1 ponto mais alto - todos os demais sendo iguais - esperaríamos que o GPA da faculdade fosse pontos mais alto.β1
É importante observar, no entanto, que nem sempre é permitido interpretar um modelo dessa maneira. Um caso óbvio é quando há uma interação entre algumas das variáveis, pois não seria possível que o termo individual diferisse e ainda assim tudo se mantivesse constante - por necessidade, o termo de interação também mudaria. Assim, quando há uma interação, não interpretamos efeitos principais, mas apenas efeitos simples , como é bem entendido.
A situação com termos de poder é diretamente análoga, mas infelizmente não parece ser amplamente compreendida. Considere o seguinte modelo: (Nesta situação, pretende representar uma covariável contínua prototípica.) Não é possível que mude sem mudar também, e vice versa. Simplificando, quando existem termos polinomiais em um modelo, os vários termos baseados na mesma covariável subjacente não recebem interpretações separadas. O termo ( , , etc.) não tem nenhum significado independente. O fato de um
fonte
A resposta do @ whuber acima está correta ao apontar que a omissão do termo linear é o modelo quadrático "usual" é equivalente a dizer: "Estou absolutamente certo de que o extremo está em ".x=0
No entanto, você também precisa verificar se o software que você está usando tem uma "pegadinha". Alguns softwares podem centralizar os dados automaticamente ao ajustar um polinômio e testar seus coeficientes, a menos que você desative a centralização polinomial. Ou seja, pode caber uma equação que se parece com onde é a média dos seus s. Isso forçaria o extremo a estar em . ˉ x x x = ˉ xY=b0+b2(x−x¯)2 x¯ x x=x¯
Sua afirmação de que os termos linear e quadrático são significativos quando ambos são inseridos precisa de algum esclarecimento. Por exemplo, o SAS pode relatar um teste Tipo I e / ou Tipo III para esse exemplo. O tipo I testa o linear antes de colocar o quadrático. O tipo III testa o linear com o quadrático no modelo.
fonte
Brambor, Clark e Golder (2006) (que vem com um apêndice da Internet ) têm uma visão muito clara de como entender os modelos de interação e como evitar as armadilhas comuns, incluindo por que você deve (quase) sempre incluir os termos de ordem inferior ( "termos constitutivos") em modelos de interação.
Não fazer isso pode resultar em um modelo subespecificado que levaria a estimativas tendenciosas. Isso pode levar a erros inferenciais.
fonte