O processo de construção do modelo envolve um construtor de modelos tomando muitas decisões. Uma das decisões envolve a escolha entre diferentes classes de modelos a serem exploradas. Existem muitas classes de modelos que podem ser consideradas; por exemplo, modelos ARIMA, modelos ARDL, modelos com várias fontes de erros no espaço de estado, modelos LSTAR, modelos Min-Max, para citar apenas alguns. Obviamente, algumas classes de modelos são mais amplas que outras e não é comum descobrir que algumas classes de modelos são subclasses de outras.
Dada a natureza da questão, podemos nos concentrar principalmente em apenas duas classes de modelos; modelos lineares e não lineares .
Com a imagem acima em mente, começarei a abordar a questão dos OPs sobre quando é útil adotar um modelo não linear e se existe uma estrutura lógica para fazê-lo - de uma perspectiva estatística e metodológica.
A primeira coisa a notar é que os modelos lineares são uma pequena subclasse de modelos não lineares. Em outras palavras, modelos lineares são casos especiais de modelos não lineares. Existem algumas exceções nessa declaração, mas, para os propósitos atuais, não perderemos muito aceitando-a para simplificar as coisas.
Normalmente, um construtor de modelos seleciona uma classe de modelos e continua a escolher um modelo dentro dessa classe específica, empregando alguma metodologia. Um exemplo simples é quando se decide modelar uma série temporal como um processo ARIMA e, em seguida, segue a metodologia Box-Jenkins para selecionar um modelo dentre a classe de modelos ARIMA. Trabalhar dessa maneira, com metodologias associadas a famílias de modelos, é uma questão de necessidade prática.
Uma conseqüência da decisão de construir um modelo não linear é que o problema de seleção de modelos se torna muito maior (mais modelos devem ser considerados e mais decisões são enfrentadas) quando comparados à escolha entre um conjunto menor de modelos lineares, para que haja um real questão prática em questão. Além disso, pode até não haver metodologias totalmente desenvolvidas (conhecidas, aceitas, entendidas, fáceis de se comunicar) a serem usadas para selecionar dentre algumas famílias de modelos não lineares. Além disso, outra desvantagem da construção de modelos não lineares é que os modelos lineares são mais fáceis de usar e suas propriedades probabilísticas são mais conhecidas ( Teräsvirta, Tjøstheim e Granger (2010) ).
Dito isto, o PO solicita bases estatísticas para orientar a decisão em vez de práticas ou teóricas do domínio, por isso devo continuar.
Antes mesmo de pensar em como lidar com a seleção de quais modelos não lineares trabalhar, é preciso decidir inicialmente se deve trabalhar com modelos lineares ou não lineares. Uma decisão! Como fazer essa escolha?
Recorrendo a Granger e Terasvirta (1993) , adoto o seguinte argumento, que tem dois pontos principais em resposta às duas perguntas seguintes.
P: Quando é útil criar um modelo não linear? Em resumo, pode ser útil construir um modelo não linear quando a classe de modelos lineares já tiver sido considerada e considerada insuficiente para caracterizar o relacionamento sob inspeção. Pode-se dizer que esse procedimento de modelagem não linear (processo de tomada de decisão) vai de simples a geral, no sentido de passar de linear para não linear.
P: Existem bases estatísticas que podem ser usadas para justificar a construção de um modelo não linear? Se alguém decide construir um modelo não linear com base nos resultados dos testes de linearidade, eu diria que sim. Se o teste de linearidade sugerir que não há não linearidade significativa no relacionamento, não seria recomendável a construção de um modelo não linear; o teste deve preceder a decisão de construir.
Vou detalhar esses pontos por referência direta a Granger e Terasvirta (1993):
Antes de construir um modelo não linear, é aconselhável descobrir se de fato um modelo linear caracterizaria adequadamente as relações [econômicas] em análise. Se fosse esse o caso, haveria mais teoria estatística disponível para a construção de um modelo razoável do que se um modelo não linear fosse apropriado. Além disso, obter previsões ideais para mais de um período à frente seria muito mais simples se o modelo fosse linear. Pode acontecer, pelo menos quando as séries temporais são curtas, que o investigador calcule com sucesso um modelo não linear, embora a verdadeira relação entre as variáveis seja linear. O perigo de complicar desnecessariamente a construção do modelo é, portanto, real, mas pode ser diminuído pelo teste de linearidade.
No livro mais recente, Teräsvirta, Tjøstheim e Granger (2010), o mesmo tipo de conselho é dado, que cito agora:
Do ponto de vista prático, é [portanto] útil testar a linearidade antes de tentar estimar o modelo não-linear mais complicado. Em muitos casos, o teste é ainda necessário do ponto de vista estatístico. Vários modelos populares não lineares não são identificados sob linearidade. Se o modelo verdadeiro que gerou os dados for linear e o modelo não linear estiver interessado em aninhar esse modelo linear, os parâmetros do modelo não linear não poderão ser estimados de forma consistente. Assim, o teste de linearidade deve preceder qualquer modelagem e estimativa não linear.
Deixe-me terminar com um exemplo.
No contexto da modelagem de ciclos de negócios, um exemplo prático de uso de bases estatísticas para justificar a construção de um modelo não linear pode ser o seguinte. Como os modelos lineares univariados ou auto-regressivos vetoriais são incapazes de gerar séries temporais cíclicas assimétricas, vale a pena considerar uma abordagem de modelagem não linear, capaz de lidar com assimetrias nos dados. Uma versão expandida deste exemplo sobre reversibilidade de dados pode ser encontrada em Tong (1993) .
Desculpas se eu me concentrei demais em modelos de séries temporais. Tenho certeza, no entanto, de que algumas das idéias também são aplicáveis em outras configurações.
A questão geral é decidir para quais tipos de problemas a linearidade é esperada; caso contrário, permita que os relacionamentos não sejam lineares conforme o tamanho da amostra permitir. A maioria dos processos em biologia, ciências sociais e outros campos não é linear. As únicas situações em que espero relacionamentos lineares são:
O último exemplo inclui o caso em que se tem uma variável dependente que também é medida na linha de base (tempo zero).Y
Raramente vejo um relacionamento linear em todos os lugares em um grande conjunto de dados.
A decisão de incluir não-linearidades nos modelos de regressão não deriva tanto de um princípio estatístico global, mas da maneira como o mundo funciona. Uma exceção é quando uma estrutura estatística subótima foi escolhida e não linearidades ou termos de interação devem ser introduzidos apenas para compensar a má escolha da estrutura. Às vezes, os termos de interação podem ser necessários para compensar os principais efeitos da sub-modelagem (por exemplo, assumindo linearidade). Podem ser necessários mais efeitos principais para compensar a perda de informações resultante da sub-modelagem dos outros efeitos principais.
Às vezes, os pesquisadores agonizam sobre a inclusão de uma determinada variável enquanto estão desajustando uma série de outras variáveis, forçando-as a agir linearmente. Na minha experiência, a suposição de linearidade é uma das suposições mais violadas que importam fortemente.
fonte
Ao construir o modelo, tento sempre os quadrados das variáveis juntamente com os componentes lineares. Por exemplo, ao criar um modelo de regressão simples, , um termo quadrado Se for significativo, será pode ser um caso para um modelo não linear. A intuição é, obviamente, a expansão de Taylor. Se você tiver uma função linear, apenas a primeira derivada deverá ser diferente de zero. Para funções não lineares, derivadas de ordem superior seriam diferentes de zero.y i = α + β x i + γ x 2 i + ε i γ
Também tento frequentemente candidato a especificação assimétrica: Se é significativo, isso me leva a considerar explorando especificações assimétricas. γ ≠ β
Às vezes, tenho alguns valores ou faixas especiais nos meus dados; ou meus histogramas de variáveis explicativas têm dobras e pontos de inflexão. Então, experimento as splines lineares em torno desses pontos ou regiões especiais. As splines lineares mais simples seriam: Isso introduziria as diferentes inclinações para antes e depois do ponto . Você pode ter várias inclinações para a mesma variável em diferentes regiões. Se meu spline linear é significativo, eu brinco com pontos de nó e o uso, ou penso em modelos não lineares.x um + = max ( x , um ) x x = um
Esta não é a abordagem sistemática, mas é apenas uma das coisas que sempre faço.
fonte