Um modelo exponencial é um modelo descrito pela seguinte equação:
A abordagem mais comum usada para estimar esse modelo é a linearização, o que pode ser feito facilmente calculando logaritmos de ambos os lados. Quais são as outras abordagens? Estou especialmente interessado em aqueles que podem lidar com em algumas observações.
Atualização 31.01.2011
Estou ciente do fato de que este modelo não pode produzir zero. Vou elaborar um pouco o que estou modelando e por que escolho esse modelo. Digamos que queremos prever quanto dinheiro um cliente gasta em uma loja. É claro que muitos clientes estão apenas procurando e não compram nada, por isso existem 0. Não queria usar o modelo linear porque produz muitos valores negativos, o que não faz sentido. A outra razão é que esse modelo funciona muito bem, muito melhor que o linear. Eu usei o algoritmo genético para estimar esses parâmetros, para que não fosse uma abordagem 'científica'. Agora eu gostaria de saber como lidar com o problema usando métodos mais científicos. Também se pode assumir que a maioria, ou mesmo todas, as variáveis são variáveis binárias.
fonte
Respostas:
Existem várias questões aqui.
(1) O modelo precisa ser explicitamente probabilístico . Em quase todos os casos, não haverá um conjunto de parâmetros para os quais o lhs corresponda ao rhs para todos os seus dados: haverá resíduos. Você precisa fazer suposições sobre esses resíduos. Você espera que eles sejam zero em média? Para ser distribuído simetricamente? Para ser distribuído aproximadamente normalmente?
Aqui estão dois modelos que concordam com o especificado, mas permitem um comportamento residual drasticamente diferente (e, portanto, normalmente resultam em estimativas de parâmetros diferentes). Você pode variar estes modelos variando suposições sobre a distribuição conjunta do :ϵEu
B: y i = β 0 exp ( β 1 x 1 i + … + β k x k i ) + ϵ i .
(2) A necessidade de manipular valores zero para os y's implica que o modelo declarado (A) seja errado e inadequado , porque não pode produzir um valor zero, independentemente do erro aleatório. O segundo modelo acima (B) permite valores zero (ou mesmo negativos) de y's. No entanto, não se deve escolher um modelo apenas nessa base. Para reiterar # 1: é importante modelar os erros razoavelmente bem.
(3) A linearização altera o modelo . Normalmente, resulta em modelos como (A), mas não como (B). É usado por pessoas que analisaram seus dados o suficiente para saber que essa alteração não afetará apreciavelmente as estimativas de parâmetros e por pessoas que ignoram o que está acontecendo. (É difícil, muitas vezes, dizer a diferença.)
fonte
Este é um modelo linear generalizado (GLM) com uma função de link de log .
fonte
Você sempre pode usar mínimos quadrados não lineares . Então seu modelo será:
fonte