Existem conceitos ou teorias estatísticas sobre como medir efetivamente a atualidade para onde eventos recentes ganham mais peso que os mais antigos. Estou criando um modelo de regressão logística e gostaria de aplicar um ajuste a vários fatores com base na recorrência dos eventos.
... ou, é puramente minha decisão inventar uma fórmula arbitrária?
Por exemplo: Um dos meus projetos está prevendo, por regressão logística, o desempenho de jogadores profissionais nos próximos torneios. Sua forma recente (como jogaram na semana passada) é geralmente mais importante do que como jogaram seis meses atrás. Existem técnicas / abordagens específicas que abordam esse conceito?
regression
logistic
TravisVOX
fonte
fonte
Respostas:
Não precisa necessariamente ser arbitrário; você pode, por exemplo, assumir desconto exponencial e procurar o coeficiente que tem o melhor valor preditivo.
Ou seja, no momento você pode dizer que o peso, ou equivalente (onde e ).t wt−k∝pk wt−k∝exp(−αk) 0<p<1 α>0
Acima, ou são parâmetros livres, mas, em vez de escolhê-los arbitrariamente, é possível comparar o desempenho preditivo entre diferentes valores de (ou equivalentemente, entre diferentes ), talvez via comparação de somas de quadrados de um passo à frente erros de previsão ou qualquer outro critério (função de perda) que você considere mais valioso / interessante / útil.p α p α
Como alternativa, você pode usar uma abordagem semelhante, mas aplicando alguma outra forma de desconto, como o desconto hiperbólico .
fonte