Digamos que eu tenha várias séries temporais, por exemplo, vários registros de temperatura de várias estações em uma região. Quero obter um único registro de temperatura para toda a região com a qual possa descrever aspectos do clima regional. A abordagem intuitiva pode ser simplesmente medir a média de todas as estações a cada passo do tempo, mas meu senso estatístico de aranha (com o qual ainda não estou bem informado ainda) me diz que isso pode não ser tão fácil. Em particular, imagino que a média de toda a região removerá alguns dos extremos de temperatura interessantes, e eu posso ter problemas com a dependência entre estações próximas.
Que outros problemas eu poderia enfrentar se tentasse uma estratégia como essa e existem maneiras de superá-los ou métodos mais sensatos de combinar esse tipo de dados?
Nota: As respostas podem ser mais genéricas que o exemplo espacial que forneci.
fonte
Respostas:
Primeiro, gostaria de dizer que adicionaria um comentário, mas ainda não posso fazer isso (rep), mas gosto da pergunta e queria participar, então aqui está uma "resposta". Além disso, vejo que isso é antigo, mas é interessante.
Primeiro, seria possível usar uma técnica de redução de dimensão, como a PCA, para condensar as séries temporais? Se o primeiro valor próprio for grande, talvez isso signifique que o uso do vetor próprio representaria a maior parte da dinâmica.
Segundo, e de maneira mais geral, qual é o uso desejado da série temporal? Sem saber muito mais, acho que as temperaturas podem variar bastante. Por exemplo, se alguns registros de temperatura estiverem próximos das cidades, você poderá obter um efeito do tipo "ilha de calor". Ou talvez uma pequena alteração na distância lateral produza uma grande alteração na distância vertical - um local pode estar no nível do mar e no oceano, e outro não "muito longe", mas a um quilômetro de altitude. Definitivamente teriam temperaturas diferentes!
Estes são apenas alguns pensamentos. Talvez alguém possa entrar e dar uma resposta melhor.
fonte