Na verdade, esse problema é sobre detecção de incêndio, mas é fortemente análogo a alguns problemas de detecção de decaimento radioativo. Os fenômenos observados são esporádicos e altamente variáveis; assim, uma série temporal consistirá em longas seqüências de zeros interrompidas por valores variáveis.
O objetivo não é apenas capturar eventos (quebras nos zeros), mas caracterizar quantitativamente os próprios eventos. No entanto, os sensores são limitados e, portanto, às vezes registram zero, mesmo que a "realidade" seja diferente de zero. Por esse motivo, os zeros devem ser incluídos ao comparar sensores.
O sensor B pode ser mais sensível que o sensor A, e eu gostaria de poder descrevê-lo estatisticamente. Para esta análise, não tenho "verdade", mas tenho um sensor C, independente dos sensores A&B. Assim, minha expectativa é que uma melhor concordância entre A / B e C indique melhor concordância com a "verdade". (Isso pode parecer instável, mas você terá que confiar em mim - estou em terreno sólido aqui, com base no que é conhecido em outros estudos sobre os sensores).
O problema, então, é como quantificar "uma melhor concordância das séries temporais". A correlação é a escolha óbvia, mas será afetada por todos esses zeros (que não podem ser deixados de fora) e, é claro, desproporcionalmente afetada pelos valores máximos. O RMSE também poderia ser calculado, mas seria fortemente ponderado em relação ao comportamento dos sensores no caso próximo de zero.
P1: Qual é a melhor maneira de aplicar uma escala logarítmica a valores diferentes de zero que serão combinados com zeros em uma análise de séries temporais?
P2: Quais "práticas recomendadas" você pode recomendar para uma análise de séries temporais desse tipo, onde o comportamento em valores diferentes de zero é o foco, mas os valores zero dominam e não podem ser excluídos?
croston()
função noforecast
pacote em R implementará o método de Croston para prever dados de demanda intermitentes.