Estou trabalhando com um grande conjunto de dados do acelerômetro coletados com vários sensores usados por muitos assuntos. Infelizmente, ninguém aqui parece conhecer as especificações técnicas dos dispositivos e acho que nunca foram recalibrados. Não tenho muitas informações sobre os dispositivos. Estou trabalhando na tese de mestrado, os acelerômetros foram emprestados de outra universidade e, no geral, a situação era um pouco intransparente. Então, pré-processamento a bordo do dispositivo? Nenhuma pista.
O que sei é que são acelerômetros triaxiais com uma taxa de amostragem de 20Hz; MEMS digital e presumivelmente. Estou interessado em comportamento e gestos não-verbais, que, de acordo com minhas fontes, deveriam produzir principalmente atividade na faixa de 0,3 a 3,5 Hz.
Normalizar os dados parece bastante necessário, mas não tenho certeza do que usar. Uma parte muito grande dos dados está próxima dos valores restantes (valores brutos de ~ 1000, a partir da gravidade), mas existem alguns extremos, como até 8000 em alguns logs ou mesmo 29000 em outros. Veja a imagem abaixo . Eu acho que isso torna uma má idéia dividir pelo max ou stdev para normalizar.
Qual é a abordagem usual em um caso como este? Dividir pela mediana? Um valor percentual? Algo mais?
Como questão secundária, também não tenho certeza se devo cortar os valores extremos.
Obrigado por qualquer conselho!
Edit : Aqui está um gráfico de cerca de 16 minutos de dados (20000 amostras), para lhe dar uma idéia de como os dados são normalmente distribuídos.
fonte
Respostas:
Os sinais brutos que você mostra acima parecem não filtrados e não calibrados. Filtragem e calibração apropriadas , com alguma rejeição de artefato , normalizarão os dados. A abordagem padrão com dados do acelerômetro é a seguinte:
É aconselhável executar a rejeição de artefato nos dados inerciais do sensor. Eu ficaria preocupado com o fato de você não conhecer a procedência dos dados e, portanto, não pode garantir que os sensores foram afixados correta e consistentemente (em termos de orientação e posicionamento físico) a todos os assuntos. Se os sensores não foram afixados corretamente, é possível obter muitos artefatos nos sinais, pois o sensor pode se mover em relação ao segmento do corpo. Da mesma forma, se os sensores foram orientados de maneira diferente (em como foram colocados) em assuntos diferentes, será difícil comparar os dados entre os assuntos.
Dado o tamanho dos discrepantes que você relatar, parece provável que sejam artefatos. Esses artefatos quase certamente distorceriam qualquer cálculo de calibração (embora seu efeito seja diminuído pela filtragem apropriada) e, portanto, a calibração deve ser realizada após a rejeição do artefato.
Um limite simples pode funcionar bem para uma rotina inicial de rejeição de artefato, ou seja, remova (ou substitua por
NaN
) todas as amostras acima de um determinado limite empírico. Técnicas mais sofisticadas calcularão adaptativamente esse limite usando uma média em movimento ou uma janela móvel.Dependendo da localização do sensor, você também pode corrigir a influência da gravidade nos sinais de aceleração, embora o entendimento detalhado sobre os eixos e o posicionamento do sensor seja crucial aqui. O método Moe-Nillson ( R. Moe-Nilssen, Um novo método para avaliar o controle motor da marcha em condições ambientais da vida real. Parte 1: O instrumento, Clinical Biomechanics, Volume 13, Edições 4-5, junho a julho de 1998, Páginas 320-327 ) é a mais comumente usada e funciona bem para sensores inerciais montados na região lombar.
Um bom lugar para começar a examinar os dados para o reconhecimento de gestos seria dividir os dados filtrados e calibrados em épocas (por exemplo, 10s) e calcular vários recursos por época e relacioná-los aos rótulos que você possui para os dados. t oferecer conselhos mais específicos sem saber mais sobre o conjunto de dados e os rótulos associados.
Espero que isto ajude.
fonte