Que estatística é usada para determinar a presença de um sinal no ruído?

12

Este é um problema de detector, acredito:

Estou sendo surpreendido pelo que parece ser um problema simples. Basicamente, eu tenho uma banda de interesse. Se existirem energias de sinal nessa faixa de interesse, realizo a operação X no meu sinal.

Meu problema é que não sei exatamente como proceder para "decidir" se um sinal existe ou não. Nisso, depois de executar uma FFT, posso procurar picos.

Mas e agora?

  • A estatística usada geralmente compara esse pico à média circundante do espectro? Ou é alguma outra estatística?
  • Que medida estatística eu uso para determinar simplesmente se um sinal está presente e partir daí?
  • Como faço para definir esse valor? Limiar simples?

EDIT Baseado no feedback:

Neste caso simples, estou assumindo um tom, no ruído gaussiano branco. O que estou tentando entender é:

  1. Como exatamente se gerou uma curva ROC . É preciso rotular todos os dados primeiro e depois obter as taxas de verdadeiro e falso positivo para uma infinidade de limites?

  2. Como o SNR decrescente afeta a curva ROC? Movê-lo para a diagonal?

  3. O que o limiar adaptativo está fazendo com uma determinada curva ROC que foi gerada sem um limiar adaptável?

    3a. Quais são algumas das técnicas comuns de limiar adaptativo que posso observar que são comuns?

Spacey
fonte
Deseja um algoritmo em lote (offline) ou sequencial (online)? Você tem estatísticas de ruído e sinal (ou seja, você pode caracterizar a razão de verossimilhança)? Se sim, você já tentou usar um SPRT ?
Emre
@ Emre Pode estar offline. Eu não estou realmente certo o que você quer dizer com estatísticas sinal / ruído, eu tenho um sensor que vai medir um sinal (tom) na presença de ruído, e sua SNR pode variar ...
Spacey
Ele quer dizer: quais são as propriedades estatísticas do ruído e do sinal? Você conhece a distribuição do barulho? E a distribuição do sinal mais ruído?
Jason R
@JasonR eu vejo. Bem, o sinal será um tom e o ruído é gaussiano. Estou esquecendo de algo?
Spacey
Talvez. Gaussiano branco? O ponto é que, para analisá-lo teoricamente, você precisa assumir algum modelo de probabilidade para o ruído e o sinal mais o ruído. Com base nessa resposta, você pode fazer isso.
Jason R

Respostas:

9

Esse é um dos problemas mais antigos de processamento de sinal e é provável que seja encontrada uma forma simples em uma introdução à teoria de detecção. Existem abordagens teóricas e práticas para resolver esse problema, que podem ou não se sobrepor, dependendo da aplicação específica.

Pd Pfa

PdPfaPd=1Pfa=0e termine um dia. Como você também pode esperar, não é tão fácil. Existe uma troca inerente entre as duas métricas; normalmente, se você fizer algo que melhore um, observará alguma degradação no outro.

Um exemplo simples: se você estiver procurando a presença de um pulso contra um ruído, você pode definir um limite acima do nível de ruído "típico" e indicar a presença do sinal de interesse, se a estatística de detecção quebrar acima do limite. Deseja uma probabilidade realmente baixa de falso alarme? Defina o limite alto. Mas então, a probabilidade de detecção pode diminuir significativamente se o limiar elevado estiver igual ou acima do nível de potência do sinal esperado!

PdPfa

insira a descrição da imagem aqui

Um detector ideal teria uma curva ROC que abraça o topo da plotagem; isto é, poderia fornecer detecção garantida para qualquer taxa de alarme falso. Na realidade, um detector terá uma característica que se parece com as plotadas acima; aumentar a probabilidade de detecção também aumentará a taxa de alarmes falsos e vice-versa.

De uma perspectiva teórica, portanto, esses tipos de problemas se resumem à seleção de algum equilíbrio entre o desempenho da detecção e a probabilidade de falso alarme. Como esse equilíbrio é descrito matematicamente depende do seu modelo estatístico para o processo aleatório que o detector observa. O modelo normalmente possui dois estados ou hipóteses:

H0:no signal is present
H1:signal is present

Normalmente, a estatística que o detector observa teria uma de duas distribuições, de acordo com a hipótese verdadeira. O detector então aplica algum tipo de teste que é usado para determinar a hipótese verdadeira e, portanto, se o sinal está presente ou não. As distribuições da estatística de detecção são uma função do modelo de sinal que você escolhe conforme apropriado para sua aplicação.

Modelos de sinal comuns são a detecção de um sinal modulado por amplitude de pulso em um fundo de ruído gaussiano aditivo (AWGN) . Embora essa descrição seja um pouco específica para as comunicações digitais, muitos problemas podem ser mapeados para esse ou para um modelo similar. Especificamente, se você estiver procurando por um tom de valor constante localizado no tempo em um fundo de AWGN e o detector observar a magnitude do sinal, essa estatística terá uma distribuição de Rayleigh se nenhum tom estiver presente e uma distribuição riciana, se houver.

Depois que um modelo estatístico é desenvolvido, a regra de decisão do detector deve ser especificada. Isso pode ser tão complicado quanto você desejar, com base no que faz sentido para o seu aplicativo. Idealmente, você desejaria tomar uma decisão ideal em algum sentido, com base no seu conhecimento da distribuição da estatística de detecção sob as duas hipóteses, a probabilidade de cada hipótese ser verdadeira e o custo relativo de estar errado sobre uma das hipóteses ( sobre o qual falarei mais em breve). A teoria da decisão bayesiana pode ser usada como uma estrutura para abordar esse aspecto do problema de uma perspectiva teórica.

TT(t)t

TT=5Pd=0,9999Pfuma=0,01

A decisão de se sentar na curva de desempenho depende de você e é um parâmetro importante do projeto. O ponto de desempenho correto a ser escolhido depende do custo relativo dos dois tipos de possíveis falhas: é pior para o seu detector perder uma ocorrência do sinal quando isso acontece ou registrar uma ocorrência do sinal quando isso não aconteceu? Um exemplo: uma capacidade fictícia de detector de mísseis balísticos com capacidade de ataque automático seria melhor para ter uma taxa de alarme muito falsa; iniciar uma guerra mundial por causa de uma detecção espúria seria lamentável. Um exemplo da situação inversa seria um receptor de comunicação usado para aplicações de segurança da vida; se você deseja ter a máxima confiança de que não deixa de receber mensagens de socorro,

Jason R
fonte
Obrigado JasonR, post muito agradável. Ainda estou digerindo sua postagem, mas uma pergunta vem à mente. Como exatamente essa curva ROC está sendo gerada? Entendo que meço a taxa de positivo e falso positivo para qualquer classificador e isso marca um ponto na curva ROC. Então, o que está sendo alterado para que eu receba muitos pontos para gerar uma curva para qualquer classificador?
Spacey
1
PdPfuma
1

A estatística é a razão de verossimilhança (RV) e o teste é a comparação da RV contra um limite. Se você seguir a tradição de colocar a probabilidade da hipótese nula no denominador, decide a favor da hipótese alternativa ( contra a hipótese nula ) se a LR for suficientemente alta. Quanto maior a proporção, maior a sua confiança. Este é o teste que você executaria se já tivesse coletado os dados. Se você quiser decidir quando os dados chegarem aos poucos, poderá usar um teste seqüencial , como o SPRT .

Nesta fase, você pode se beneficiar de um livro sobre teste de hipóteses ou teoria da decisão (mais geral).

Emre
fonte