Dadas apenas observações de um sinal binário perturbado pelo ruído gaussiano com informações prévias desconhecidas, como posso estimar o limiar de decisão ideal?
(Não, essa não é uma pergunta de lição de casa)
Especificamente, penso no seguinte modelo: é uma variável aleatória de dois estados ( H 0 , H 1 ) :
com parâmetros desconhecidos : .
O limite máximo de probabilidade log a posteriori poderia ser calculado a partir desses parâmetros se eu os conhecesse. Eu estava originalmente pensando em como estimar os parâmetros primeiro para chegar ao limite . Mas eu estou pensando que pode ser mais robusta para estimar diretamente .
Pensamentos: A normalização das observações (subtração da média da amostra e divisão pelo desvio padrão) reduz o espaço do parâmetro em 2 dimensões: e σ .
fonte
Respostas:
Minha intuição é que seria difícil obter o limite de decisão correto que você espera encontrar:
A partir das estatísticas globais que você está considerando (média da amostra: ; desvio padrão: expressão mais complexa, mas duvido que isso envolva um log).πμ0 0+ ( 1 - π) μ1 1
Eu abordaria o problema desta maneira:
Se for possível assumir que é pequenoσ
Estou mencionando isso, porque lembre-se de que o limite de decisão é afetado por somente se σ for suficientemente alto para permitir a sobreposição de ambas as classes. Se os µ s estiverem distantes em mais de alguns σπ σ μ σ , classe probabilidades prévias têm nada a dizer no processo de decisão!
Se nenhuma suposição sobre puder ser feitaσ
fonte
Para resumir, você tem duas distribuições com parâmetros desconhecidos e uma medição que pode ter se originado de qualquer processo estocástico. Isso geralmente é chamado de problema de associação de dados e é muito comum e amplamente estudado na comunidade de rastreamento. Você pode considerar o uso de um algoritmo PDAF (Probability Data Association Filter) ou MHT (Multi-Hypothesis Tracking). Isso deve fornecer estimativas da média e variação para cada distribuição.
Como alternativa, como o ruído é branco e gaussiano, o ML, o MAP e o MMSE são todos equivalentes e podem ser encontrados minimizando o erro quadrático médio (função de custo), como é efetivamente descrito pela resposta anterior. Eu usaria uma abordagem de programação dinâmica para encontrar o mínimo da função de custo. Isso deve ser menos complexo (computacionalmente) do que os métodos EM / cluster descritos anteriormente. Mais um comentário: o PDAF é recursivo. Dado o modelo de sinal simples, ele deve funcionar de maneira muito eficaz e o que eu espero é uma fração da complexidade computacional do algoritmo EM. Boa sorte, -B
fonte
Existe um algoritmo de Kittler e Illingworth, de meados da década de 1980, chamado "Minimum Error Thresholding" que resolve esse problema nas distribuições gaussianas. Recentemente, Mike Titterington (Universidade de Glasgow) e JH Xue (agora na UCL) colocaram isso em um quadro estatístico mais formal, veja suas publicações conjuntas em periódicos.
fonte