Estou tentando detectar automaticamente alguns marcos anatômicos definidos por médicos em um volume reconstruído por tomografia computadorizada. Os médicos usam esses marcos para medir alguns parâmetros específicos do paciente. Eu tentei usar o descritor de recurso SIFT, já que esses pontos de referência anatômicos são uma espécie de "pontos-chave". Isso não funcionou muito bem, pois os pontos de referência são pontos (ou regiões minúsculas) que geralmente não são "pontos de interesse", conforme definido pelo SIFT. Eu tenho procurado muitos algoritmos de correspondência de padrão / modelo, mas, quando não tenho problemas de rotação / tradução / escala, acho que os recursos extraídos não diferenciam cada ponto de referência o suficiente (do restante dos pontos de referência e do restante dos pontos não) patches de referência) para treinar um classificador com bom desempenho (pelo menos 80% de precisão na detecção).
Informe-me se não estiver indicando o problema com clareza suficiente.
Eu realmente aprecio qualquer conselho.
Obrigado!
Imagem de exemplo:
Os pequenos cruzamentos x e pequenos quadrados estão sobre os pontos de referência que quero detectar (esqueci de mencionar que tenho um conjunto de treinamento, com os pontos de referência rotulados). As linhas brancas representam as medidas tomadas. Estas são algumas fatias de casos diferentes (é claro, não consigo postar o volume 3D completo).
fonte
Respostas:
Hesito em escrever isso como resposta, mas, como você está pedindo apenas conselhos, farei isso.
Sugiro investigar técnicas baseadas na Transformada Wavelet Complex de Árvore Dupla (DTCWT). Estes demonstraram ser úteis para gerar descritores com boa tolerância à mudança, escala e rotação das imagens de origem. Não é o problema clássico, pois você não permite que os pontos sejam atribuídos a você, mas eu suspeito que você possa adaptar as técnicas a pontos de referência predefinidos.
Claramente, os pontos de referência têm algum interesse da perspectiva de um clínico, então há algo de interessante neles - é simplesmente um caso de modelagem disso no descritor. As técnicas Wavelet (em particular o DTCWT) tendem a ser boas em modelar recursos que os olhos percebem.
Um ponto de partida provavelmente seria este artigo relativamente recente .
fonte