Na teoria do espaço de escala, a representação no espaço de escala do sinal , (no caso da imagem ) é dada como: onde é um núcleo gaussiano com o parâmetro e é uma convolução. Ao alterar o parâmetro , recebemos uma imagem mais ou menos suavizada. Como resultado, a representação mais grosseira (parâmetro ) não conterá objetos pequenos ou ruído.d = 2, G ( x , y ; t ) = g ( x , y ; t ) * F ( x , y ) g ( x , y ; t ) t ∗ t t
O ponto principal é encontrar uma maneira de detecção de recurso invariável em escala, certo? Assim, para algumas imagens com tamanho reduzido, os recursos como pontos-chave serão detectados corretamente, mesmo se o tamanho for diferente, sem encontrar outros pontos-chave de ruído.
No artigo, eles estão usando os derivados normalizados. . Qual é o significado do uso da derivada normalizada, como isso ajuda na invariância da escala?δ ξ , γ - n o r m = t γ / 2 δ x γ
A partir desta imagem, podemos ver que nas mesmas posições os diferentes pontos-chave foram encontrados (diferentes em tamanho). Como isso é possível?
Se você puder explicar o algoritmo passo a passo da detecção de recursos invariáveis em escala, isso seria ótimo. O que é realmente feito? As derivadas podem ser tomadas por ou . O blob pode ser detectado tomando a derivada de por variáveis. Como a derivada de está ajudando aqui?t L ( x , y ) t
O artigo que eu estava lendo é: Detecção de recursos com seleção automática de escala