Os algoritmos de aprendizado de máquina (CNNs) podem ser usados ​​/ treinados para diferenciar pequenas diferenças nos detalhes entre as imagens?

8

Eu queria saber se os algoritmos de aprendizado de máquina (CNNs?) Podem ser usados ​​/ treinados para diferenciar pequenas diferenças de detalhes entre imagens (como pequenas diferenças em tons de vermelho ou outras cores, ou a presença de pequenos objetos entre imagens muito semelhantes? )? E depois classificar imagens com base nessas diferenças? Se esse é um empreendimento difícil com nossos algoritmos atuais de aprendizado de máquina, como ele pode ser resolvido? Usar mais dados (mais imagens) ajudaria?

Eu também gostaria que as pessoas pudessem, por favor, fornecer referências a pesquisas que se concentraram nisso, se possível.

Eu apenas comecei a aprender aprendizado de máquina, e isso é algo que eu tenho pensado em minha pesquisa.

Obrigado.

O ponteiro
fonte

Respostas:

4

Os comparadores recorrentes atentos (2017, Pranav Shyam, Shubham Gupta, Ambedkar Dukkipati) são um artigo interessante que ajuda a responder à pergunta que você está perguntando, juntamente com uma postagem de blog que ajuda a descrevê-la em termos mais fáceis.

A maneira como é implementada é realmente bastante intuitiva. Se você já jogou um jogo "o que é diferente" com duas imagens, geralmente o que você faria é olhar para frente e para trás entre as imagens para ver qual é a diferença. A rede que os pesquisadores criaram faz exatamente isso! Ele olha para uma imagem e depois se lembra de recursos importantes sobre essas imagens, olha para a outra imagem e vai e volta.

juicedatom
fonte
2

Existem redes criadas para aprender a diferenciar as classes, mesmo que pareçam iguais. Normalmente, uma perda de trigêmeos é usada nessas redes para aprender a diferença entre o alvo, uma amostra positiva e uma negativa.

Por exemplo, essas redes são usadas para executar a verificação de identidade com imagens de rosto, o algoritmo aprende as diferenças entre pessoas diferentes, em vez de reconhecer pessoas.

Palavras-chave: função discriminativa, perda de trigêmeos, rede siamesa, aprendizado único.

Os trabalhos de teses são interessantes:

Louis Lac
fonte