Recentemente, deparei-me com uma empresa que criou o que parece ser uma tecnologia de visão computacional capaz de detectar furtos automaticamente e alertar seus usuários.
Assistir a alguns dos vídeos e exemplos fornecidos pela empresa me deixou completamente perplexo e espantado com a forma como eles podem ter alcançado essa funcionalidade.
Entendo que ninguém aqui será capaz de me dizer exatamente como isso pode ter sido alcançado, mas alguém está ciente - e poderia me indicar - pesquisa neste campo ou, alternativamente, talvez forneça detalhes sobre como algo assim pode ser implementado ou orientação de onde alguém pode começar?
Meu entendimento era que os algoritmos de visão computacional estavam muitos anos longe de serem tão sofisticados. Esse tipo de aplicativo é realmente possível? Alguém disposto a arriscar um palpite de como eles conseguiram isso?
fonte
Respostas:
Você está mal informado sobre o estado da arte. Há vários anos, trabalhei para uma empresa que construiu esses sistemas para diversos fins. Um deles era um sistema de controle de saída de aeroporto extremamente bem-sucedido, que podia facilmente identificar a diferença entre uma pessoa andando no caminho errado pelo corredor de saída e coisas como bolas em movimento ou pessoas seguindo o caminho certo. Não é fácil reconhecer objetos em uma cena em tempo real, mas estávamos fazendo isso em CPUs incorporadas, não em supercomputadores.
Não vi nada lá que não fosse crível há alguns anos atrás.
fonte
Na verdade, esta empresa utiliza um híbrido de visão computacional e revisão manual na Índia. Não é pura visão computacional, especialmente para elementos como amor. Na verdade, eu conheço um varejista que tem um grande problema com esse sistema, não devido ao desempenho do sistema que armazeno, mas ao vídeo de envio de largura de banda para a Índia. Essa codificação manual é como eles reduzem erros e é um inquérito técnico típico de alguns fornecedores agora.
fonte