Eu sei que o HOG é um estado da arte bastante para a detecção de pessoas, mas, na sua forma original, o HOG é apenas um método de detecção, e também não acredito que seja particularmente rápido (existe uma aceleração significativa que pega a janela deslizante e rejeita possibilidades improváveis cedo, mas foi patenteado).
Qual é a abordagem atual do estado da arte para determinar a pose de uma pessoa (incluindo poses próximas, como um tiro na cabeça, tiro na mão, etc ...) e para segmentar a pessoa do fundo?
A configuração aqui é imagens estáticas.
computer-vision
image-segmentation
face-detection
John Robertson
fonte
fonte
Respostas:
Confira o trabalho de Yang e Ramanan com uma mistura flexível de peças. Começa com uma parte central, mas os pares de partes anexadas são detectados em conjunto, estimando a probabilidade de que a área da imagem consultada ofereça suporte à coocorrência das partes anexadas na imagem. Presume-se erro no anexo e é minimizado usando um modelo de mola. Cada parte é detectada usando técnicas no estilo HOG, e todos os pares de peças na 'árvore' humana são iterados para determinar a detecção. Na minha experiência, ele tem uma taxa de alarme falso muito boa, mas requer aceleração de hardware para aplicativos em tempo real.
fonte