Medindo o tamanho do objeto usando a rede neural profunda

10

Eu tenho um grande conjunto de dados de veículos com a verdade básica de seus comprimentos (mais de 100 mil amostras). É possível treinar uma rede profunda para medir / estimar o comprimento do veículo? Não vi nenhum artigo relacionado à estimativa do tamanho de objetos usando redes neurais profundas.

Naji
fonte
1
Muito boa pergunta. Bem-vindo à AI!
DukeZhou
(Observação ao moderador) - esta é uma resposta do espaço reservado para fazer uma pergunta ao OP, pois não posso comentar. Os dados são imagens ou texto? hisairnessag3 está no caminho certo com portar os pixels abordagem / métrica OpenCV para uma detecção de objetos DNN
Adnan S

Respostas:

4

Sim! Isso certamente pode ser feito. Como você tem um conjunto de dados rotulado, isso torna tudo mais simples!

Eu daria uma olhada neste projeto e isso deve levá-lo aonde você precisa.

Os detalhes da implementação devem ser bem diretos. Deixe-me saber se eu posso ajudar ainda mais.

hisairnessag3
fonte
1
Não é necessário explicar por que alguém está votando negativamente. Muitos programadores não têm tempo suficiente para olhar para os comentários, para os votos para ver se a resposta vale a pena ou não. Se você ler a pergunta novamente, verá que a pergunta é especificamente sobre o uso de DNN e não mais nada. o projeto que você compartilhou é sobre o uso do Opencv ... se você ler os comentários na postagem que compartilhou, verá que as pessoas estão perguntando sobre o DNN, mas a postagem em si não usa o DNN. Pela maneira que eu não sou a pessoa que se votou a sua resposta
BH85
2
Não é necessário, mas é útil. Se você pesquisar a qualquer profundidade, não encontrará projetos ou documentos neste caso de uso específico para DNNs. Com isso dito, referenciei o projeto mais próximo possível na esperança de iniciar o OP. Além disso, eu respondi a pergunta. A questão era: isso pode ser feito?
hisairnessag3
Obrigado pela sua resposta! Eu acho que seria melhorado com uma pequena explicação de como / por que é possível. Pelo menos um esboço da arquitetura seria muito útil.
Ben N
1

Sim, é possível, mas primeiro você terá que reconhecer algum objeto na imagem, 1) o próprio veículo e, em seguida, informar o tamanho conhecido desse veículo ou 2) um objeto conhecido que esteja à mesma distância da câmera que o carro ( um meio-fio, um sinal de parada, a cabeça do motorista, um pônei de Shetland ... o que for) e use esse objeto para calibrar o tamanho do carro muito próximo a ele.

Qualquer carro em uma imagem estará a uma distância desconhecida da câmera, fazendo com que o objeto pareça maior ou menor de foto para foto. Se você não reconhecer o carro ou pelo menos um objeto referente que tenha um tamanho conhecido, o tamanho físico do carro não será calibrado - você não terá base para sua estimativa de tamanho.

Se o carro for desconhecido, mesmo que você tenha pistas visuais (existe um objeto referente ou a distância entre a câmera e o carro), a extensão desconhecida da grande angularidade da lente da câmera pode distorcer a forma de um carro desconhecido (altura x largura), complicando ainda mais sua capacidade de estimar suas dimensões aparentes.

Randy
fonte
A placa do veículo pode ser o objeto conhecido usado para calibrar o tamanho do carro? As placas são tipicamente do mesmo tamanho.
Naji
1
Você teria que ter cuidado com as suposições que você faz de que as placas são do mesmo tamanho. Por exemplo, uma chapa australiana e uma chapa americana têm tamanhos diferentes. Se isso não for um problema para o seu aplicativo (ele só será executado em um país), você pode assumir um tamanho de referência para a placa. Você teria que ter cuidado ainda, porque a placa pode não estar orientada normalmente para você. Se o carro estiver a 45 graus, a largura da placa ocupará menos pixels que em 0, mesmo à mesma distância.
Pshlady #
1

Acho que este artigo pode ajudá-lo: Estimativa de caixas delimitadoras 3D usando aprendizado profundo e geometria

Ele usou 1 VGG-19 (pré-treinado no ImageNet) para aprender o tamanho dos carros

cryax dsa
fonte
Como você, presumi que se trata de inferir uma caixa delimitadora 3D onde os dados são representados em uma imagem 2D. O projeto mencionado por hisairnessag3 parece abordar apenas a caixa delimitadora 2D sem nenhum comportamento inferencial aprendido sobre a natureza 3D que a imagem pode conter.
Jim Jim
Este documento estima o tamanho e a orientação do carro usando uma imagem cortada em 2D (contém apenas o objeto desejado).
cryax dsa