Uma única rede neural pode lidar com o reconhecimento de dois tipos de objetos ou deve ser dividida em duas redes menores?

9

Em particular, um computador embutido (com recursos limitados) analisa o fluxo de vídeo ao vivo a partir de uma câmera de trânsito, tentando escolher bons quadros que contêm o número da placa dos carros que passam. Depois que uma placa é localizada, o quadro é entregue a uma biblioteca de OCR para extrair o registro e usá-lo ainda mais.

No meu país, dois tipos de matrículas são de uso comum - retangular (o típico) e quadrado - na verdade, um pouco retangular, mas "mais alto do que largo", com o registro dividido em duas linhas.

(existem mais alguns tipos, mas vamos desconsiderá-los; eles são uma pequena porcentagem e geralmente pertencem a veículos que estão fora do nosso interesse.)

Devido aos recursos limitados e à necessidade de processamento rápido em tempo real, o tamanho máximo da rede (número de células e conexões) com o qual o sistema pode lidar é fixo.

Seria melhor dividir isso em duas redes menores, cada uma reconhecendo um tipo de placas de registro, ou a rede única maior lidaria melhor com os dois tipos?

SF.
fonte

Respostas:

6

Bem, não sei que tipo de recursos você está oferecendo à sua rede neural. No entanto, em geral, eu usaria uma única rede neural. Parece que você não tem limitação de recursos para treinar sua rede e o único problema são os recursos enquanto você aplica sua rede.

O problema é que provavelmente os dois problemas têm coisas em comum (por exemplo, os dois tipos de placas são retangulares). Isso significa que, se você usar duas redes, cada uma terá que resolver o mesmo subproblema (a parte comum) novamente. Se você usar apenas uma rede, a parte comum do problema levará menos células / pesos a serem resolvidos e os pesos / células restantes poderão ser empregados para um melhor reconhecimento.

No final, se eu estivesse no seu lugar, tentaria os dois. Eu acho que é a única maneira de ter certeza de qual é a melhor solução. Ao falar teoricamente, é possível que não incluamos alguns fatores.

Didam I
fonte