Como gerar dados de treinamento para OCR

7

Estou tentando criar um sistema óptico de reconhecimento de caracteres para reconhecer matrículas (indonésia), infelizmente não há um conjunto de treinamento disponível, mas encontrei a fonte, tentei gerar os dados de treinamento, convolvendo a imagem da carta da matrícula com os kernels (algo como gaussian blur, box blur) usando python, mas não se assemelha a dados reais, aqui está a fonte: insira a descrição da imagem aqui

e quero gerar uma letra individual, que se parece com isso:

plat kendaraan

Você tem alguma idéia de como gerar dados de treinamento como na figura acima? obrigado

Kiki Rizki Arpiandi
fonte
Que tal criar um conjunto de dados? Para que seu sistema é usado? Você pode obter dados não rotulados facilmente?
Martin Thoma 29/11
É dificil de obter conjunto de dados, mesmo conjunto de dados sem rótulo, o conjunto de dados deve ser uma imagem croped da carta de licença placa do carro, o sistema é usado para leitura de número de licença plat
Kiki Rizki Arpiandi
Eu costumava rede neural convolutional profundo para classifiying dígitos, acidente vascular cerebral largura transformar para detectar o texto e k-means clustering análise morfológica
Kiki Rizki Arpiandi

Respostas:

7

Essa é uma pergunta muito boa. Estou enfrentando um problema semelhante com dados diferentes, mas minha pesquisa me levou a isso: https://matthewearl.github.io/2016/05/06/cnn-anpr/, que deve ser praticamente o que você está procurando.

molig
fonte
Uau, obrigada, isso é muito legal, #
307 Kiki Rizki Arpiandi 29/11