Como extrair caracteres Unicode do arquivo .png?

Eu quero extrair caracteres Unicode de arquivos .jpg e .png. Eu tento fazer isso usando o seguinte comando: tesseract 1.png output.txt Esse comando funciona para caracteres ingleses, mas quando eu tento para Unicode como Hindi, Marathi ou Devanagari Script, ele produz a saída errada....