Melhores configurações de câmera para fotografar texto?

11

Estou usando minha S95 para fotografar documentos de texto (em papel e microfilme) para OCR. Eu já perguntei sobre os problemas de como fotografar melhor uma tela de computador para microfilme, mas estive pensando sobre a melhor maneira de fotografar texto para que o texto fique claro e nítido. Aqui estão meus pensamentos atuais, mas eu gostaria de ouvir o que alguém com mais experiência em fotografia do que eu tem a dizer:

  1. Estou usando um número menor de megapixels (em torno de 6 a 7 MP em vez do máximo do S95, que é 10 MP), para que os arquivos PDF resultantes não matem meu computador quando eu realmente os percorrer

  2. Abertura - mais baixa (por exemplo, f / 6.3), de modo que, se a câmera não estiver exatamente paralela à página, o texto permanecerá em foco

  3. Velocidade do obturador - Há uma desvantagem aqui, porque as bibliotecas geralmente têm pouca luz, então eu gostaria de diminuir a velocidade do obturador para aumentar a exposição, mas sem um tripé, há uma chance de a câmera tremer

  4. ISO - Não tenho muita certeza de como isso afetaria.

  5. Balanço de Branco - Novamente, não tenho muita certeza.

Eu tenho experimentado configurações diferentes na minha câmera, mas estou apenas aprendendo sobre fotografia e gostaria de saber se alguém tem alguma sugestão sobre como fotografar melhor texto, de livros ou documentos, que é fácil de ler.

Jason
fonte
3
Por que não usar a ferramenta certa para o trabalho e usar um scanner?
21411 Ahockley
7
"Por que não usar a ferramenta certa para o trabalho e usar um scanner?" - Porque muitos dos documentos com os quais trabalho não são digitalizáveis. Eles são muito frágeis ou a biblioteca não permite digitalizar ou cobra custos exorbitantes para digitalizar mais de US $ 0,50 / página.
Jason
2
Eu gostaria que fosse dito: espero que seus usos respeitem adequadamente os direitos autorais, se e como relevantes. :) Presumindo que sim, espero que você encontre suas respostas!
Lindes
3
"Espero que seus usos respeitem adequadamente os direitos autorais" - Sim, meu trabalho é com documentos fora das restrições de direitos autorais (sou historiador, estudando principalmente a Europa do final do século 19)
Jason
2
@ahockley: outro motivo para não digitalizar é que leva muito tempo. Com uma DSLR, posso fazer cerca de 20 páginas por minuto em uma mesa, mas um scanner que usa rapidamente um alimentador de documentos e custa muito.

Respostas:

7

Se sua câmera tiver um modo preto e branco, tente isso para reduzir o tempo de pós-processamento. Além disso, muitos programas de OCR com os quais trabalhei se saem muito melhor em P&B.

Você vai querer ficar o mais paralelo possível à página, porque para reduzir a trepidação da câmera ao segurar a mão, você provavelmente precisará da sua abertura mais larga para maximizar a velocidade do obturador. O pequeno sensor no seu s95 deve aumentar sua DOF o suficiente para abrir a abertura o máximo possível.

Considerando que você só executará isso por meio do OCR, aumente seu ISO até o que lhe der uma exposição adequada com o mínimo de trepidação. É muito menos provável que o OCR se queixe de ruído extra do que letras borradas.

O balanço de branco, se você está apenas falando de texto, deve ser o que for a sua configuração "interna" para sua câmera - mas, francamente, não se preocupe muito com isso.

Seus megapixels podem ser importantes apenas se o texto do documento for incrivelmente pequeno e você precisar resolver claramente esse nível de detalhe, mas eu acho que 6-7 será bom para a maioria das coisas.

rfusca
fonte
1
Você provavelmente quer dizer "perpendicular à página". Se você é paralelo, será difícil ler o texto. ;-)
Craig Walker
@ Craig Walker - ele usou os termos "paralelo" para a página e eu entendi o que ele quis dizer, então eu não estava tentando confundi-lo. Sem mencionar que o sensor em si seria paralelo, assim como o visor. Depende apenas de qual parte da câmera sua referência. O termo foi intencional.
Rfusca
Use o máximo de megapixels possível, os documentos com OCR são o que importa e serão relativamente pequenos e contanto que a fonte seja todo o texto, sem afetar a resolução da câmera. Eu uso o Abbyy FineReader e funciona melhor em imagens de alta resolução (21MP em vez de 10MP, por exemplo). Então atire em 10MP.
justo.
Craig Walker
+1 no modo P / B. RGB para processamento de texto está desperdiçando pixels.
Greg
2

Você parece ter uma boa noção das configurações já. A trepidação da câmera vai arruinar a legibilidade do texto mais do que qualquer outra coisa, então eu otimizaria isso primeiro. Se você não puder usar um tripé, verifique se a velocidade do obturador é de pelo menos 1 sobre a distância focal (equivalente a 35 mm). Diminuir o zoom tornará isso mais fácil. Use a estabilização de imagem, se a tiver.

A abertura pode ser definida razoavelmente ampla, apenas verifique se você está paralelo à página. Uma abertura ampla ajudará na velocidade do obturador; novamente, o desfoque devido à abertura ampla não é nada comparado ao desfoque devido ao movimento da câmera!

ISO, o que for necessário para obter uma boa exposição. O ruído não deve afetar a legibilidade até que fique muito ruim.

É preferível fotografar um balanço de branco personalizado com base no próprio papel, mas o software de OCR deve ser capaz de lidar com um fundo esbranquiçado.

Matt Grum
fonte
1
  1. Suponho que você esteja convertendo JPEGs para PDFs. Recomendo capturar o máximo e usar um programa para reduzir o tamanho para 6-7 MP com a nitidez aplicada após o tamanho reduzido e antes da conversão para PDF.

  2. Para esclarecer, você deseja uma abertura mais estreita para maior profundidade de campo, que é um número f-stop mais alto. (por exemplo, você quer f / 8 em vez de f / 2). Com o texto para facilitar a leitura, tente apontar a câmera o mais perpendicular possível, para que você não precise se preocupar com a profundidade de campo. É uma boa idéia parar um pouco da abertura total para reduzir aberrações como CA que você verá com texto em preto e branco. Quanto mais perto você estiver do papel, menor será a profundidade de campo.

  3. Provavelmente, isso terá o maior efeito na legibilidade se você estiver segurando a mão. Se estiver segurando a mão, você deseja selecionar uma velocidade do obturador que seja mais rápida que 1 / (distância focal equivalente a 35 mm) ou ainda mais rápida. Isso depende de qual configuração de zoom você está usando no seu P&S. Se você usar a grande angular, poderá obter velocidades mais altas do obturador, mas poderá obter distorção do barril. Se você estiver fotografando documentos de texto e não uma tela de computador, recomendo tentar um flash.

    Se puder, mantenha o documento (gravado ou algo plano) para que você possa descansar a câmera e obter a velocidade do obturador desejada. Você também pode usar um saco de feijão ou objetos pequenos para inclinar a câmera enquanto ela repousa. Além disso, você pode obter adaptadores de tripé de garrafa d'água para um P&S.

  4. Abertura, velocidade do obturador e ISO formam um triângulo de exposição. Leia aqui . Quanto maior o ISO, menor a abertura e menor a velocidade do obturador que você pode usar, mas a imagem ficará mais barulhenta. Eu recomendo um ISO baixo (400 ou menos) para um P&S com texto.

  5. Selecione o balanço de branco para sua situação de iluminação. Se você tiver fluorescente, use isso. Se você estiver usando flash, use o balanço de branco do flash.

Eruditass
fonte
Não acho que o f / 8 seja realista para fotografar o computador de mão em ambientes fechados (a menos que seja usando flash, você precisará pedir permissão à biblioteca primeiro) mais o f / 8 causará distração com um sensor pequeno, o ganho de nitidez é mínimo comparado com o aumento exigido no tempo do obturador / ISO.
Matt Grum
@Matt f / 8 é um exemplo para mostrar que ele quer um número maior para aumentar a profundidade de campo (e reduzir outras aberrações, como CA, que podem ser visíveis). Não lhe dei orientações, pois não tenho certeza da quantidade de luz que ele tem. Distração? Você quer dizer difração?
Eruditass
Sim, eu quis dizer difração - estou escrevendo isso no meu telefone, que tem o hábito irritante de corrigir automaticamente minhas palavras, mesmo quando as soletro corretamente. CA não vai ser um grande problema (em comparação com a trepidação da câmera), eu acho que você seria melhor uma parada para baixo de bem abertos, se a luz é um grande problema ...
Matt Grum
Você não ama tecnologia? Sim, eu diria que uma parada em aberto é uma boa orientação e concorda que a trepidação da câmera seria o ponto crucial.
Eruditass
Essa é uma sugestão muito boa para fotografar com o máximo de MPs e depois reduzir a amostra no computador. Eu posso imaginar que a nitidez + contraste extra levará a um texto muito mais nítido, mais fácil de ler.
Jason
1

Concordo com as sugestões para fotografar na resolução mais alta disponível e com o tamanho reduzido no computador. Além disso, escolha o jpeg da mais alta qualidade que você pode obter da sua câmera ou até mesmo fotografe em bruto, se a câmera permitir, e converta para um tiff ou png. A compactação com perdas no jpeg pode criar artefatos ao redor do limite de tinta / papel que podem confundir o seu software ocr.

Em geral, o que você quer fazer é usar as configurações que obterão a imagem mais nítida possível. Coisas como contraste, balanço de branco etc. podem ser alteradas no computador. De fato, aumentar o contraste usando a ferramenta de níveis ou a ferramenta de contraste / brilho no photoshop ou no GIMP pode ajudar muito.

Além disso, a conversão para o formato em escala de cinza reduzirá substancialmente o tamanho dos seus arquivos. E se você fizer isso e aumentar o contraste, não precisará se preocupar com o balanço de branco. No entanto, você pode experimentar o equilíbrio de brancos, algumas configurações podem produzir um contraste melhor que outras (depende da sua iluminação).

Se o seu computador puder lidar com isso, faça todos os ajustes (escala de cinza, contraste, brilho) antes de diminuir o tamanho e, após reduzir, aplique um filtro de nitidez à imagem.

Jan Hlavacek
fonte
1

Alguns pensamentos, que eu não notei em outro lugar, para adicionar à mistura:

  • Se você fotografar "com mais zoom" (mais telefoto ), isso fará com que você fotografe mais longe da página, o que fornecerá uma imagem mais consistente em relação ao tamanho do texto (as palavras em um canto estarão mais próximas da mesmo tamanho das palavras do meio; com grande angular, você pode obter distorção em relação a isso). Não tenho certeza de qual é a configuração "ideal" aqui, e é uma troca entre as velocidades necessárias do obturador, potencialmente, apenas algo para se pensar.

  • Você vai querer " expor demais " em comparação com o que sua câmera provavelmente acha certo por padrão (a menos que seja inteligente o suficiente para adivinhar que isso é papel - coloquei entre aspas porque você realmente não deseja expor demais) , superexponha com base na medição de uma página em branco), porque o tom principal (o próprio papel) será a principal coisa que a câmera tenta expor e, se você expor o papel como cinza médio, terá um ponto de partida mais confuso. Se você "expor demais" uma parada e meia a duas paradas (simplesmente não vá ao ponto de destacar os recortes), o texto ainda deve ser agradável e escuro, mas o papel será agradável e brilhante, fazendo separações de contraste ( e, portanto, OCR) mais fácil.

  • tente ter uma iluminação uniforme - se um canto da página for muito mais claro ou mais escuro que outro, isso tornará mais difícil separar as coisas em preto e branco puro que você provavelmente deseja para fins de OCR.

  • um "suporte de cópias" é ideal para projetos como esse, embora eu presuma além do que você poderia facilmente ter na biblioteca ... No entanto, dependendo da forma como sua biblioteca está configurada, é possível que exista algum lugar (talvez uma prateleira sobre a mesa ou uma haste com iluminação ou similar?) que você poderia colocar um super grampo com uma cabeça esférica ( aqui está um , mas qualquer super grampo com um "pino" de tamanho adequado (dependendo da cabeça) e algum tipo de tripé a cabeça faria), e sua câmera será montada sobre a superfície da mesa (ou o que for), para que você possa ter um posicionamento consistente e estabilidade, caso precise de exposições mais longas. Basicamente, isso equivaleria a um estande de cópia de "homem pobre".

    Você também pode usar um temporizador automático ou um controle remoto curto (imagino que sua câmera tenha um modo de timer interno de 2 segundos e talvez um personalizado que possa ser ainda mais curto), para evitar que a trepidação da câmera pressione o botão.

É nisso que estou pensando no momento. Espero que seja útil.

lindes
fonte
1

Tenho o mesmo trabalho que a sua foto de landman e faço isso há anos e anos. A maioria das pessoas não sabe do que está falando, confie em mim !!!

  1. A câmera em M ou manual

  2. Iso 100-200 quanto maior, # mais brilhante, mas fica mais granulado ou barulhento na foto

  3. Velocidade do obturador 1/100 a 1/160 (geralmente 1/125 é melhor, quanto menor o brilho, mas você obtém mais enterros ou retoma)

  4. Abertura ou f2.7 (por que você precisaria de um campo de visão profundo, é uma página plana)

  5. Fotografe em cores, de 6 a 10 megapixels, analise as configurações de balanço de branco, geralmente fluorescentes 1 ou 2, desligue a maioria dos sinos e apite se Ur não tiver certeza de desligá-lo

  6. expor fotos em comp usando ACDC

Spencer
fonte
0

Algumas pequenas sugestões, mas acho que sua configuração parece boa

  1. Use um tripé. Isso removerá quaisquer problemas com a trepidação da câmera e permitirá que você use a exposição pelo tempo que precisar.

  2. Evite que a luz caia diretamente sobre o papel em um ângulo que possa refletir diretamente na lente e causar um destaque onde você não deseja. Isso geralmente significa garantir que a luz esteja vindo dos lados.

  3. ISO: Como regra geral, você deve errar para obter um valor mais baixo, mas tenho certeza de que qualquer diferença material rapidamente se tornará óbvia.

Além disso, não consigo pensar em nenhuma maneira de melhorar sua configuração. Para ser sincero, acho que você entendeu.

AJ Finch
fonte
Você pode sugerir um tripé bom (e relativamente barato) que seria útil e permitir que eu vire a câmera para que fique paralela às páginas que estou fotografando? Eu olhei para os tripés Joby e eles parecem promissores, mas ouvi dizer que eles frequentemente mudam quando você bate no obturador.
Jason
@ Jason, ponto justo. Eu tenho um Joby que eu gosto, mas para interromper o movimento quando você bate no obturador, basta usar o disparador remoto ou o temporizador automático. Esta é realmente uma boa dica para quando você estiver usando uma velocidade lenta do obturador. A má notícia é que qualquer tripé pesado o suficiente para ser muito estável não será barato. Me desculpe por isso! (Se você descobrir de forma diferente, me avise!);)
AJ Finch
0

Parece que você já tem a maioria das respostas :-P Vou apenas adicionar alguns comentários sobre seus pontos:

  1. Resolução: você está certo, não precisará de muita resolução aqui, principalmente se estiver visualizando as imagens na tela. Provavelmente, eu tamparia duas vezes a resolução máxima de tela típica.

  2. Abertura: você está correto ao selecionar uma abertura menor para obter um pouco de espaço de manobra de profundidade de campo. No entanto, você provavelmente não precisará de muito. Brinque com a calculadora de profundidade de campo para a sua distância focal, calcule um DOF razoável e depois use a maior abertura possível. (No entanto, certifique-se de fazer uma parada ou duas sob a abertura máxima para obter a melhor nitidez.) Você deseja a maior abertura para ter mais espaço para brincar com obturador e ISO; ver abaixo.

  3. Obturador: obviamente, você quer isso o mais rápido possível para reduzir a trepidação, enquanto ainda recebe luz suficiente. Ouvi várias fontes afirmarem "velocidade do obturador igual à distância focal" para evitar trepidação; alguns reivindicam o dobro. Portanto, se você estiver usando uma lente de 50 mm, tente manter a velocidade do obturador entre 1/50 e 1/100. Depois disso, tente a velocidade mais lenta para maximizar a luz.

  4. ISO: você deve conseguir aumentar isso bastante alto. O ruído pode reduzir a aparência da imagem, mas provavelmente não prejudicará muito sua legibilidade. O que é "alto ISO" e "muito barulhento" depende da sua câmera. Experimentar. Essa é provavelmente a melhor maneira de obter a exposição correta com pouca luz, em comparação com a abertura e o obturador.

  5. Balanço de Branco: para você, isso não deve importar muito. Se o seu papel fotografado sai esbranquiçado, isso importa? (História diferente se você estiver fotografando livros com imagens coloridas, é claro). Se você deseja corrigi-lo na postagem, terá um tempo relativamente fácil, pois você tem muito papel de cor neutra para trabalhar. Eu provavelmente deixaria sua câmera no Balanço de Branco Automático e esqueceria.

Craig Walker
fonte