Às vezes, recebo arquivos de meus clientes com a extensão errada. Por exemplo, o nome é, image.jpg
mas o arquivo é realmente uma imagem TIFF. Em muitos casos, posso esclarecê-lo abrindo o arquivo em um editor de texto, observando os primeiros bytes e deduzindo o tipo de arquivo.
Isso funciona para mim com arquivos JPEG, TIFF, GIF e PDF. No entanto, existem muitos outros tipos de arquivos por aí.
É possível automatizar a identificação do tipo de arquivo correto, analisando os dados contidos?
file
comando faz isso em máquinas * nix.windows
, mas o comentário implica: "Você não pode fazer isso no Windows, você deve usar * nix". Assim? O comentário é direcionado "para os interessados". Em quê? Mudar de computador?:(
Respostas:
Você pode usar a ferramenta TrID , que possui uma biblioteca crescente de definições de tipo de arquivo para identificar arquivos.
Caracteres curinga são suportados, portanto, no seu exemplo, você pode colocar todas as imagens a serem examinadas em uma pasta, por exemplo, C: \ confirmimages - então você pode usar o comando:
Isso examinará todos os arquivos na
verifyimages
pasta.Há também uma versão GUI disponível, TrIDNet :
Há documentação disponível sobre como você pode integrar facilmente o TrID ou o TrIDNet no Windows Explorer e no Total Commander:
explorador de janelas
Comando total
fonte
Arquivo
fonte
file
é padrão, mas em sistemas mais antigos (especialmente não Linux) não tem muito conhecimento. Para o Ubuntu etc, deve ser bastante respeitável e até instalado como padrão.file
Windows. Se outros comandos * nix forem interessantes para você como usuário do Windows, procure pelo site para encontrar todos os tipos de gemas.file
seja um especialista em arquivos criados por aplicativos do Windows.file
coisa e, no entanto, quase se decidiu sobre a sua eficácia.Eu trabalhava na Biblioteca Nacional Francesa, para construir um sistema de arquivo digital que contém não apenas livros digitalizados, mas também milhões de artefatos digitais com todos os tipos de arquivos estranhos. Usamos o JHOVE para reconhecer os formatos de arquivo.
O JHOVE é de código aberto, é mantido pelo JSTOR e pela Harvard University Library. É bastante simples de usar .
fonte
Eu uso as bibliotecas OutsideIn da Oracle em meus programas. Não é gratuito, mas eles funcionam bem, especialmente para imagens. O discurso do mercado diz que suporta mais de 500 tipos de arquivos.
fonte
Você pode verificar o tipo de arquivo em qualquer computador, incluindo janelas em
http://www.checkfiletype.com
fonte