Quais sites expõem os números de série do corpo da câmera da imagem original EXIF?
O Flickr é um site de compartilhamento de fotos que expõe muitos metadados das fotos (dos dados EXIF ) e facilita o acesso, graças à API do Flickr . O Picasaweb do Google também oferece algumas informações do EXIF, mas não o número de série.
Existem outros sites que podem me ajudar?
Como pano de fundo do que estou fazendo, estou tentando agrupar um banco de dados de números de série da câmera e os URLs das imagens em que foram encontrados. Sou apenas eu que faço algo de graça, na esperança de que possamos pegar algumas pessoas que roubam nossas preciosas câmeras! Espero que isso não seja muito fora de tópico, pois não estou tentando vender nada, apenas tentando fazer algo de bom!
Disclaimer: Eu sou o autor do stolencamerafinder ;)
Atualização - Conforme solicitado pelo fbuchinger, aqui está uma atualização rápida do status do projeto:
Muitos sites (incluindo o Facebook, infelizmente) retiram as notas principais do EXIF. Até agora, encontrei a fonte mais rica de números de série no Flickr. Suponho que é porque as pessoas costumam fazer upload de imagens em tamanho real (lidas "não editadas"). No meu site ( stolencamerafinder.com ), ofereço um aplicativo java webstart que coleta dados do flickr por meio de sua API. Como existe um limite na taxa em que faço chamadas de API, escrevi para que o trabalho seja compartilhado entre o número de clientes iniciados na Web, reduzindo assim a largura de banda e a CPU nos clientes, mais pessoas o executam. Se você está lendo isso e tem, digamos, acesso de administrador a um servidor no trabalho que não faz muito, por que não deixá-lo em execução;)
Também escrevi um plug-in do Google Chrome que fica atento a imagens em sites com um número de série incorporado. Não espero um rendimento muito alto desse aplicativo. A idéia principal era descobrir quais sites podem ser boas fontes para escrever ferramentas de spidering personalizadas e depois rastreá-las.
Eu publiquei minha API para o stolencamerafinder e estou procurando outros programadores para me ajudar a escrever programas que podem servir como rastreadores da web.
Reuni muitos dados interessantes ao fazer este projeto que colocarei no site em breve, como quais modelos de câmera fazem e não escrevem números de série úteis. A Nikon D50, por exemplo, apenas escreve "D50" como seu número de série!
Eu ficaria extremamente grato por qualquer feedback (bom ou ruim!) Que você possa ter no meu projeto.
-Matt
Respostas:
Eu amo a idéia de um apanhador de ladrões. ;)
Percebi que o DeviantArt.com parece "capturar" todos os metadados EXIF incorporados nas imagens carregadas. Ele não mostra tudo, no entanto, existem algumas partes do site (muitas delas apenas para membros pagantes) que mostram informações mais detalhadas sobre uma imagem carregada, e eu vi dados completos das tags listados.
Eu acho que, tecnicamente falando, se você pudesse fazer algo semelhante ao TinEye.com (Reverse Image Search) que indexa imagens e pesquisas por similaridade de conteúdo. O TinEye é útil, pois combina imagens por conteúdo, mas tem suas limitações. As manipulações de fotos criadas com fotos com direitos autorais de alguém são difíceis de identificar. A pesquisa por número de série forneceria uma abordagem alternativa e complementar.
Tecnicamente, você pode obter quaisquer dados exif incorporados nas imagens enviadas para a Internet. Se o número de série da câmera estiver incorporado, você terá o que está procurando. Você precisaria raspar uma cópia de cada imagem dos sites indexados, extrair qualquer EXIF (ou outro dado de tag) das imagens indexadas e rastrear as informações com um link para a fonte. Provavelmente, você também pode usar os principais mecanismos de pesquisa como Bing e Google para encontrar imagens para indexar (pesquisas básicas de imagens de palavras-chave, como nomes de fotógrafo, locais etc. podem ser suficientes.) Você provavelmente não precisaria manter a imagem por perto (e isso pode envolver questões legais de qualquer maneira), mas pelo menos você teria um índice de dados de tags EXIF / IPTC, possivelmente um número de série e um link de origem.
fonte
ATUALIZAR:
Obrigado pela atualização do status do projeto! Antes de mais, a abordagem com o aplicativo webstart java é interessante - você usa chaves api diferentes do flickr para cada instância de webstart ou o flickr limita os pedidos da api com base em uma combinação de chave / endereço IP da api?
Executei seu aplicativo de início na web e ele produziu 0 número de série depois de digitalizar 50 fotos. Eu não olhei para o seu código-fonte, mas você deve estar ciente de que apenas uma minoria minúscula de câmeras (principalmente dslrs) gravam números de série nos metadados exif.
Eu recomendo baixar as imagens de amostra do Meta Information Repository de Phil Harvey e executar o exiftool nele para ver quais modelos realmente produzem números de série. Você pode restringir a pesquisa de aplicativos de webstart a esses modelos e, assim, melhorar muito a taxa de sucesso.
Eu me deparei com sua pergunta quando comecei a explorar o photo.stackexchange.com.
Há 2 anos, tive uma idéia muito semelhante ao stolencamerafinder e comecei a implementá-lo em python. No entanto, eu parei devido a várias razões:
A maioria dos números de série da câmera armazenados nos dados EXIF são editáveis e, portanto, acessíveis (pelo menos com exiftool) -> risco de alertas falsos ou "spam de número de série" (pelo menos quando o serviço começa a ficar popular)
A maioria das pessoas usa carregadores de imagens que redimensionam suas imagens e, com isso, geralmente descartam todas ou muitas partes dos dados EXIF (lembre-se de que o número de série sempre é armazenado em algumas notas exif proprietárias que geralmente são descartadas durante conversões de imagens) -> baixa proporção de imagens inspecionadas : números de série extraídos.
no entanto, estou curioso para saber como o seu projeto se desenvolveu ... você poderia dar um breve resumo do status?
fonte
Como minha primeira resposta é mais focada em detalhes técnicos, decidi abrir uma segunda resposta para fornecer uma visão geral da minha idéia original de "camerafinder" apelidada de "CATT" (Camera Anti Theft Tool). Sinta-se livre para usar minhas idéias, mas por favor me credite proberly ...
Ao contrário do sensor de estol, o CATT trabalha opt-in-base. Como proprietário de uma câmera, você se inscreve no site CATT, cria um perfil de usuário e depois registra suas câmeras.
Para isso, é necessário tirar uma foto de algum QRCode gerado aleatoriamente exibido na tela. Em seguida, você carrega a foto não modificada no site do CATT. Quando o upload é concluído, o servidor lê os metadados da foto e verifica o número de série incorporado. Ele também tenta decodificar o QRCode da imagem e o compara com um hash armazenado. Isso evita que alguém possa registrar sua câmera apenas carregando uma foto arbitrária tirada com essa câmera.
Quando sua câmera é roubada, você efetua login no site da CATT e marca esse dispositivo como roubado. Para rastrear as câmeras roubadas, planejamos um analisador de número de série exif do lado do cliente em javascript como script mozilla greasemonkey (semelhante à sua extensão do Chrome). Ele deve ser executado apenas em páginas do flickr que contenham imagens originais (graças ao suporte ao padrão de URL da greasemonkey) para não desacelerar muito o navegador. O script entraria em contato com o servidor CATT regularmente para buscar uma lista de seriais de câmeras roubadas. Se a série da imagem exibida no momento mostrar uma correspondência, ela exibirá um alerta.
Vi que sua extensão do Chrome segue uma abordagem semelhante (embora pareça coletar apenas os seriados). No seu caso, eu usaria a extensão com o W3C File Api (atualmente Firefox e Chrome), para que o usuário também possa inspecionar fotos armazenadas localmente e não apenas aquelas incorporadas em páginas da web. Isso certamente aumentará sua "colheita de número de série", porque nenhum "homem do meio" (flickr facebook etc.) removerá os dados exif.
Aqui está uma demonstração interessante da Mozilla sobre Exif Extraction com a API de arquivos W3C .
fonte