Quais sites de compartilhamento de fotos expõem os números de série da câmera?

26

Quais sites expõem os números de série do corpo da câmera da imagem original EXIF?

O Flickr é um site de compartilhamento de fotos que expõe muitos metadados das fotos (dos dados EXIF ) e facilita o acesso, graças à API do Flickr . O Picasaweb do Google também oferece algumas informações do EXIF, mas não o número de série.

Existem outros sites que podem me ajudar?

Como pano de fundo do que estou fazendo, estou tentando agrupar um banco de dados de números de série da câmera e os URLs das imagens em que foram encontrados. Sou apenas eu que faço algo de graça, na esperança de que possamos pegar algumas pessoas que roubam nossas preciosas câmeras! Espero que isso não seja muito fora de tópico, pois não estou tentando vender nada, apenas tentando fazer algo de bom!

Disclaimer: Eu sou o autor do stolencamerafinder ;)


Atualização - Conforme solicitado pelo fbuchinger, aqui está uma atualização rápida do status do projeto:

Muitos sites (incluindo o Facebook, infelizmente) retiram as notas principais do EXIF. Até agora, encontrei a fonte mais rica de números de série no Flickr. Suponho que é porque as pessoas costumam fazer upload de imagens em tamanho real (lidas "não editadas"). No meu site ( stolencamerafinder.com ), ofereço um aplicativo java webstart que coleta dados do flickr por meio de sua API. Como existe um limite na taxa em que faço chamadas de API, escrevi para que o trabalho seja compartilhado entre o número de clientes iniciados na Web, reduzindo assim a largura de banda e a CPU nos clientes, mais pessoas o executam. Se você está lendo isso e tem, digamos, acesso de administrador a um servidor no trabalho que não faz muito, por que não deixá-lo em execução;)

Também escrevi um plug-in do Google Chrome que fica atento a imagens em sites com um número de série incorporado. Não espero um rendimento muito alto desse aplicativo. A idéia principal era descobrir quais sites podem ser boas fontes para escrever ferramentas de spidering personalizadas e depois rastreá-las.

Eu publiquei minha API para o stolencamerafinder e estou procurando outros programadores para me ajudar a escrever programas que podem servir como rastreadores da web.

Reuni muitos dados interessantes ao fazer este projeto que colocarei no site em breve, como quais modelos de câmera fazem e não escrevem números de série úteis. A Nikon D50, por exemplo, apenas escreve "D50" como seu número de série!

Eu ficaria extremamente grato por qualquer feedback (bom ou ruim!) Que você possa ter no meu projeto.

-Matt

queimaduras mate
fonte
8
Possivelmente mais útil e comercializável, seria oferecer um serviço para rastrear onde "suas" fotos foram (re) usadas, potencialmente sem licença.
Rowland Shaw
Eu atualizei minha resposta
fbuchinger

Respostas:

6

Eu amo a idéia de um apanhador de ladrões. ;)

Percebi que o DeviantArt.com parece "capturar" todos os metadados EXIF ​​incorporados nas imagens carregadas. Ele não mostra tudo, no entanto, existem algumas partes do site (muitas delas apenas para membros pagantes) que mostram informações mais detalhadas sobre uma imagem carregada, e eu vi dados completos das tags listados.

Eu acho que, tecnicamente falando, se você pudesse fazer algo semelhante ao TinEye.com (Reverse Image Search) que indexa imagens e pesquisas por similaridade de conteúdo. O TinEye é útil, pois combina imagens por conteúdo, mas tem suas limitações. As manipulações de fotos criadas com fotos com direitos autorais de alguém são difíceis de identificar. A pesquisa por número de série forneceria uma abordagem alternativa e complementar.

Tecnicamente, você pode obter quaisquer dados exif incorporados nas imagens enviadas para a Internet. Se o número de série da câmera estiver incorporado, você terá o que está procurando. Você precisaria raspar uma cópia de cada imagem dos sites indexados, extrair qualquer EXIF ​​(ou outro dado de tag) das imagens indexadas e rastrear as informações com um link para a fonte. Provavelmente, você também pode usar os principais mecanismos de pesquisa como Bing e Google para encontrar imagens para indexar (pesquisas básicas de imagens de palavras-chave, como nomes de fotógrafo, locais etc. podem ser suficientes.) Você provavelmente não precisaria manter a imagem por perto (e isso pode envolver questões legais de qualquer maneira), mas pelo menos você teria um índice de dados de tags EXIF ​​/ IPTC, possivelmente um número de série e um link de origem.

jrista
fonte
11
Um problema é que, se a foto for manipulada de alguma forma, o EXIF ​​provavelmente será removido ou reduzido. A disponibilidade de dados EXIF ​​em um site de compartilhamento de fotos e pesquisas gerais de imagens depende inteiramente do meta-conteúdo da imagem carregada. No entanto, procurar a possibilidade de meta que possa ser usada para pesquisar em câmeras roubadas é uma boa ideia.
nik
@nik: É verdade que você estaria à mercê de tudo o que é carregado ... É uma pena que os fluxos de trabalho na maioria das ferramentas, como Photoshop, Lightroom, etc. não preservem os dados das tags em salvamentos e modificações.
jrista
Obrigado por apontar tineye. São até 1,6 bilhões de imagens, fazendo com que meus 0,3 milhões pareçam um lixo! Mas se eles podem fazê-lo, eu também posso! Vou começar a trabalhar em escrever um rastreador web mais genérico à aranha todos os sites ...
Matt queima
@matt: É verdade que eles têm 1,6 bilhão, mas não pesquisam pelo número de série. Se você pudesse pesquisar por conteúdo e número de série, teria uma vantagem neles. ; P
jrista
Observe que em muitos sites você não pode acessar o arquivo original, a menos que tenha algum status de associação ou conexão com o usuário que o enviou. Portanto, você poderá baixar apenas uma versão reduzida que, na maioria das vezes, possui EXIF ​​distribuído. Às vezes, as ferramentas de upload também fazem isso, enviando o arquivo apenas com informações de direitos autorais. Subnote: o Facebook retira tudo isso, até os direitos autorais do EXIF ​​e recebeu muito calor dos fotógrafos por isso.
Itai
6

ATUALIZAR:

Obrigado pela atualização do status do projeto! Antes de mais, a abordagem com o aplicativo webstart java é interessante - você usa chaves api diferentes do flickr para cada instância de webstart ou o flickr limita os pedidos da api com base em uma combinação de chave / endereço IP da api?

Executei seu aplicativo de início na web e ele produziu 0 número de série depois de digitalizar 50 fotos. Eu não olhei para o seu código-fonte, mas você deve estar ciente de que apenas uma minoria minúscula de câmeras (principalmente dslrs) gravam números de série nos metadados exif.

Eu recomendo baixar as imagens de amostra do Meta Information Repository de Phil Harvey e executar o exiftool nele para ver quais modelos realmente produzem números de série. Você pode restringir a pesquisa de aplicativos de webstart a esses modelos e, assim, melhorar muito a taxa de sucesso.


Eu me deparei com sua pergunta quando comecei a explorar o photo.stackexchange.com.

Há 2 anos, tive uma idéia muito semelhante ao stolencamerafinder e comecei a implementá-lo em python. No entanto, eu parei devido a várias razões:

  • A maioria dos números de série da câmera armazenados nos dados EXIF ​​são editáveis ​​e, portanto, acessíveis (pelo menos com exiftool) -> risco de alertas falsos ou "spam de número de série" (pelo menos quando o serviço começa a ficar popular)

  • A maioria das pessoas usa carregadores de imagens que redimensionam suas imagens e, com isso, geralmente descartam todas ou muitas partes dos dados EXIF ​​(lembre-se de que o número de série sempre é armazenado em algumas notas exif proprietárias que geralmente são descartadas durante conversões de imagens) -> baixa proporção de imagens inspecionadas : números de série extraídos.

no entanto, estou curioso para saber como o seu projeto se desenvolveu ... você poderia dar um breve resumo do status?

fbuchinger
fonte
Oi. Acabei de adicionar uma atualização na pergunta principal acima. Se você tiver alguma dúvida / sugestão, eu adoraria ouvi-las. -Matt
matt burns
Uso apenas uma chave de API, mas cada instância do webstart se comunica através do site para balancear a carga de trabalho para que a cota não seja excedida.
mate queima
Estou preocupado por que o aplicativo de webstart não funcionou para você. Ele deve encontrar seriados em cerca de 1/4 de todas as fotos digitalizadas. Há alguma mensagem nos logs do console java? Fiz o download dessas imagens de amostra um pouco atrás e escrevi um script python para gerar algumas estatísticas. Vou publicá-las online assim que outras pessoas acharem interessante.
mate queima
6

Como minha primeira resposta é mais focada em detalhes técnicos, decidi abrir uma segunda resposta para fornecer uma visão geral da minha idéia original de "camerafinder" apelidada de "CATT" (Camera Anti Theft Tool). Sinta-se livre para usar minhas idéias, mas por favor me credite proberly ...

Ao contrário do sensor de estol, o CATT trabalha opt-in-base. Como proprietário de uma câmera, você se inscreve no site CATT, cria um perfil de usuário e depois registra suas câmeras.

Para isso, é necessário tirar uma foto de algum QRCode gerado aleatoriamente exibido na tela. Em seguida, você carrega a foto não modificada no site do CATT. Quando o upload é concluído, o servidor lê os metadados da foto e verifica o número de série incorporado. Ele também tenta decodificar o QRCode da imagem e o compara com um hash armazenado. Isso evita que alguém possa registrar sua câmera apenas carregando uma foto arbitrária tirada com essa câmera.

Quando sua câmera é roubada, você efetua login no site da CATT e marca esse dispositivo como roubado. Para rastrear as câmeras roubadas, planejamos um analisador de número de série exif do lado do cliente em javascript como script mozilla greasemonkey (semelhante à sua extensão do Chrome). Ele deve ser executado apenas em páginas do flickr que contenham imagens originais (graças ao suporte ao padrão de URL da greasemonkey) para não desacelerar muito o navegador. O script entraria em contato com o servidor CATT regularmente para buscar uma lista de seriais de câmeras roubadas. Se a série da imagem exibida no momento mostrar uma correspondência, ela exibirá um alerta.

Vi que sua extensão do Chrome segue uma abordagem semelhante (embora pareça coletar apenas os seriados). No seu caso, eu usaria a extensão com o W3C File Api (atualmente Firefox e Chrome), para que o usuário também possa inspecionar fotos armazenadas localmente e não apenas aquelas incorporadas em páginas da web. Isso certamente aumentará sua "colheita de número de série", porque nenhum "homem do meio" (flickr facebook etc.) removerá os dados exif.

Aqui está uma demonstração interessante da Mozilla sobre Exif Extraction com a API de arquivos W3C .

fbuchinger
fonte
Muito obrigado por isso, ótimas informações e idéias. O QRCode é v. Inteligente. Não sei se entendi como a API do arquivo é útil para mim da maneira que você menciona (quem permitiria o acesso a arquivos locais e teria imagens de uma câmera roubada), mas é exatamente o que estou procurando escrever uma simples ferramenta de extração serial para a página inicial do meu site. Em vez de "Digite seu número de série", posso permitir que as pessoas pesquisem com uma imagem que já possuem (isso também evita erros). Outra vantagem é que às vezes tenho que usar o número de série interno como um ID, não o da caixa da câmera.
mate queima
Aliás, essa página de demonstração só funcionou para mim no Firefox, não no Chrome. Também estou começando a pensar que esta página não é ideal para discutir tudo isso, mas servirá por enquanto! ps. Estou viajando pela Ásia no momento, então não se ofenda se eu demorar alguns dias (/ semanas) para responder, seus comentários foram muito úteis para mim, obrigado.
mate queima
a demonstração do exif reader funciona no chrome> 5, o erro é causado por uma função de registro não essencial (verifique no console do chrome e redefina-o como func vazio). Feliz viagem!
Fbuchinger
Sobre o caso de uso de arquivo local: acho que queremos dizer a mesma coisa - uma extração serial js cam para arquivos locais que faz parte do site do stolencamerafinder, não necessariamente da extensão. Pode ser usado para determinar o status da câmera com base em alguma foto de amostra (por exemplo, tirada durante a compra de uma câmera usada para garantir que ela não foi roubada de outra pessoa). BTW: você estendeu o analisador Exif de Jacob Seidelin por conta própria ou a extração do número de série foi obra dele?
Fbuchinger 17/02
Eu mesmo estendi o analisador, mas só consegui ler as seções de makernote da Canon e Panasonic até agora. (meu conhecimento do formato IFD é ruim, na melhor das hipóteses). Eu preciso dar-lhe o devido crédito por seu trabalho no meu site, pois é principalmente o trabalho dele. Quando estiver satisfeito com minhas edições, enviarei de volta a ele como uma possível melhoria / versão alternativa.
matt burns