Impedir que os mecanismos de pesquisa reversa encontrem a origem da sua imagem?

15

Estou planejando fazer um jogo, onde dou ao usuário uma imagem relacionada ao anime e eles precisam adivinhar de onde é.

No entanto, a maioria das imagens, especialmente de anime popular, é fácil de usar na pesquisa reversa do Google para encontrar e apontar o anime.

Tentei ver se conseguia fazê-lo para não reconhecer a imagem, mas infelizmente meus truques não foram bons o suficiente.

Imagem original:

Imagem original

Escala de cinza com flip horizontal:

Escala de cinza com flip horizontal

Marca d'água:

Marca d'água

Confundindo a imagem com a escala de cinza:

Confundindo a imagem com escala de cinza

A escala de cinza com flip horizontal e vertical funcionou para esta imagem, mas nem sempre funciona:

Escala de cinza com flip horizontal e vertical

Além disso, os métodos acima mencionados são bastante fáceis para as pessoas adivinharem o anime.

Gostaria de saber se existe algum truque bom que eu possa usar nas minhas imagens para que não funcione nos mecanismos de pesquisa reversa e, no entanto, não seja tão complicado que eu possa implementar no meu programa.

Por exemplo, escala de cinza, corte e inversão são coisas bastante fáceis de obter em C #.

Prémio
fonte
3
Eu gosto da idéia de confundir a imagem para aumentar a dificuldade. No entanto, se alguém realmente quer jogar o seu jogo, tenho problemas para ver como a pesquisa reversa do Google será um problema para os jogadores. Os jogadores estão duelando por quem a encontrará primeiro? Eu ficaria mais preocupado em ter os direitos de licenciamento das imagens se você planeja comercializar seu jogo.
curioso
2
@Emilie Sim, existe um sistema de classificação semanal e mensal e apenas a primeira resposta correta conta para receber os pontos dessa imagem específica. Não é um jogo que será vendido , e a imagem original será apontada de volta aos artistas com os devidos direitos. É algo realmente simples que eu gostaria de adicionar ao nosso canal de bate-papo.
Prix
11
O problema é que a pesquisa reversa de imagens deve ser capaz de contornar os danos à imagem ou isso não é muito bom, então sua tecnologia fundamental de combate e você acabará perdendo.
Joojaa
4
Tentar proteger a mídia digital contra pirataria ou qualquer tarefa nesse sentido provavelmente acabará se você não frustrar as pessoas desonestas e arruinar a experiência para seus usuários honestos. Às vezes você tem que fazer uma troca dessas.
GiantCowFilms
11
Pare por aí. Dar crédito não é obter permissão para usar a imagem. É material protegido por direitos autorais. Se o seu jogo enganar uma pesquisa, provavelmente não sobreviverá a uma investigação de violação de propriedade intelectual. Não continue sem obter permissão por escrito dos proprietários dos direitos autorais para o "USO DE SUA PROPRIEDADE INTELECTUAL". Você ficará surpreso ao descobrir que eles permitem a você com base no uso pretendido para um jogo. Não adivinhe. Não espere. Descubra antes de colocar mais esforço em seu milagre.
Stan

Respostas:

9

Acho que você estava no caminho certo com sua opção de marca d'água, mas deixou muito da imagem original intacta. Aqui estão duas imagens que tentei que o Google não conseguiu encontrar:

Tabuleiro de damas

insira a descrição da imagem aqui
Resultados de pesquisa de imagem reversa

mosaico

insira a descrição da imagem aqui
Resultados de pesquisa de imagem reversa

Outro exemplo

insira a descrição da imagem aqui
Resultados de pesquisa de imagem reversa

A primeira imagem retorna muitos resultados de "bandeira quadriculada" e a segunda retorna muitas imagens de mosaico / colagem. Tamanho importa! Inicialmente, tentei com um padrão quadriculado muito menor (16px); O Google ainda conseguiu identificar isso. Esses quadrados de 32px parecem ser um meio feliz.

Com base nas informações fornecidas pelo DanS, acho que essa seria uma técnica confiável para enganar o Google (e facilmente automatizada!). Só posso presumir que alguém que foi capaz de identificar esse anime ainda seria capaz de fazê-lo a partir dessas imagens.


Ironicamente, as imagens que eu criei serão indexadas pelo Google e levarão a este post, derrotando o objetivo!

JohnB
fonte
11
Foi o que acabei fazendo com uma pequena diferença, que não crio mais formas regulares como quadrados, parece funcionar bastante e sim, em algum momento, ela será indexada, mas a essa altura teremos novas imagens os já respondidos não retornam à fila. Obrigado por reservar um tempo.
Prix
2
Ainda mais ironia. Você pode ter dado ao google uma dica sobre o que melhorar.
Joojaa
9

O Google pode usar um sistema diferente, mas um grande número de serviços (incluindo o tineye incluído) usa hashes perceptivos em que o hash geral está próximo o suficiente para ser uma correspondência, em vez de exato.

Um white paper apareceu alguns anos atrás, detalhando o processo. Não consegui encontrar um link para ele, mas o sistema básico depende de uma cadeia de ação para gerar os hashes.

  • Reduza a imagem para uma pequena escala, geralmente 32x32 ou 64x64
  • Converter a imagem em escala de cinza
  • Aumente o contraste para um valor predefinido, para garantir um alto nível de diferença entre os tons preto e branco
  • Calcular o pHash a partir dos pixels na imagem resultante

O processo seria repetido para qualquer imagem carregada e depois cruzado com hashes indexados para encontrar correspondências próximas. Em resumo, a imagem deve ser drasticamente alterada em grandes partes para enganar qualquer sistema como esse.

Vux
fonte
Algumas informações interessantes por lá, gostariam de conferir o artigo.
Prix
2

Basta criar uma imagem negativa do original e invertê-la novamente com css. O usuário verá a imagem normalmente, com a mesma qualidade, mas ao fazer o download, ela é invertida.

.myImageClass {

 filter: invert(100%);

}

A imagem negativa não corresponderá ao original (resultado da pesquisa NL):

Exemplo de pesquisa

Além disso, tentei reduzir as cores para 256, o Paint Shop Pro é o rei em fazer isso. A imagem não corresponderá diretamente ao original. Se você combinar isso com o método acima, pode ser excelente.

Codebeat
fonte
0

Você pode fazer algo assim:

insira a descrição da imagem aqui

Não é 100% à prova de balas, mas deve eliminar a maioria dos mecanismos de identificação de imagem.

O que fiz foi adicionar ruído preto e branco à imagem, além de algum deslocamento. Mexer com as cores, por exemplo. apenas o deslocamento de um ou dois canais de cores seria ainda mais eficaz, mas complexo de implementar.

GiantCowFilms
fonte
11
Vou tentar com algumas imagens populares e ver como vai acabar agora. Desci em um quebra-cabeça fechado onde abro quadrados quando respostas erradas são dadas. Então você vê apenas a imagem a cada X pixels de cada vez que parecia ter funcionado até agora.
Prix
Sim, isso não funciona, a menos que você faça barulho suficiente para tornar toda a imagem irreconhecível, o que derrota o objetivo que tenho. Obrigado.
Prix
4
Exceto a pesquisa fora do curso com essa imagem barulhenta, o Google encontra imediatamente as fontes. O algoritmo provavelmente pesquisa no espaço de Fourier e seu ruído não fará muito por isso.
Joojaa
@joojaa Yah, eu notei isso, mas o Prix pediu que eu mostrasse uma imagem do que eu sugeri como comentário, então eu postei uma resposta.
GiantCowFilms
@GiantCowFilms Lame, esse é exatamente o tipo de filtro que será ignorado pela pesquisa de imagens.
Navin
0

Tente alternar o formato do arquivo em que você está salvando. As pesquisas reversas de imagens começam usando alguns dados que são registrados intrinsecamente na imagem, e é provavelmente por isso que suas técnicas de ofuscação não estão funcionando. Os JPEGs são particularmente ruins quanto a isso, os PNGs nem tanto. Com imagens especialmente populares, isso pode não funcionar, no entanto.

Idealmente, encontre uma maneira de mostrar a imagem em um formulário encapsulado com o qual o usuário não possa interagir diretamente (copiar -> colar). Infelizmente, não tenho os detalhes técnicos de como isso pode ser alcançado atualmente, apenas observando que as imagens usadas no material do Flash / Shockwave possuem essa propriedade.

Secundariamente: o plano como um todo - usando imagens protegidas por direitos autorais sem primeiro procurar permissões apropriadas de seus proprietários, mesmo assumindo que você forneça a atribuição assim que o quebra-cabeça for resolvido - o coloca em risco de uma solicitação de remoção ou outro tipo de ação legal, principalmente se você está executando o jogo em qualquer volume. Se for possível executar o jogo usando fanart (já que é mais provável que você obtenha permissão apropriada para usar fanart do que conteúdo canônico), provavelmente é melhor fazer isso.

Bennie
fonte
Nada disso tem a ver com a pergunta do OP. Acho que estou um pouco atrasado para a festa, mas: o Google não usa dados EXIF ​​e o OP não vai ter problemas legais porque ele é sem fins lucrativos.
Navin
0

Você deve confundir o mecanismo de pesquisa.

A melhor maneira de anular a pesquisa automatizada de imagens é fornecendo imagens alternativas que não podem ser identificadas ou provenientes de fontes conflitantes e que confundem o padrão especificado a ser identificado.

Por exemplo, se você fornecer uma imagem composta por três imagens em faixas ou faixas alternadas e solicitar a identificação da imagem composta apenas de cada terceira banda, para que, se isolado das outras bandas, apareça como uma imagem com lacunas ( onde as bandas das outras imagens se sobrepuseram).

Um cérebro humano invoca "Encerramento" para conectar perceptivamente as imagens relevantes em uma coesa que pode ser identificada. A chave é suficiente identificável, mas detalhes irrelevantes no restante da imagem para confundir o mecanismo.

A segunda pergunta pode estar com a mesma imagem, mas perguntando para cada terceira banda que começa com a segunda. Na verdade, você pode usar uma imagem com três componentes diferentes e, portanto, três respostas diferentes.

As pesquisas automatizadas não podem atacar esse problema espacial, a menos que as bandas não relacionadas sejam fisicamente isoladas da pesquisa. Difícil de fazer.

Stan
fonte
Isso seria muito chato como um usuário de olhar para
Zach Saucier
@ZachSaucier Supõe-se que seja um jogo desafiador e algo para contornar o software cada vez mais inteligente. Não posso comentar sobre outros aspectos. Como isso é muito diferente de um tabuleiro de xadrez na medida em que é irritante?
Stan
-3

Pare por aí. Não copie. Use trabalhos artísticos originais. EDIT: Trate isso como FYI.

Ao copiar, você está tentando indiretamente burlar a proteção à propriedade intelectual. Você está brincando com fogo.

Há também uma falha em sua lógica e raciocínio: dar crédito NÃO é obter permissão para usar a imagem . Não é uma situação "ou". É material protegido por direitos autorais. Não importa se o resultado é colocado à venda ou não. Seu ganho, financeiro ou não, não tem importância para a ofensa. Mesmo se o projeto fosse para pesquisa acadêmica ou científica, você precisaria da permissão, e não do crédito concedido aos proprietários dos direitos autorais.

Se o seu jogo enganar uma pesquisa, provavelmente não sobreviverá a um advogado motivado que realiza uma investigação de violação de propriedade intelectual.

Não continue sem obter permissão por escrito dos proprietários dos direitos autorais para o "USO DE SUA PROPRIEDADE INTELECTUAL".

Você ficará surpreso ao descobrir que eles permitem a você com base no uso pretendido para um jogo. Faça anotações com datas e esboços. Se você descobrir que as pessoas que você abordou adotam seu conceito, processe-as por uma questão de confidencialidade. (Isso envolve um documento legal separado da NDA e provavelmente mais tempo do que vale a pena.)

Não adivinhe. Não espere. Descubra antes de colocar mais esforço em seu milagre. Pode ser mais fácil pedir desculpas do que pedir permissão, mas o caminho é legal, ético e mais gratificante.

Stan
fonte
3
Isso não procura responder à pergunta que está sendo feita. É melhor ser encurtado e transformado em um comentário
Zach Saucier