É aceitável fazer upload de conteúdo ofensivo no GitHub? [fechadas]

12

Desenvolvi um verificador de conteúdo ofensivo para o meu site e quero publicá-lo no GitHub . No entanto, o código fonte contém muitos conteúdos ofensivos, racistas e desagradáveis.

A fonte está totalmente documentada, mas eu queria sua opinião sobre se é aceitável publicar esse trabalho no GitHub ou se deve deixar o conjunto de strings à imaginação do leitor ?!

SimonGoldstone.com
fonte
11
A questão-chave é provavelmente "é realmente ofensiva? Ou é apenas um 'dictonário'?" que entra no Github TOS - §7 sugere que eles podem (mas não têm a obrigação de) removê-lo. Você pode querer extrair as seqüências de caracteres para outro arquivo, que é então rot13 criptografado ou algo dessa natureza para evitar ofender o navegador causal.
1
Eu acho que está tudo bem, apenas avise possíveis leitores no Leia-me, há muitas palavras ofensivas em outros repositórios do GitHub. Além disso, seu caso é de boa fé.
jacktrades
5
Por que não colocar todas as palavras em um arquivo de texto ou banco de dados e carregá-las em tempo de execução. Em seguida, coloque um pequeno aviso legal na cabeça do arquivo, de que o texto abaixo não é para os fracos de coração. Seu código está limpo e você pode usar arquivos de texto diferentes para diferentes situações?
Ampt
@ Esparticus obrigado pelo seu comentário. Eu concordo e acho que essa é provavelmente a melhor abordagem para mim.
SimonGoldstone.com
5
Uma palavra por si só não é ofensiva. A intenção por trás disso torna ofensivo.
kaptan

Respostas:

45

Eu tenho que discordar da solução ROT-13. Ofuscar suas palavras proibidas simplesmente porque a visão delas pode ofender alguém é uma perda de tempo.

Seu dicionário de palavrões / regras de palavrões deve vir de um arquivo separado de qualquer maneira (que pode ser carregado em tempo de execução ou incorporado como um recurso) . Ocultação desse arquivo simplesmente torna mais difícil para você / outros desenvolvedores / usuários alterá-lo ou corrigir qualquer problema. Além disso, se eu visse um arquivo chamado "banned_words.txt" no meu disco rígido, esperaria que ele contivesse uma lista de palavras ofensivas.

BlueRaja - Danny Pflughoeft
fonte
Concordo. Não quero ofuscar as palavras.
SimonGoldstone.com
5
+1 @simon Essas listas já aparecem: github.com/snipe/banbuilder
dcaswell 18/10/13
2
@ Simon Não quis dizer que seu projeto não valia a pena, apenas que o github permite que as pessoas armazenem listas como você deseja. A outra resposta não tem um sim ou não, eu só queria confirmar para você que a resposta era realmente Sim.
dcaswell
1
"re-inventar a roda" faz parte da aprendizagem ... é a maior parte do que é ensinado na faculdade.
WernerCD 18/10/2013
2
Às vezes, você encontra pessoas com ... como diremos ... sensibilidades delicadas que podem ter alguma influência, quer a distribuição do programa continue ou não. Se rotear o arquivo significa que ele permanece, isso ajuda o OP a atingir seu objetivo de ter seu código ativado e permanecer no GitHub. Isso não é perda de tempo no meu livro.
Blrfl
16

"Todos os problemas em ciência da computação podem ser resolvidos por outro nível de indireção". ( de David Wheeler ).

Suas opções não se limitam a carregá-lo ou não, se você levar em conta que pode codificar o conteúdo para que ele não incomode os leitores.

  • Como exemplo, simplesmente mudar para a próxima letra (A para B, B para C, etc., com Z mudando para A para completar a codificação) pode transformar palavras famosas de quatro letras em Gvdl totalmente inofensivo . Tudo o que você precisa para usá-lo em seu aplicativo é movê-lo de volta na direção oposta, para as letras anteriores , com A mudando para Z.

Como apontado nos comentários , uma abordagem como a acima é usada na cifra de substituição de letras do ROT13 , conhecida por seu uso "como um meio de ocultar ... materiais ofensivos de uma olhada casual ..."

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Por uma questão de integridade, considere executar adicionalmente seu verificador em um dicionário codificado , para garantir que a codificação escolhida não acidentalmente transforme uma palavra ofensiva em outra.

Ao codificar coisas assim, faz sentido checar novamente, porque não se pode prever com segurança as coisas. Em um dos meus projetos anteriores, tivemos uma falta de correio bastante grave quando um verificador mal configurado começou a descobrir conteúdo ofensivo em seqüências aleatórias de caracteres (no conteúdo codificado nos arquivos ZIP).


Comparada com a transmissão de texto sem formatação, a codificação Gvdl s tem um benefício substancial de evitar completamente questões legais e todos os riscos e dependências envolvidos .

Apenas pense nisso. Digamos, termos de serviço específicos em um repositório específico permitem meu conteúdo, tudo bem.

Mas, e se eles decidirem mudar os Termos de Serviço ? Ou, se eu decidir mudar para outro repositório, com termos incompatíveis. O que eu vou fazer?

Observe que, mesmo estando em um repositório "amigável", aqui e agora, ainda não é totalmente seguro.

E se alguém não conseguir fazer o download do meu conteúdo por causa de um filtro da web estranho ? Estou disposto a responder às reclamações dos usuários e explicar como corrigir o filtro? O filtro deles ...

... Veja bem, prefiro pensar duas vezes antes de decidir contra a codificação. E mesmo que eu decida, me certifico de ter uma razão muito, muito boa para isso.

mosquito
fonte
6
Rot13 é uma espécie de padrão de fato para isso. O rot13 duplo é ainda melhor. :-)
Blrfl
5
@Blrfl assim como o DES triplo é melhor que o DES, o rot13 triplo é o caminho a percorrer.
1
Eu acho que existem plugins para muitos editores que fazem a edição de arquivos ROT13 mais difícil do que a edição de qualquer outro arquivo que esteja em um formato especializado
JoelFan
2
@ Simon não é tanto que rot13 seja obscurecimento - mas apenas uma maneira padrão de esconder trivialmente o texto. Perceba que alguns firewalls podem ser configurados para bloquear determinados padrões de caracteres, dificultando o acesso ao texto para a funcionalidade do programa. Não é a ofensiva que é o problema provável, mas os outros obstáculos tecnológicos que podem não perceber a diferença entre "algo que você deseja baixar" e "algo que você deseja bloquear". Sim, eles podem obter o zip, mas não poderão clonar, bifurcar ou empurrar.
2
@ThomasEding Caesar muda a cifra por uma letra. O primeiro caractere é originalmente um 'F'.