Desenvolvi um verificador de conteúdo ofensivo para o meu site e quero publicá-lo no GitHub . No entanto, o código fonte contém muitos conteúdos ofensivos, racistas e desagradáveis.
A fonte está totalmente documentada, mas eu queria sua opinião sobre se é aceitável publicar esse trabalho no GitHub ou se deve deixar o conjunto de strings à imaginação do leitor ?!
Respostas:
Eu tenho que discordar da solução ROT-13. Ofuscar suas palavras proibidas simplesmente porque a visão delas pode ofender alguém é uma perda de tempo.
Seu dicionário de palavrões / regras de palavrões deve vir de um arquivo separado de qualquer maneira (que pode ser carregado em tempo de execução ou incorporado como um recurso) . Ocultação desse arquivo simplesmente torna mais difícil para você / outros desenvolvedores / usuários alterá-lo ou corrigir qualquer problema. Além disso, se eu visse um arquivo chamado "banned_words.txt" no meu disco rígido, esperaria que ele contivesse uma lista de palavras ofensivas.
fonte
"Todos os problemas em ciência da computação podem ser resolvidos por outro nível de indireção". ( de David Wheeler ).
Suas opções não se limitam a carregá-lo ou não, se você levar em conta que pode codificar o conteúdo para que ele não incomode os leitores.
Como apontado nos comentários , uma abordagem como a acima é usada na cifra de substituição de letras do ROT13 , conhecida por seu uso "como um meio de ocultar ... materiais ofensivos de uma olhada casual ..."
Por uma questão de integridade, considere executar adicionalmente seu verificador em um dicionário codificado , para garantir que a codificação escolhida não acidentalmente transforme uma palavra ofensiva em outra.
Ao codificar coisas assim, faz sentido checar novamente, porque não se pode prever com segurança as coisas. Em um dos meus projetos anteriores, tivemos uma falta de correio bastante grave quando um verificador mal configurado começou a descobrir conteúdo ofensivo em seqüências aleatórias de caracteres (no conteúdo codificado nos arquivos ZIP).
Comparada com a transmissão de texto sem formatação, a codificação Gvdl s tem um benefício substancial de evitar completamente questões legais e todos os riscos e dependências envolvidos .
Apenas pense nisso. Digamos, termos de serviço específicos em um repositório específico permitem meu conteúdo, tudo bem.
Mas, e se eles decidirem mudar os Termos de Serviço ? Ou, se eu decidir mudar para outro repositório, com termos incompatíveis. O que eu vou fazer?
Observe que, mesmo estando em um repositório "amigável", aqui e agora, ainda não é totalmente seguro.
E se alguém não conseguir fazer o download do meu conteúdo por causa de um filtro da web estranho ? Estou disposto a responder às reclamações dos usuários e explicar como corrigir o filtro? O filtro deles ...
... Veja bem, prefiro pensar duas vezes antes de decidir contra a codificação. E mesmo que eu decida, me certifico de ter uma razão muito, muito boa para isso.
fonte