Atualmente, estou escrevendo um algoritmo para privacidade diferencial usando o mecanismo de Laplace.
Infelizmente, não tenho formação em estatística; portanto, muitos termos são desconhecidos para mim. Então agora estou tropeçando no termo: ruído de Laplace . Para tornar um diferencial de conjunto de dados privado, todos os trabalhos apenas falam sobre a adição de ruído de Laplace de acordo com a distribuição de Laplace aos valores da função.
(k é o valor privado diferencial, f o valor retornado pela função de avaliação e Y o ruído de Laplace)
Isso significa que eu criei variáveis aleatórias a partir da distribuição Laplace, de acordo com essa função que tenho na wikipedia https://en.wikipedia.org/wiki/Laplace_distribution ?
UPDATE: plotei até 100 variáveis aleatórias extraídas da função acima, mas isso não me dá uma distribuição de Laplace (nem mesmo perto). Mas acho que deve modelar uma distribuição de Laplace.
UPDATE2:
Essas são as definições que tenho:
(O mecanismo de Laplace). Dada qualquer função , o mecanismo de Laplace é definido como: onde Y são variáveis aleatórias iid extraídas de
Assim como:
Para gerar Y (X), uma escolha comum é usar uma distribuição de Laplace com média zero e parâmetro de escala Δ (f) / ε
Respostas:
Você está correto, adicionando ruído Laplace significa que, na sua variável você adiciona a variável que segue a distribuição Laplace . Existem várias razões pelas quais é chamado de ruído . Primeiro, pense no processamento do sinal, onde a mensagem é enviada por algum canal e, devido à natureza imperfeita do canal, o sinal recebido é barulhento, então você deve isolar o sinal do ruído. Segundo, na criptografia também falamos sobre ruído pseudo-aleatório e privacidade diferencial está relacionada à criptografia. Terceiro, em estatística e aprendizado de máquina, também podemos falar sobre ruído estatístico ; os modelos estatísticos incluem termos de ruído ou erro, etc. (há até um livro sobre nomes de previsãoYX Y Sinal e o barulho de Nate Silver). Então, usamos ruído como sinônimo mais preciso de aleatoriedade ambígua .
Quanto à geração aleatória, há várias maneiras de desenhar valores aleatórios após a distribuição Laplace, por exemplo:
Nas plotagens abaixo, você pode ver a distribuição de amostras desenhadas usando cada uma das funções que acompanham a densidade de Laplace (linha vermelha).105
Para simplificar os exemplos, eu uso a distribuição padrão de Laplace com scale = 1, mas você pode alterar facilmente os resultados multiplicando os resultados usando diferentes fatores de escala.
fonte
A distribuição Laplace ou dupla exponencial cai exponencialmente à esquerda e à direita em torno de alguma média. É basicamente o exponencial espelhado para o outro lado.
Se você deseja a probabilidade, use a probabilidade do exponencial e adicione um abs () ao valor observado. A probabilidade de log é simplesmente o abs () dos resíduos, multiplicado pela taxa do exponencial.
Para provar, o mais fácil é extrair de -1,1 e multiplicar com um extra da distribuição exponencial, disponível na maioria das linguagens de programação. Como alternativa, como observado acima, você também encontrará implementações diretas do Laplace, mas isso pode exigir um pouco mais de pesquisa.
fonte