Valor esperado de uma variável aleatória gaussiana transformada com uma função logística

10

Tanto a função logística quanto o desvio padrão são geralmente indicados como . Vou usar e para o desvio padrão.σσ(x)=1/(1+exp(x))s

Eu tenho um neurônio logístico com uma entrada aleatória cuja média e desvio padrão eu conheço. Espero que a diferença da média possa ser bem aproximada por algum ruído gaussiano. Portanto, com um leve abuso de notação, assuma que produz . Qual é o valor esperado de ? O desvio padrão pode ser grande ou pequeno em comparação com ou . Uma boa aproximação de forma fechada para o valor esperado seria quase tão boa quanto uma solução de forma fechada.μsσ(μ+N(0,s2))=σ(N(μ,s2))σ(N(μ,s2))sμ1

Eu não acho que exista uma solução de formulário fechado. Isso pode ser visto como uma convolução, e a função característica da densidade logística é conhecida ( ), mas não tenho certeza de quanto isso ajuda. A calculadora simbólica inversa não conseguiu reconhecer a densidade em da convolução da densidade da distribuição logística e uma distribuição normal padrão, o que sugere, mas não prova que não há integral elementar simples. Evidência mais circunstancial: em alguns trabalhos sobre a adição de ruído de entrada gaussiano a redes neurais com neurônios logísticos, os trabalhos também não forneceram expressões fechadas.0πt csch πt0

Essa questão surgiu ao tentar entender o erro na aproximação do campo médio nas máquinas Boltzman.

Douglas Zare
fonte

Respostas:

5

A seguir, o que acabei usando:

Escreva que . Podemos usar uma expansão da série Taylor.X N ( 0 , s 2 )σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

Existem questões de convergência. A função logística possui um polo onde , então em , ímpar. Divergência não é a mesma coisa que o prefixo é inútil, mas essa aproximação de série pode não ser confiável quando é significativo.exp(x)=1x=kπikP(|X|>μ2+π2)

Como , podemos escrever derivadas de como polinômios em . Por exemplo, e . Os coeficientes estão relacionados ao OEIS A028246 .σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4

Douglas Zare
fonte
4

O que você tem aqui é uma variável aleatória que segue uma distribuição logit-normal (ou logistic-normal) (consulte a Wikipedia ), ou seja, . Os momentos da distribuição logit-normal não têm soluções analíticas.logit[x]N(μ,s2)

Mas é claro que se pode obtê-los via integração numérica. Se você usa R, existe o pacote logitnorm que possui tudo o que você precisa. Um exemplo:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

Isso produz:

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

Portanto, existe até uma função de conveniência que fornecerá diretamente a média e a variação.

Wolfgang
fonte