Portanto, essa questão está um pouco envolvida, mas eu tentei meticulosamente torná-la a mais direta possível.
Objetivo: Para encurtar a história, existe uma derivação da negentropia que não envolve cumulantes de ordem superior, e estou tentando entender como ela foi derivada.
Antecedentes: (eu entendo tudo isso)
Estou estudando o livro 'Independent Component Analysis' , encontrado aqui. (Esta questão é da seção 5.6, caso você tenha o livro - 'Aproximação de entropia por funções não polinomiais').
Temos , que é uma variável aleatória e cuja negentropia queremos estimar, a partir de algumas observações que temos. O PDF de é dado por . Negentropia é simplesmente a diferença entre a entropia diferencial de uma variável aleatória gaussiana padronizada e a entropia diferencial de . A entropia diferencial aqui é dada por , de modo que:
e assim, a negentropia é dada por
onde é um rv gaussiano padronizado, com PDF fornecido por ϕ ( ζ ) .
Agora, como parte desse novo método, meu livro derivou uma estimativa do PDF de , dada por:
(Onde . A propósito, i é não uma potência, mas em vez disso um índice).
Por enquanto, eu 'aceito' essa nova fórmula em PDF e perguntarei sobre ela outro dia. Este não é o meu problema principal. O que ele faz agora, porém, é conectar esta versão do PDF de volta à equação negentropy e terminar com:
Lembre-se de que o sigma (aqui e no resto do post) apenas circula o índice . Por exemplo, se tivéssemos apenas duas funções, o sinal retornaria para i = 2 e i = 2 . Claro, eu deveria falar sobre as funções que ele está usando. Então, aparentemente, essas funções F i são definidos como assim:
As funções não são funções polinomiais neste caso. (Supomos que o rv x seja zero médio e variância unitária). Agora, vamos fazer algumas restrições e dar propriedades dessas funções:
Para cálculos Simplifique, vamos fazer outra, suposição puramente técnica: As funções , forme um sistema ortonormal, como tal:
e
Quase lá! OK, então tudo isso era o pano de fundo, e agora a pergunta. A tarefa é, então, simplesmente colocar este novo PDF na fórmula de entropia diferencial, . Se eu entender isso, vou entender o resto. Agora, o livro fornece a derivação (e eu concordo com isso), mas fico preso no final, porque não sei / vejo como está sendo cancelado. Além disso, não sei como interpretar a notação pequena da expansão de Taylor.
Este é o resultado:
Usando a expansão de Taylor , paraH(x)obtemos:
e entao
A questão: (eu não entendo isso)
Então, meu problema: exceto o , não entendo como ele conseguiu os 4 termos finais na última equação. (ou seja, os 0, os 0 e os 2 últimos termos). Eu entendo tudo antes disso. Ele diz que explorou as relações de ortogonalidade dadas nas propriedades acima, mas não vejo como. (Eu também não entendo a notação small-o aqui, no sentido de como ela é usada?)
OBRIGADO!!!!
EDITAR:
Fui em frente e adicionei as imagens do livro que estou lendo, que praticamente diz o que disse acima, mas apenas no caso de alguém precisar de um contexto adicional.
fonte
Respostas:
>> Para obter os termos zero:
PS: Este é um ótimo livro, a propósito. Os trabalhos dos autores sobre o assunto também são muito bons e devem ser lidos se você estiver tentando entender e implementar a ACI.
fonte