Informação mútua como probabilidade

11

Poderia a informação mútua sobre a entropia conjunta:

0I(X,Y)H(X,Y)1

ser definido como: "A probabilidade de transmitir uma informação de X para Y"?

Sinto muito por ser tão ingênuo, mas nunca estudei teoria da informação e estou apenas tentando entender alguns conceitos disso.

luca maggi
fonte
1
Bem-vindo ao CV, luca maggi! Que primeira pergunta adorável!
Alexis

Respostas:

8

A medida que você está descrevendo é chamada de Índice de qualidade da informação [IQR] (Wijaya, Sarno e Zulaika, 2017). IQR é uma informação mútua dividida por "incerteza total" (entropia conjunta) (fonte da imagem: Wijaya, Sarno e Zulaika, 2017).I(X,Y)H(X,Y)

insira a descrição da imagem aqui

Conforme descrito por Wijaya, Sarno e Zulaika (2017),

o intervalo de IQR é . O maior valor (IQR = 1) pode ser alcançado se o DWT puder reconstruir perfeitamente um sinal sem perder informações. Caso contrário, o valor mais baixo (IQR = 0) significa que o MWT não é compatível com um sinal original. Em outras palavras, um sinal reconstruído com MWT específico não pode manter informações essenciais e totalmente diferente das características originais do sinal.[0,1]

Você pode interpretá-lo como probabilidade de que o sinal seja perfeitamente reconstruído sem perda de informações . Observe que essa interpretação está mais próxima da interpretação subjetivista da probabilidade e depois da interpretação tradicional e freqüentista.

É uma probabilidade de um evento binário (reconstruir informações versus não), em que IQR = 1 significa que acreditamos que as informações reconstruídas são confiáveis ​​e IQR = 0 significa o contrário. Ele compartilha todas as propriedades para probabilidades de eventos binários. Além disso, as entropias compartilham várias outras propriedades com probabilidades (por exemplo, definição de entropias condicionais, independência etc). Portanto, parece uma probabilidade e grasna.


Wijaya, DR, Sarno, R. e Zulaika, E. (2017). Índice de qualidade da informação como uma nova métrica para a seleção de wavelets mãe. Chemometrics and Intelligent Laboratory Systems, 160, 59-71.

Tim
fonte
1
Como a função IQR é definida para para verificar as propriedades definidoras da medida de probabilidade? Você está introduzindo e com onde é a função característica? I ( X ' , Y ' ) H ( X ' , Y ' ) X ' : = X I ( A ) ,AΩI(X,Y)H(X,Y)IX:=XI(A),Y:=YI(A)I
Hans
Bem, minha pergunta é direcionada para uma parte da sua resposta e não para uma pergunta independente. Você está sugerindo que eu abro uma nova pergunta, vinculo e direciono para sua resposta?
Hans
@ Hans O que eu disse é que essa medida se encaixa facilmente na definição, me corrija se eu estiver errado. Os axiomas 1. e 2. são óbvios. Para o axioma 3., é a sobreposição, H ( X , Y ) é o espaço total; portanto, a fração pode ser facilmente vista como probabilidade. I(X,Y)H(X,Y)
Tim
1
Uma probabilidade é definida em um espaço de amostra e seu campo sigma . Estou confuso sobre o que são esses para esta medida de probabilidade IQR. Já existe um espaço de amostra e o seu campo de sigma para a medida de probabilidade definidos para as variáveis aleatórias X e Y . O espaço e o campo da amostra da nova medida de probabilidade IQR são os mesmos da medida de probabilidade antiga associada a X e Y ? Caso contrário, como eles são definidos? Ou você está dizendo que isso não precisa ser definido? Como, então, você confere os axiomas? (Ω,F)XYXY
Hans
@ Hans, afirmei explicitamente que isso é consistente com axiomas, mas é difícil dizer a probabilidade do que exatamente isso seria. A interpretação que sugeri é provavelmente de reconstruir o sinal. Esta não é uma distribuição de probabilidade de X ou Y. Acho que você poderia aprofundar a interpretação e a compreensão. A questão era se isso poderia ser interpretado como probabilidade e a resposta era formalmente sim.
Tim
2

Aqui está a definição de um espaço de probabilidade. Vamos usar as anotações lá. IQR é uma função de uma tupla (Ω,F,P,X,Y) (Os três primeiros componentes formam o espaço de probabilidade em que as duas variáveis ​​aleatórias são definidas). Uma medida de probabilidade deve ser uma função definida que satisfaça todas as condições da definição listada na resposta de Tim. Será necessário especificar Θ:=(Ω,F,P,X,Y) como algum subconjunto de um conjunto Ω~ . Além disso, o conjunto de Θdeve formar um campo de subconjuntos de Ω~ , e que o IQR(Ω,F,P,X,Y) deve satisfazer todas as três propriedades listadas na definição de medida de probabilidade listada na resposta de Tim. Até que alguém construa esse objeto, é errado dizer que o IQR é uma medida de probabilidade. Eu, pelo menos não vejo a utilidade de uma medida de probabilidade tão complicada (não a função IQR em si, mas como uma medida de probabilidade). O IQR no artigo citado na resposta de Tim não é chamado ou usado como probabilidade, mas como métrica (o primeiro é um tipo do último, mas o último não é um tipo do primeiro).

[0,1]ΘΩ~:={a,b}F~:=2Ω~P~(a):=IQR(Θ)Θ

Hans
fonte
(xi,yi)
Θ:=(Ω,F,P,X,Y)
Esse também é o caso se você usar uma rede neural complicada com a função de ativação sigmóide no final, você pode provar que a saída é probabilidade em termos teórico-métricos? No entanto, geralmente escolhemos interpretar isso como probabilidade.
Tim
[0,1]AP(A):=μ(f(A))μRf
Desculpe, mas nunca achei esse tipo de discussão e teoria da medida interessante, então vou me afastar da discussão adicional. Também não entendo sua opinião aqui, especialmente porque seu último parágrafo parece dizer exatamente a mesma coisa que eu estava dizendo desde o início.
Tim