No reconhecimento de padrões e no aprendizado de máquina de Bishop, li o seguinte, logo após a densidade de probabilidade :
Sob uma mudança não linear da variável, uma densidade de probabilidade se transforma de forma diferente de uma função simples, devido ao fator jacobiano. Por exemplo, se considerarmos uma mudança de variáveis , uma função se tornará . Agora, considere uma densidade de probabilidade que corresponde a uma densidade com relação à variável novo , onde o su fi ces indicar o facto de e são diferentes densidades. Observações que caem no intervalo , para pequenos valores de , serão transformadas no intervalo ) onde e, portanto, p_y .
Qual é o fator jacobiano e o que exatamente tudo significa (talvez qualitativamente)? Bishop diz que uma conseqüência dessa propriedade é que o conceito do máximo de uma densidade de probabilidade depende da escolha da variável. O que isto significa?
Para mim, isso vem do nada (considerando que está no capítulo de introdução). Eu apreciaria algumas dicas, obrigado!
Respostas:
Sugiro que você leia a solução da pergunta 1.4, que fornece uma boa intuição.
Em poucas palavras, se você tem uma função arbitrária e duas variáveis e que são relacionadas uma à outra pela função , é possível encontrar o máximo da função analisando diretamente : ou a função transformada : . Não surpreendentemente, e serão relacionados a cada um como (aqui assumi que .x y x = gf(x) x y f ( x ) x = um r g m um x x ( f ( x ) ) f ( g ( Y ) ) Y = um r g m um x y ( f ( g ( y ) ) x yx=g(y) f(x) x^=argmaxx(f(x)) f(g(y)) y^=argmaxy(f(g(y)) x^ y^ ∀y:g'(y)≠0)x^=g(y^) ∀y:g′(y)≠0)
Este não é o caso das distribuições de probabilidade. Se você possui uma distribuição de probabilidade e duas variáveis aleatórias que são relacionadas entre si por . Então não há relação direta entre e . Isso acontece devido ao fator jacobiano, um fator que mostra como o volume é relativamente alterado por uma função como .x = g ( y ) x = um r g m um x x ( p x ( x ) ) y = um r g m um x y ( p y ( y ) ) g ( . )px(x) x=g(y) x^=argmaxx(px(x)) y^=argmaxy(py(y)) g(.)
fonte