Estou lendo um livro que apresenta a distribuição Dirchilet e, em seguida, apresentei números sobre ela. Mas eu realmente não era capaz de entender esses números. Anexei a figura aqui na parte inferior. O que não entendo são os significados dos triângulos.
Normalmente, quando se deseja plotar uma função de 2 variáveis, você pega o valor de var1 e va2 e depois plota o valor do valor da função dessas duas variáveis ... o que fornece uma visualização em uma dimensão 3D. Mas aqui existem 3 dimensões e um outro valor para o valor da função, para que ele faça uma visualização no espaço 4D. Eu não consigo entender esses números!
Espero que alguém possa esclarecê-los, por favor!
EDITAR: aqui está o que eu não entendo da figura 2.14a. Por isso, extraímos de K = 3 um exemplo de theta (que é basicamente um vetor) que é: theta = [theta1, theta2, theta3]. O triângulo é plotado [theta1, theta2, theta3]. A distância da origem a cada theta_i é o valor de theta_i. Então, para cada theta_i, colocou um vértice e conectou todas as três vertentes e fez um triângulo. Eu sei que se eu conectar [theta1, theta2, theta3] em dir (theta | a), obterá um número que é a probabilidade conjunta do vetor teta. Também entendo que a probabilidade de variáveis aleatórias contínuas é uma medida de uma área. Mas aqui temos três dimensões, de modo que a probabilidade conjunta será a medida do volume do espaço a partir do plano rosa e sob ... isto é, a pirâmide. Agora eu não entendo qual é o papel do triângulo aqui.
Respostas:
Todos os pontos no triângulo devem satisfazer as duas restrições: entre zero e um em cada dimensão ( ) e todos somam um ( ).θ 0 + θ 1 + θ 2 = 10 ≤ θ ≤ 1 θ0 0+ θ1 1+ θ2= 1
A maneira como finalmente entendi é a seguinte:
Então (a) mostra um espaço 3D com como coordenadas. Eles variam apenas entre 0 e 1.θ1 , 2 , 3
Em (b), um triângulo é mostrado, este é o nosso simplex.
(c) mostra dois exemplos de pontos que "ficam" no simplex, que também atendem ao segundo critério (soma de um).
(d) mostra outro exemplo de ponto no simplex, as mesmas restrições são válidas
Em (e), tentei mostrar uma projeção do simplex em um triângulo 2D com todos os exemplos de pontos mostrados antes.
Espero que faça mais sentido agora :)
fonte
O gráfico 2.14 (a) mostra um plano feito por três vértices em cada eixo. A distância de um vértice da origem é , correspondente a uma das classes . A região delimitada pelo plano rosa e pelos planos dos eixos é probabilidade de (vetor) k = 3 θθi k=3 θ . Agora, suponha que você incline esse plano para ter uma pirâmide com o plano rosa, a face mais próxima do leitor, posicionada na página. Em seguida, suprima a terceira dimensão "saindo" da página e, em vez disso, pinte o triângulo para que a região de maior densidade, com uma distância maior da base à superfície, fique mais vermelha. É o que mostram os gráficos 2.14 (b) e 2.14 (c). Quanto mais o vermelho estiver concentrado perto de um vértice, mais provável será a classe associada a esse vértice. Da mesma forma, se a região vermelha não estiver muito próxima de nenhum vértice, não é provável que um evento tenha maior probabilidade de pertencer a qualquer uma das classes.
Essa pirâmide, no entanto, só faz sentido como uma realização única da distribuição de Dirichlet. Desenhar novamente a partir da mesma distribuição pode gerar uma pirâmide diferente com diferentes comprimentos para cada um dos vértices. A principal diferença entre (a) e (b) / (c) é que (a) exibe graficamente a probabilidade de um empate do vetor . Os gráficos (b) e (c) mostram a densidade de probabilidade para valores no simplex, ou seja, eles estão tentando apresentar a função de densidade de probabilidade para todos os valoresθ θ k = 3 θ θ ∼ Dir ( α )θ θ θ k=3 θ no suporte. Uma maneira de pensar em (b) e (c) é como um ponto com uma cor vermelha adicional de acordo com a altura média entre o plano rosa plano e a superfície da pirâmide, calculada a média de muitos desenhos de .θ∼Dir(α)
fonte