Reproduzir plotagem de projeção de análise discriminante linear

9

Estou lutando com pontos de projeção na análise discriminante linear (LDA). Muitos livros sobre métodos estatísticos multivariados ilustram a idéia do LDA com a figura abaixo.

figura 1

A descrição do problema é a seguinte. Primeiro, precisamos traçar o limite da decisão, adicionar uma linha perpendicular e, em seguida, plotar as projeções dos pontos de dados. Gostaria de saber como adicionar pontos de projeção à linha perpendicular.

Alguma sugestão / sugestões?

Andrej
fonte
2
Embora no caso de duas classes seja possível desenhar primeiro o boudary de decisão e o eixo discriminante em segundo, a lógica real do LDA é oposta. Você primeiro precisa desenhar a (s) linha (s) discriminante (s). Veja uma pergunta (+ links importantes nos comentários) como desenhar discriminantes. E sobre limites: 1 , 2 .
ttnphns
1
Andrej. Extraia os vetores próprios. Sabemos que os valores dos discriminantes (escores discriminantes) dependem deles. O ponto principal agora é que, como você deseja mostrar pontuações discriminantes no espaço das variáveis ​​originais (centralizadas), é necessário conceituar os discriminantes como as variáveis ​​originais giradas nesse espaço (exatamente como conceituamos os componentes principais). Rotação é a multiplicação do original centrada dados por uma matriz de rotação ...
ttnphns
1
(Cont.) A matriz de quais colunas são os vetores próprios pode ser vista como uma matriz de rotação se a soma dos quadrados de cada coluna (por exemplo, cada vetor próprio) for normalizada por unidade. Portanto, normalize os autovetores e calcule as pontuações dos componentes como dados centralizados multiplicados por esses autovetores.
precisa saber é o seguinte
1
(Cont.) O que resta é mostrar os eixos dos discriminantes como linhas retas lado a lado com pontos que representam as pontuações discriminantes. Portanto, para plotar a linha lado a lado, precisamos encontrar as coordenadas de cada ponto lado a lado nos eixos originais (as variáveis). As coordenadas são fáceis de calcular: cada coordenada é o cateto, o escore discriminante é o hipotenus e o cos do ângulo entre eles é o elemento correspondente da matriz do vetor próprio: catet = hipótese * cos.
ttnphns
1
Andrei, de modo que o eixo discriminante (o na qual os pontos são projectados na sua Figura 1) é dada pelo primeiro vector próprio da . No caso de apenas duas classes, esse vetor próprio é igual a , onde são centróides de classe. Normalize esse vetor (ou o vetor próprio obtido) para obter o vetor do eixo unitário . Isso é suficiente para desenhar o eixo. Para projetar os pontos (centralizados) nesse eixo, basta calcular . Aqui é um projetor linear para . Parece que você está quase lá, então talvez você possa editar sua postagem para explicar exatamente onde está. W - 1 ( m 1 - m 2 ) m i v X v v v v vW1BW1(m1m2)mivXvvvvv
Ameba

Respostas:

6

O eixo discriminante (aquele no qual os pontos são projetados em sua Figura 1) é dado pelo primeiro vetor próprio . No caso de apenas duas classes, esse vetor próprio é proporcional a , onde são centróides de classe. Normalize esse vetor (ou o vetor próprio obtido) para obter o vetor do eixo unitário . Isso é suficiente para desenhar o eixo.W - 1 ( m 1 - m 2 ) m i vW1BW1(m1m2)miv

Para projetar os pontos (centralizados) nesse eixo, basta calcular . Aqui é um projetor linear para .v vvXvvvvv

Aqui está a amostra de dados da sua caixa de depósito e a projeção do LDA:

Projeção LDA

Aqui está o código MATLAB para produzir esta figura (conforme solicitado):

% # data taken from your example
X = [-0.9437    -0.0433; -2.4165    -0.5211; -2.0249    -1.0120; ...
    -3.7482 0.2826; -3.3314 0.1653; -3.1927 0.0043; -2.2233 -0.8607; ...
    -3.1965 0.7736; -2.5039 0.2960; -4.4509 -0.3555];
G = [1 1 1 1 1 2 2 2 2 2];

% # overall mean
mu = mean(X);

% # loop over groups
for g=1:max(G)
    mus(g,:) = mean(X(G==g,:)); % # class means
    Ng(g) = length(find(G==g)); % # number of points per group
end

Sw = zeros(size(X,2)); % # within-class scatter matrix
Sb = zeros(size(X,2)); % # between-class scatter matrix
for g=1:max(G)
    Xg = bsxfun(@minus, X(G==g,:), mus(g,:)); % # centred group data
    Sw = Sw + transpose(Xg)*Xg;
    Sb = Sb + Ng(g)*(transpose(mus(g,:) - mu)*(mus(g,:) - mu));
end

St = transpose(bsxfun(@minus,X,mu)) * bsxfun(@minus,X,mu); % # total scatter matrix
assert(sum(sum((St-Sw-Sb).^2)) < 1e-10, 'Error: Sw + Sb ~= St')

% # LDA
[U,S] = eig(Sw\Sb);

% # projecting data points onto the first discriminant axis
Xcentred = bsxfun(@minus, X, mu);
Xprojected = Xcentred * U(:,1)*transpose(U(:,1));
Xprojected = bsxfun(@plus, Xprojected, mu);

% # preparing the figure
colors = [1 0 0; 0 0 1];
figure
hold on
axis([-5 0 -2.5 2.5])
axis square

% # plot discriminant axis
plot(mu(1) + U(1,1)*[-2 2], mu(2) + U(2,1)*[-2 2], 'k')
% # plot projection lines for each data point
for i=1:size(X,1)
    plot([X(i,1) Xprojected(i,1)], [X(i,2) Xprojected(i,2)], 'k--')
end
% # plot projected points
scatter(Xprojected(:,1), Xprojected(:,2), [], colors(G, :))
% # plot original points
scatter(X(:,1), X(:,2), [], colors(G, :), 'filled')
ameba
fonte
Excelente! Uma pergunta tão útil: por que estamos interessados ​​apenas no primeiro vetor eigen?
óculos
5

E "minha" solução. Muito obrigado a @ttnphns e @amoeba!

set.seed(2014)
library(MASS)
library(DiscriMiner) # For scatter matrices
library(ggplot2)
library(grid)
# Generate multivariate data
mu1 <- c(2, -3)
mu2 <- c(2, 5)
rho <- 0.6
s1 <- 1
s2 <- 3
Sigma <- matrix(c(s1^2, rho * s1 * s2, rho * s1 * s2, s2^2), byrow = TRUE, nrow = 2)
n <- 50
# Multivariate normal sampling
X1 <- mvrnorm(n, mu = mu1, Sigma = Sigma)
X2 <- mvrnorm(n, mu = mu2, Sigma = Sigma)
X <- rbind(X1, X2)
# Center data
Z <- scale(X, scale = FALSE)
# Class variable
y <- rep(c(0, 1), each = n)

# Scatter matrices
B <- betweenCov(variables = X, group = y)
W <- withinCov(variables = X, group = y)

# Eigenvectors
ev <- eigen(solve(W) %*% B)$vectors
slope <- - ev[1,1] / ev[2,1]
intercept <- ev[2,1]

# Create projections on 1st discriminant
P <- Z %*% ev[,1] %*% t(ev[,1])

# ggplo2 requires data frame
my.df <- data.frame(Z1 = Z[, 1], Z2 = Z[, 2], P1 = P[, 1], P2 = P[, 2])

plt <- ggplot(data = my.df, aes(Z1, Z2))
plt <- plt + geom_segment(aes(xend = P1, yend = P2), size = 0.2, color = "gray")
plt <- plt + geom_point(aes(color = factor(y)))
plt <- plt + geom_point(aes(x = P1, y = P2, colour = factor(y)))
plt <- plt + scale_colour_brewer(palette = "Set1")
plt <- plt + geom_abline(intercept = intercept, slope = slope, size = 0.2)
plt <- plt + coord_fixed()
plt <- plt + xlab(expression(X[1])) + ylab(expression(X[2]))
plt <- plt + theme_bw()
plt <- plt + theme(axis.title.x = element_text(size = 8),
                   axis.text.x  = element_text(size = 8),
                   axis.title.y = element_text(size = 8),
                   axis.text.y  = element_text(size = 8),
                   legend.position = "none")
plt

insira a descrição da imagem aqui

Andrej
fonte
1
(+1) Bom enredo! Deseja remover pelo menos alguns trechos de código da sua pergunta para melhorar a legibilidade? Depende de você, é claro.
Ameba
Este código não é reproduzível. Você pode introduzir variável x, intercepte slope?
Roman Luštrik
Fixo; funciona agora.
21711 Andrej
oi, por que não estamos usando o segundo discriminante?
bespectacled