Matriz de dispersão total (dentro da classe + entre classes) derivada

14

Eu estava brincando com os métodos PCA e LDA e estou em um ponto, sinto que é tão simples que não consigo vê-lo.

Matrizes de dispersão dentro da classe ( ) e entre classes ( S B ) são definidas como:SWSB

SW=Eu=1Ct=1N(xtEu-μEu)(xtEu-μEu)T

SB=Eu=1CN(μEu-μ)(μEu-μ)T

A matriz de dispersão total é dada como:ST

ST=Eu=1Ct=1N(xtEu-μ)(xtEu-μ)T=SW+SB

onde C é o número de classes e N é o número de amostras são amostras, μ i é a média da classe, μ é a média geral.xμEuμ

Ao tentar derivar eu vim até um ponto onde eu tive:ST

(x-μEu)(μEu-μ)T+(μEu-μ)(x-μEu)T

como um termo. Isso precisa ser zero, mas por quê?


De fato:

ST=Eu=1Ct=1N(xtEu-μ)(xtEu-μ)T=Eu=1Ct=1N(xtEu-μEu+μEu-μ)(xtEu-μEu+μEu-μ)T=SW+SB+Eu=1Ct=1N[(xtEu-μEu)(μEu-μ)T+(μEu-μ)(xtEu-μEu)T]
nimcap
fonte
2
A resposta é que você está somando os desvios dos valores em torno da média e essa soma é zero. Mas o que, exatamente, são , m , e sou eu ? Como m e m i estão relacionados a μ e μ i ? A qualidade das respostas dependerá da precisão com que adivinhamos, mas você está nos forçando a adivinhar demais! xmmEummEuμμEu
whuber
@ whuber: Você está totalmente certo, eu revisei minha pergunta.
Nimcap 23/03

Respostas:

8

Se você assumir

1Nt=1NxtEu=μEu

Então

Eu=1Ct=1N(xtEu-μEu)(μEu-μ)T=Eu=1C(t=1N(xtEu-μEu))(μEu-μ)T=0 0

e fórmula vale. Você lida com o segundo termo da mesma maneira.

mpiktas
fonte
2
(+1) O segundo termo, sendo a transposição do primeiro, também deve ser zero :-).
whuber
@whuber, sim, isso também :)
mpiktas 23/03
Oi, eu não entendo por que a suposição é válida? Alguém pode explicar isso?
Mvkt
1
@Mvkt Não é tanto uma suposição quanto a definição de μEuμEuEuμEu