Qual é a importância da matriz de chapéu,

9

Qual é a importância da matriz de chapéu, , na análise de regressão?H=X(XX)1X

É apenas para um cálculo mais fácil?

usuário 31466
fonte
Além disso, você poderia ser mais específico?
Steve S
@SteveS Na verdade, eu quero saber por que precisamos de matriz de chapéu?
usuário 31466
Você está perguntando por que precisamos ter um nome / símbolo especial (ou seja, "matriz de chapéu", " H ") para a matriz ou está perguntando mais sobre a importância do produto da matriz no lado direito?
Steve S

Respostas:

14

No estudo da regressão linear, o ponto de partida básico é o processo de geração de dados y= XB + u onde e determinístico. Depois de minimizar o critério dos mínimos quadrados, encontra-se um estimador para , ou seja, . Depois de conectar o estimador na fórmula inicial, obtém-se como um modelo linear do processo de geração de dados. Agora, pode-se substituir o estimador por e obterX B B B = ( X ' x ) - 1 X ' y y = X B B y = X ( X ' X ) - 1 X ' y .uN(0,σ2I)XB^BB^=(XX)-1 1Xyy^=XB^B^y^=X(XX)-1 1Xy.

Portanto, é na verdade uma matriz de projeção. Imagine que você pegue todas as variáveis ​​em . As variáveis ​​são vetores e ocupam um espaço. Portanto, se você multiplicar por , projeta seus valores observados em no espaço que é estendido pelas variáveis ​​em . Ele fornece as estimativas para e essa é a razão pela qual é chamada de matriz de chapéu e por que tem tanta importância. Afinal, a regressão linear nada mais é do que uma projeção e com a matriz de projeção não podemos apenas calcular as estimativas paraX H y y X y y uH=X(XX)-1 1XXHyyXyymas também para e pode, por exemplo, verificar se é realmente distribuído normalmente.você

Encontrei essa bela foto na internet e visualiza essa projeção. Observe que é usado em vez de . Além disso, a figura enfatiza que o vetor dos termos de erro é ortogonal à projeção e, portanto, não está correlacionado com as estimativas paraB yβBy

insira a descrição da imagem aqui

cara aleatório
fonte
5

A matriz hat é muito útil por alguns motivos:

  1. Em vez de ter y = Z β , temos que y = P y onde P é a matriz de chapéu. Isto dá-nos que y é um mapeamento linear dos valores observados.y^=Zβ^y^=PyPy^
  2. A partir da matriz chapéu , é fácil calcular os resíduos £ . Vemos que ε = y - y = y - P y = ( I n - P ) y .Pϵ^ϵ^=y-y^=y-Py=(Eun-P)y
wilsnunn
fonte
0

Nada mais é do que encontrar a solução "mais próxima" para Ax = b, onde b não está no espaço da coluna de A. Nós projetamos b no espaço da coluna e resolvemos Ax (hat) = p, em que p é a projeção de b em espaço da coluna.

Andrew W
fonte
11
Tudo isso pode ser feito sem nunca computação . H
whuber