Para a norma vetorial, a norma L2 ou "distância euclidiana" é a definição amplamente usada e intuitiva. Mas por que a definição de norma "mais usada" ou "padrão" para uma matriz é a norma espectral , mas não a norma de Frobenius (que é semelhante à norma L2 para vetores)?
Isso tem algo a ver com algoritmos iterativos / potências matriciais (se o raio espectral for menor que 1, o algoritmo convergirá)?
É sempre discutível para as palavras como "mais usado", "padrão". A palavra "default" mencionado acima é proveniente do tipo padrão de retorno em
Matlab
funçãonorm
. AR
norma padrão para matriz é a norma L1. Ambos são "não naturais" para mim (para uma matriz, parece mais "natural" fazer como no vetor). (Obrigado pelos comentários @ usεr11852 e @ whuber e desculpe-me pela confusão.)Pode ser expandir o uso da norma matriz me ajudaria a entender mais?
fonte
norm
R
lista a norma como padrão, não a norma espectral.Respostas:
Em geral, não tenho certeza de que a norma espectral seja a mais amplamente usada. Por exemplo, a norma de Frobenius é usada para aproximar soluções em fatoração de matriz não negativa ou regularização de matriz de correlação / covariância . Penso que parte desta questão decorre da contravenção terminológica que algumas pessoas fazem (inclusive eu) quando se referem à norma de Frobenius como a norma da matriz euclidiana . Não devemos, porque, na verdade, a norma da matriz (ou seja, a norma espectral) é aquela que é induzida às matrizes ao usar a norma do vetor . A norma de Frobenius é a de elementos: , enquanto oL 2L2 L2 L2| | Um| | 2=√||A||F=∑i,ja2i,j−−−−−−√ L2 A norma da matriz ( ) é baseada em valores singulares, portanto, é mais "universal". (para sorte de um termo melhor?) A norma da matriz é do tipo euclidiano, pois é induzida pela norma do vetor euclidiano, onde . Portanto, é uma norma induzida para matrizes porque é induzida por uma norma vetorial , a norma vetorial nesse caso.L2| | Um| | 2=max | | x | | 2 = 1 | | Umx| | 2L2||A||2=λmax(ATA)−−−−−−−−−√) L2 ||A||2=max||x||2=1||Ax||2 L2
Provavelmente o MATLAB visa fornecer a norma por padrão ao usar o comando ; como conseqüência, fornece a norma do vetor euclidiano, mas também a norma da matriz , ie. a norma da matriz espectral (em vez da norma da matriz de Frobenius / Euclidiana citada incorretamente ). Finalmente, deixe-me notar que qual é a norma padrão é uma questão de opinião até certo ponto: por exemplo, " Álgebra de matriz - teoria, computações e aplicações em estatística ", de JE Gentle, literalmente tem um capítulo (3.9.2) chamado: " O Frobenius Norma - A norma "usual"L 2L2 L2 "; tão claramente a norma espectral não é a norma para todas as partes consideradas! :) Como comentado por @amoeba, diferentes comunidades podem ter convenções terminológicas diferentes. Não é preciso dizer que acho que o livro de Gentle é um recurso inestimável em matéria de Lin. Álgebra aplicação em Estatística e gostaria de pedir-lhe para olhar mais!
norm
fonte
Uma parte da resposta pode estar relacionada à computação numérica.
Quando você resolve o sistema com precisão finita, não obtém a resposta exata para esse problema. Você obtém uma aproximação devido às restrições da aritmética finita, de modo que , em algum sentido adequado. O que sua solução representa então? Bem, pode ser uma solução exata para outro sistema como Para que o tenha utilidade, o sistema til deve estar próximo ao sistema original: Se o seu algoritmoAx=b ~ x Um ~ x ≈ b ~ A ~ x = ~ b ~ x ~ Um ≈ Um ,x~ Ax~≈b A~x~=b~ x~ A~≈A,b~≈b ~ A -Um ~ b -b‖ ~ A -Um‖‖ ~ b -b‖l1l∞L2L2ldoisde resolver o sistema original satisfaz essa propriedade, é chamado de estável para trás . Agora, a análise precisa de quão grandes são as discrepâncias , leva a erros nos limites expressos como,. Para algumas análises, a norma (soma máxima da coluna) é a mais fácil de ; para outras, a norma (soma máxima de linhas) é a mais fácil de executar (para componentes da solução no caso de sistema linear) , por exemplo), e para outros ainda, a norma espectral é a mais apropriada (induzida pela tradicionalA~−A b~−b ∥A~−A∥ ∥b~−b∥ l1 l∞ l2 l2 norma do vetor, como apontado em outra resposta ). Para o cavalo de trabalho da computação estatística na inversão simétrica da matriz psd, a decomposição de Cholesky (trivialidade: o primeiro som é um [x] como na letra grega "chi", não [tʃ] como em "chase"), a norma mais conveniente para acompanhar os limites de erro é a norma ... embora a norma Frobenius também apareça em alguns resultados, por exemplo, na inversão matricial particionada.l2
fonte
A resposta para isso depende do campo em que você está. Se você é matemático, todas as normas em dimensões finitas são equivalentes : para quaisquer duas normas e , existem existem constantes , que dependem apenas da dimensão (e a, b), de modo que: ‖ ⋅ ‖ b C 1 , C 2∥⋅∥a ∥⋅∥b C1,C2
Isso implica que as normas em dimensões finitas são bastante entediantes e não há essencialmente nenhuma diferença entre elas, exceto na forma como elas são dimensionadas. Isso geralmente significa que você pode escolher a norma mais conveniente para o problema que está tentando resolver . Normalmente, você deseja responder perguntas como "este operador ou procedimento é limitado" ou "esse processo numérico converge". Com a limitação, você normalmente só se importa que algo seja finito. Com a convergência, sacrificando a taxa na qual você tem convergência, você pode optar por usar uma norma mais conveniente.
Por exemplo, na álgebra linear numérica, a norma Frobenius às vezes é preferida porque é muito mais fácil de calcular do que a norma euclidiana, e também que ela se conecta naturalmente a uma classe mais ampla de operadores de Hilbert Schmidt . Além disso, como a norma euclidiana, é submultiplicativa: , ao contrário da norma max, por isso permite que você fale facilmente sobre a multiplicação de operadores em qualquer local o espaço em que você está trabalhando. As pessoas tendem a gostar muito da norma e da norma Frobenius porque têm relações naturais com os valores próprios e com os valores singulares das matrizes, além de serem sub-multiplicadoras. p = 2∥AB∥F≤∥A∥F∥B∥F p=2
Para fins práticos , as diferenças entre normas se tornam mais acentuadas porque vivemos em um mundo de dimensões e, geralmente, importa quão grande é uma certa quantidade e como é medida. Essas constantes acima não são exatamente justas, portanto, torna-se importante quanto mais ou menos uma determinada norma é comparada a . " x " a " x " bC1,C2 ∥x∥a ∥x∥b
fonte