Estou curioso sobre a natureza de . Alguém pode dizer algo intuitivo sobre "O que diz sobre dados?"
Editar:
Obrigado pelas respostas
Depois de fazer alguns ótimos cursos, gostaria de acrescentar alguns pontos:
- É uma medida de informação, ou seja, é a quantidade de informação ao longo da direção .
- Dualidade: Como é definido positivamente, também é , portanto são normas de produto escalar, mais precisamente são normas duplas uma da outra, para que possamos derivar Fenchel dual para o problema dos mínimos quadrados regularizados e fazer maximização por dupla problema. Podemos escolher qualquer um deles, dependendo do seu condicionamento.
- Espaço Hilbert: as colunas (e linhas) de e ocupam o mesmo espaço. Portanto, não há nenhuma vantagem (exceto quando uma dessas matrizes está mal condicionada) entre a representação com ou
- Estatísticas Frequentistas: Está intimamente relacionado às informações de Fisher, usando o limite Cramér – Rao. De fato, a matriz de informações dos pescadores (produto externo do gradiente de probabilidade logarítmica) é ligada por Cramér-Rao, ou seja, (cone semi-definido positivo wrt, concentração de iewrt elipsóides). Então, quando o estimador de probabilidade máxima é eficiente, ou seja, a informação máxima existe nos dados, de modo que o regime freqüentista é ideal. Em palavras mais simples, para algumas funções de probabilidade (observe que a forma funcional da probabilidade depende puramente do modelo probablístico que supostamente gerou dados, também conhecido como modelo generativo), a probabilidade máxima é um estimador eficiente e consistente, governa como um chefe. (desculpe por exagerar)
Respostas:
É uma medida de precisão, assim como é uma medida de dispersão.Σ
Mais detalhadamente, é uma medida de como as variáveis estão dispersas em torno da média (os elementos diagonais) e como elas co-variam com outras variáveis (os elementos fora da diagonal). Quanto maior a dispersão, mais afastados estão da média e mais co-variam (em valor absoluto) com as outras variáveis, mais forte é a tendência de 'se moverem juntos' (na mesma direção ou no sentido oposto, dependendo da sinal da covariância).Σ
Da mesma forma, é uma medida de quão fortemente agrupadas as variáveis estão em torno da média (os elementos diagonais) e até que ponto elas não co-variam com as outras variáveis (os elementos fora da diagonal). Assim, quanto maior o elemento diagonal, mais apertada a variável é agrupada em torno da média. A interpretação dos elementos fora da diagonal é mais sutil e refiro-lhe as outras respostas para essa interpretação.Σ−1
fonte
Usando sobrescritos para denotar os elementos do inverso, é a variação do componente da variável que não está correlacionada com as outras variáveis e é a correlação parcial de variáveis e , controlando-se os de outras variáveis.1/σii i p−1 −σij/σiiσjj−−−−−√ i j p−2
fonte