O problema das covariâncias é que elas são difíceis de comparar: quando você calcula a covariância de um conjunto de alturas e pesos, conforme expresso em (respectivamente) metros e quilogramas, você obtém uma covariância diferente de quando o faz em outras unidades ( que já causa um problema para as pessoas que fazem a mesma coisa com ou sem o sistema métrico!), mas também será difícil dizer se (por exemplo) altura e peso 'covaria mais' do que, digamos, o comprimento dos dedos dos pés e das mãos , simplesmente porque a 'escala' em que a covariância é calculada é diferente.
A solução para isso é 'normalizar' a covariância: você divide a covariância por algo que representa a diversidade e a escala em ambas as covariáveis e acaba com um valor que é garantido entre -1 e 1: a correlação. Qualquer que seja a unidade em que suas variáveis originais estivessem, você sempre obterá o mesmo resultado, e isso também garantirá que você possa, até certo ponto, comparar se duas variáveis 'correlacionam' mais de duas outras, simplesmente comparando a correlação delas.
Nota: o exposto acima pressupõe que o leitor já entenda o conceito de covariância.
cm
e seu Y está dentros
, então seu . E então você pode simplesmente multiplicar pelo resultado pelo fator de conversão da unidade.cov(cars$speed,cars$dist) == cov(cars$speed/5,cars$dist/7)*(7*5)
Os requisitos desses tipos de perguntas me parecem um pouco bizarros. Aqui está um conceito / fórmula matemática , mas quero falar sobre isso em algum contexto completamente desprovido de símbolos matemáticos. Eu também acho que deveria ser afirmado que a álgebra real necessária para entender as fórmulas, eu pensaria, deveria ser ensinada à maioria das pessoas antes do ensino superior (não é necessário entender a álgebra matricial, apenas álgebra simples será suficiente).
Portanto, a princípio, em vez de ignorar completamente a fórmula e falar sobre ela em alguns tipos de analogias mágicas e heurísticas, vamos apenas olhar para a fórmula e tentar explicar os componentes individuais em pequenos passos. A diferença em termos de covariância e correlação, ao examinar as fórmulas, deve ficar clara. Considerando que, falando em termos de analogias e heurísticas, suspeito que ocultem dois conceitos relativamente simples e suas diferenças em muitas situações.
Então, vamos começar com uma fórmula para a covariância da amostra (que acabei de pegar e adotar na wikipedia);
Para manter todos atualizados, vamos definir explicitamente todos os elementos e operações na fórmula.
Neste ponto, eu poderia apresentar um exemplo simples, para colocar um rosto nos elementos e operações, por assim dizer. Então, por exemplo, vamos criar uma tabela, em que cada linha corresponde a uma observação (e e y são rotulados adequadamente). É provável que esses exemplos sejam mais específicos (por exemplo, digamos que x representa idade e y representa peso), mas, para nossa discussão aqui, isso não deve importar.x y x y
Nesse ponto, se você sentir que a operação de soma na fórmula pode não ter sido totalmente compreendida, é possível apresentá-la novamente em um contexto muito mais simples. Diga apenas apresente que é o mesmo que dizer neste exemplo;∑ni = 1( xEu)
Agora que bagunça deve ser esclarecido, e podemos trabalhar nosso caminho para a segunda parte da fórmula, . Agora, supondo que as pessoas já sabem que a média, ˉ x e ° y representam, e eu diria que, sendo hipócrita dos meus próprios comentários no início do post, pode-se apenas se referem à média em termos de heurísticas simples (por exemplo, no meio da distribuição). Pode-se então apenas executar esse processo, uma operação de cada vez. A declaração ( x i - ˉ x )( xEu- x¯) ( yEu- y¯) x¯ y¯ ( xEu- x¯) está apenas examinando os desvios / distâncias entre cada observação e a média de todas as observações para esse atributo específico. Portanto, quando uma observação estiver mais distante da média, essa operação receberá um valor mais alto. Pode-se então voltar à tabela de exemplo fornecida e simplesmente demonstrar a operação no vetor das observações.x
A operação é a mesma para o vetor , mas apenas para reforço, você também pode apresentar essa operação.y
Observe o que acontece ao multiplicar, se duas observações estiverem a uma grande distância acima da média, a observação resultante terá um valor positivo ainda maior (o mesmo acontece se as duas observações estiverem a uma grande distância abaixo da média, como multiplicar dois negativos é igual a positivo). Observe também que se uma observação estiver alta acima da média e a outra estiver bem abaixo da média, o valor resultante será grande (em termos absolutos) e negativo (como um tempo positivo, um negativo é igual a um número negativo). Por fim, observe que, quando um valor estiver muito próximo da média para qualquer observação, multiplicar os dois valores resultará em um número pequeno. Novamente, podemos apenas apresentar esta operação em uma tabela.
Nesse ponto, convém reforçar de onde os 5 vêm, mas isso deve ser tão simples quanto voltar à tabela e contar o número de observações (vamos deixar novamente a diferença entre amostra e população para outra hora).
Entendo que, em algumas circunstâncias, esse nível de tratamento não seria apropriado. O Senado precisa do resumo executivo . Nesse caso, bem, você pode se referir às heurísticas simples que as pessoas têm usado em outros exemplos, mas Roma não foi construída em um dia. E ao senado que pede o resumo executivo, se você tiver tão pouco tempo, talvez deva apenas aceitar minha palavra e dispensar as formalidades de analogias e pontos de bala.
fonte
Ou seja, a correlação é simplesmente uma representação de covariância, portanto o resultado deve ficar entre -1 (perfeitamente inversamente correlacionado) e +1 (perfeitamente correlacionado positivamente), observando que um valor próximo de zero significa que duas variáveis não estão correlacionadas.
A covariância é ilimitada e carece de um contexto quando comparada a outras covariâncias. Ao normalizar / ajustar / padronizar as covariâncias em uma correlação, os conjuntos de dados podem ser comparados mais facilmente.
Como você pode imaginar, existem diferentes maneiras pelas quais uma estatística (como covariância) pode ser normalizada / padronizada. A fórmula matemática para a relação entre correlação e covariância reflete simplesmente o uso de estatísticos da convenção (ou seja, ajustando de acordo com seus desvios-padrão):
fonte
Se você está familiarizado com a idéia de centralizar e padronizar, x-xbar é centralizar x em sua média. O mesmo se aplica a y. Portanto, a covariância simplesmente centraliza os dados. A correlação, no entanto, não apenas centraliza os dados, mas também escala usando o desvio padrão (padronizar). A multiplicação e a soma são o produto escalar dos dois vetores e mostra como paralelo esses dois vetores se comparam (a projeção de um vetor no outro). A divisão de (n-1) ou o valor esperado é escalonado para o número de observações. Pensamentos?
fonte
Tanto quanto eu entendi. Correlação é uma versão "normalizada" da covariância.
fonte
A correlação é dimensionada para ficar entre -1 e +1, dependendo da existência de correlação positiva ou negativa, e é adimensional. A covariância, no entanto, varia de zero, no caso de duas variáveis independentes, a Var (X), no caso em que os dois conjuntos de dados são iguais. As unidades de COV (X, Y) são as unidades de X vezes as unidades de Y.
fonte
The units of COV(X,Y) are the units of X times the units of Y.
de elaborar?