Primeiro de tudo, não estou perguntando isso:
Por que a correlação zero não implica independência?
Isso é abordado (de maneira bastante agradável) aqui: /math/444408/why-does-zero-correlation-not-imply-independence
O que estou perguntando é o oposto ... digamos que duas variáveis sejam totalmente independentes uma da outra.
Eles não poderiam ter uma pequena correlação por acidente?
Não deveria ser ... independência implica correlação MUITO PEQUENA?
correlation
mathematical-statistics
covariance
independence
Joshua Ronis
fonte
fonte
Respostas:
Pela definição do coeficiente de correlação, se duas variáveis são independentes, sua correlação é zero. Portanto, não poderia ter nenhuma correlação por acidente!
SeX e Y são independentes, significa E[ XY] = E[ X] E[ Y] . Portanto, o numerador de ρX, Y é zero neste caso.
Portanto, se você não alterar o significado da correlação, como mencionado aqui, não será possível. A menos que, esclareça sua definição de qual é a correlação.
fonte
Não há nada de especial na distribuição exponencial a esse respeito. Alterar a distribuição dos pais para o padrão normal deu os seguintes resultados.
fonte
Resposta simples: se duas variáveis são independentes, a correlação da população é zero, enquanto a correlação da amostra será tipicamente pequena, mas diferente de zero.
Isso ocorre porque a amostra não é uma representação perfeita da população.
Quanto maior a amostra, melhor ela representa a população, menor a correlação que você terá. Para uma amostra infinita , a correlação seria zero.
fonte
Talvez isso seja útil para algumas pessoas que compartilham o mesmo entendimento intuitivo. Todos nós vimos algo assim:
Como outros já apontaram, os valores da amostra estão correlacionados, mas isso não significa que a população tenha uma correlação diferente de zero.
É claro que esses dois deveriam ser independentes - dado que Nicolas Cage apareceu em um recorde de 10 filmes este ano, não devemos fechar a piscina local para o verão por questões de segurança.
Mas quando verificamos quantas pessoas se afogam este ano, há uma pequena chance de que um número recorde de 1000 pessoas se afogue este ano.
Obter essa correlação é improvável. Talvez um em mil. Mas é possível, mesmo que os dois sejam independentes. Mas este é apenas um caso. Considere que existem milhões de eventos possíveis para medir por aí, e você pode ver a chance de que as chances de dois acontecerem para dar uma alta correlação sejam bastante altas (daí a existência de gráficos como o acima).
Outra maneira de analisar é que garantir que dois eventos independentes sempre gerem valores não correlacionados é restritivo. Dados dois dados independentes e os resultados do primeiro, há um certo conjunto (considerável) de resultados para o segundo dado que fornecerá alguma correlação diferente de zero. Restringir os resultados do segundo dado para dar uma correlação zero com o primeiro é uma clara violação da independência, pois as jogadas do primeiro dado estão afetando a distribuição dos resultados.
fonte