Digamos que eu teste como a variável Y
depende da variável X
sob diferentes condições experimentais e obtenho o seguinte gráfico:
As linhas de traço no gráfico acima representam regressão linear para cada série de dados (configuração experimental) e os números na legenda indicam a correlação de Pearson de cada série de dados.
Eu gostaria de calcular a "correlação média" (ou "correlação média") entre X
e Y
. Posso simplesmente calcular a média dos r
valores? E o "critério médio de determinação", ? Devo calcular a média e, em seguida, calcular o quadrado desse valor ou devo calcular a média dos individuais ?R 2r
fonte
Para os coeficientes de correlação de Pearson, geralmente é apropriado transformar os valores de r usando uma transformação de Fisher z . Em seguida, calcule a média dos valores z e converta a média novamente em um valor r .
Eu imagino que seria bom para um coeficiente de Spearman também.
Aqui está um artigo e a entrada da Wikipedia .
fonte
A correlação média pode ser significativa. Considere também a distribuição de correlações (por exemplo, plote um histograma).
fonte
Que tal usar o MSPE (erro quadrado previsto médio) para o desempenho do algoritmo? Essa é uma abordagem padrão para o que você está tentando fazer, se estiver tentando comparar o desempenho preditivo entre um conjunto de algoritmos.
fonte