Por que minha replicação do Silver & Dunlap 1987 não está funcionando?

8

Estou tentando replicar Silver & Dunlap (1987) . Estou apenas comparando correlações médias ou médias de transformações z e transformações inversas. Parece que não estou replicando a assimetria no viés que eles encontram (zs transformados de volta não estão mais próximos do valor da população do que rs). Alguma ideia? É possível que o poder computacional de 1987 simplesmente não tenha explorado o espaço o suficiente?

# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh

# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
    require(MASS)
    Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
    Sigma <- matrix(Sigma, 2, 2)
    return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
    }

Com essas funções, é fácil olhar para várias correlações (basicamente replicar silver e dunlap, 1987) e ver a diferença entre correlações médias e médias de escores z e transformação traseira. Aqui está apenas um.

r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r

Olhando apenas o tamanho da amostra de 10 e as correlações de 0,1, 0,5 e 0,9, esses são os resultados.

     rho  r bias   z bias
     0.1  -0.006   0.006
     0.5  -0.024   0.021
     0.9  -0.011   0.011

E estes são derivados da Tabela 1 da Silver & Dunlap.

     rho  r bias   z bias
     0.1  -0.007   0.003
     0.5  -0.025   0.001
     0.9  -0.011  -0.007

Estes são resultados bastante diferentes. Pelo meu teste, estou vendo que é apenas uma questão de direção de viés, não de magnitude. Mas, no artigo publicado, eles estão encontrando muito menos magnitude com z. Não foi possível encontrar uma não replicação publicada.

John
fonte
Estou preso nas suas duas primeiras linhas. Eles não parecem estar na sintaxe R correta. Eles também parecem assumir que atanh é o seu próprio inverso, mas não é: tanh é o inverso de atanh.
whuber
Eles são apenas erros de digitação na pergunta ... corrigidos.
John
1
Para mim, só de olho, a r biaspara rhode 0,5 nas prata & Dunlap aparência de mesa como o outlier para mim. Certamente não posso garantir a qualidade do diário, que parece bastante novo e um pouco áspero nas bordas, mas encontrei este artigo recente com uma pesquisa no Google. Veja, em particular, a Tabela 3 que, novamente, a olho nu, parece corroborar seus resultados.
cardeal
1
@ whuber: bastante verdade. No entanto, a UMVUE de no caso normal bivariado - como você pode muito bem saber - é (razoavelmente) bem conhecida por serAqui é o MLE. Às vezes, esse estimador aparece sob a notação . ρ
rΓ((n2)/2)Γ(1/2)Γ((n3)/2)01u1/2(1u)(n5)/21u(1r2)du.
rG(r)
cardinal
1
@ whuber: Você levanta bons pontos. Também não tinha acesso imediato ao trabalho de pesquisa e desenvolvimento, portanto minhas observações foram reduzidas a conjecturas. Se algum dia nos encontrarmos pessoalmente, trocarei uma ou duas histórias com você por uma cerveja sobre as frustrações de lidar com aqueles que insistem em calcular as correlações. Concordo plenamente com os seus comentários sobre o assunto. Dito isto, pode fazer sentido em algumas configurações com as quais geralmente estou menos familiarizado. :)
cardeal

Respostas:

9

Para mim, a r biasentrada rhode 0,5 na tabela Silver & Dunlap parece a mais suspeitamente diferente para mim. No entanto, o que disse, não corresponder ao seu valor estimado muito de perto.

Infelizmente, não tenho acesso ao artigo Silver & Dunlap no momento, mas uma pesquisa no Google revelou um artigo recente que realiza um estudo semelhante ao que você fez. Isto é

RL Gorsuch e CS Lehmann (2010), Coeficientes de correlação: distorção média e distorções do intervalo de confiança , Journal of Methods and Measurement in the Social Sciences , vol. 1, n. 2, 52-65.

Veja, em particular, a Tabela 3 que, pelo menos a olho nu, parece corroborar seus resultados.

Certamente não posso garantir a qualidade do diário (ou de todo o artigo), que parece bastante novo e um pouco áspero nas bordas, na minha opinião. Advertência.

Para um tratamento mais aprofundado e teórico da inferência na correlação (simples, parcial e múltipla) principalmente em uma estrutura normal multivariada, uma boa referência é

FA Graybill, Teoria e aplicação do modelo linear , Duxbury Press, 1976, Capítulo 11 .

Porém, ele não se preocupa muito com o desempenho de amostras pequenas ou com os aspectos aplicados.

cardeal
fonte