Quando a transformação z de Fisher é apropriada?

13

Quero testar uma correlação de amostra r quanto à significância, usando valores-p, ou seja

H0 0:ρ=0 0,H1:ρ0

Entendi que posso usar a transformação z de Fisher para calcular isso

zobs=n-32em(1+r1-r)

e encontrar o valor p por

p=2P(Z>zobs)

usando a distribuição normal padrão.

Minha pergunta é: quão grande deve ser n para que essa seja uma transformação apropriada? Obviamente, n deve ser maior que 3. Meu livro não menciona nenhuma restrição, mas no slide 29 desta apresentação ele diz que n deve ser maior que 10. Para os dados que estarei considerando, terei algo como 5n10 .

Gunnhild
fonte
2
A página da Wikipedia lista o erro padrão de que é dado por 1zobs ondeNé o tamanho da amostra. Então você precisará de pelo menos 4 pares completos. Não conheço nenhuma restrição além daquelas em relação ao tamanho da amostra. 1/N3N
COOLSerdash
8
Não tenho certeza de quanto confiar em uma apresentação de alguém que não sabe escrever o próprio nome da universidade. Mais a sério, tenha cuidado com todos os conselhos que impliquem que as coisas estão bem acima de um determinado tamanho de amostra e, caso contrário, são terríveis. É uma questão de qualidade de aproximação aumentando suavemente com o tamanho da amostra e também dependendo da distribuição dos dados. Um conselho simples é ser muito cauteloso, plotar tudo e verificar com intervalos de confiança de inicialização.
Nick Cox
1
O slide 17 descreve um teste t para o caso especial . ρ=0
whuber

Respostas:

8

Para perguntas como essas, eu apenas executaria uma simulação e veria se os valores- se comportam como eu esperava. O valor- p é a probabilidade de extrair aleatoriamente uma amostra que se desvia pelo menos tanto da hipótese nula quanto os dados que você observou se a hipótese nula for verdadeira. Portanto, se tivéssemos muitas dessas amostras, e uma delas tivesse um valor- p de 0,04, esperaríamos que 4% dessas amostras tivessem um valor menor que 0,04. O mesmo vale para todos os outros possíveisppp .p

Abaixo está uma simulação no Stata. Os gráficos verificam se os valores de medem o que eles devem medir, ou seja, mostram quanto a proporção de amostras com valores de p menores que o valor de p nominal se desvia do valor de p nominal . Como você pode ver, esse teste é um tanto problemático com um número tão pequeno de observações. Se é ou não muito problemático para a sua pesquisa, é o seu julgamento.pppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

insira a descrição da imagem aqui

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

insira a descrição da imagem aqui

Maarten Buis
fonte
1
Tente subtrair 2,5 em vez de 3 de :-). n
whuber
5

FWIW Vejo a recomendação em Myers & Well (desenho da pesquisa e análises estatísticas, segunda edição, 2003, p. 492). A nota de rodapé declara:N10

A rigor, a transformação é influenciada por uma quantidade r / ( 2 ( N - 1 ) ) : ver Pearson e Hartley (1954, p. 29). Esse viés geralmente será desprezível, a menos que N seja pequeno e ρ seja grande, e nós o ignoramos aqui.Zr/(2(N1))Nρ

Burak Aydin
fonte
3
Parece que é uma resposta para mim.
gung - Restabelece Monica
1

Não tenho certeza se a transformação de Fisher é apropriada aqui. Para H 0 : ρ = 0 (NB: hipótese nula é para população ρ , não para a amostra r ), a distribuição amostral do coeficiente de correlação já é simétrica, portanto, não há necessidade de reduzir a assimetria, que é o que o z de Fisher pretende fazer; e você pode usar o t de StudentzH0:ρ=0ρrzt aproximação .

Supondo que você queira dizer , a assimetria desse PDF dependerá do valor proposto de ρ 0 ; portanto, não haveria uma resposta geral de quão grande deve ser n . Além disso, os valores mínimos de n dependeriam do nível de significância α em que você está trabalhando. Você não declarou seu valor.H0:ρ=ρ00ρ0nnα

O argumento de Nick é justo: as aproximações e recomendações estão sempre operando em alguma área cinzenta.

n(tα/2s/ϵ)2tsn(1.96s/ϵ)2

Lucozade
fonte
4
zzz
1
zH0:ρ=ρ00t
3
ztρ=0
1
Você pode ler mais sobre Fisher's ztransformação aqui: stata-journal.com/article.html?article=pr0041
Maarten Buis
Ok, obrigado @NickCox! @Lucozade, qual é oϵ no limite em n?
precisa