Antecedentes: Li um artigo em que os autores relatam a correlação de Pearson 0,754 do tamanho da amostra 878. O valor p resultante para o teste de correlação é "duas estrelas" significativo (isto é, p <0,01). No entanto, acho que, com um tamanho de amostra tão grande, o valor de p correspondente deve ser menor que 0,001 (ou seja, três estrelas significativo).
- Os valores de p para este teste podem ser calculados apenas a partir do coeficiente de correlação de Pearson e tamanho da amostra?
- Se sim, como isso pode ser feito no R?
hypothesis-testing
correlation
p-value
fraud
Miroslav Sabo
fonte
fonte
Respostas:
Sim, isso pode ser feito se você usar a transformação de R para z de Fisher. Outros métodos (por exemplo, inicialização) podem ter algumas vantagens, mas requerem os dados originais. Em R ( r é o coeficiente de correlação da amostra, n é o número de observações):
Veja também este post no meu blog .
Dito isto, seja 0,01 ou 0,001, não importa muito. Como você disse, isso depende principalmente do tamanho da amostra e você já sabe que o tamanho da amostra é grande. A conclusão lógica é que você provavelmente nem precisa de um teste (especialmente não um teste da chamada hipótese "nula" de que a correlação é 0). Com N = 878, você pode estar bastante confiante na precisão da estimativa e se concentrar em interpretá-la diretamente (ou seja, é 0,75 grande em seu campo?).
Formalmente, no entanto, quando você faz um teste estatístico na estrutura Neyman-Pearson, precisa especificar o nível de erro antecipadamente. Portanto, se os resultados do teste realmente importam e o estudo foi planejado com 0,01 como limite, faz sentido relatar p <0,01 e você não deve oportunamente fazê-lo p <0,001 com base no valor de p obtido . Esse tipo de flexibilidade não revelada é até uma das principais razões por trás das críticas a estrelinhas e, mais geralmente, à maneira como o teste de significância de hipóteses nulas é praticado nas ciências sociais.
Veja também Meehl, PE (1978). Riscos teóricos e asteriscos tabulares: Sir Karl, Sir Ronald e o lento progresso da psicologia branda.Jornal de Consultoria e Psicologia Clínica, 46 (4), 806-834. (O título contém uma referência a essas "estrelas", mas o conteúdo é uma discussão muito mais ampla sobre o papel dos testes de significância.)
fonte
Há uma estatística alternativa:
que tem distribuição t com n-2 graus de liberdade. É assim que funciona, por exemplo: http://www.danielsoper.com/statcalc3/calc.aspx?id=44
fonte