Para alguns testes R
, existe um limite mais baixo nos cálculos do valor p de . Não sei por que é esse número, se há uma boa razão para isso ou se é apenas arbitrário. Muitos outros pacotes de estatísticas são acessados , então esse é um nível de precisão muito mais alto. Mas não tenho visto muitos trabalhos relatando ou .0.0001
É uma prática comum / recomendável relatar esse valor calculado ou é mais comum relatar outra coisa (como p < 0.000000000000001
)?
...But I haven't seen too many papers reporting p<2.22⋅10−16....
Veja alguns artigos da GWAS , existem muitos artigos mostrando resultados para pvalores em centenas, por exemplo: região KLK do câncer de próstata, p = 9x10 ^ -186.Respostas:
Há uma boa razão para isso.
O valor pode ser encontrado via
noquote(unlist(format(.Machine)))
Se você olhar para a ajuda, (
?".Machine"
):É essencialmente um valor abaixo do qual você pode estar bastante confiante de que o valor será bastante numericamente sem sentido - pois qualquer valor menor provavelmente não será um cálculo preciso do valor que estávamos tentando calcular. (Tendo estudado um pouco de análise numérica, dependendo de quais cálculos foram executados pelo procedimento específico, há uma boa chance de a falta de sentido numérico ser muito superior a isso.)
Mas o significado estatístico terá sido perdido muito antes. Observe que os valores p dependem de suposições e, quanto mais longe você for, mais fortemente o valor p verdadeiro (em vez do valor nominal que calculamos) será afetado pelas suposições equivocadas, em alguns casos, mesmo quando elas só está um pouco errado. Como as suposições simplesmente não serão totalmente satisfeitas, os valores p médios podem ser razoavelmente precisos (em termos de precisão relativa, talvez apenas por uma fração modesta), mas valores p extremamente pequenos podem estar fora de muitas ordens de magnitude.
O que quer dizer que a prática usual (algo como "<0,0001", que você diz ser comum em pacotes, ou a regra da APA que Jaap menciona em sua resposta) provavelmente não está tão longe da prática sensata, mas o ponto aproximado em que as coisas perder o significado além de dizer ' é muito pequeno ', é claro, variará bastante, dependendo das circunstâncias.
Essa é uma das razões pelas quais não posso sugerir uma regra geral - não pode haver uma única regra que seja remotamente adequada para todos em todas as circunstâncias - mude um pouco as circunstâncias e a ampla linha cinza marcando a mudança de algo significativo para relativamente sem sentido vai mudar, às vezes por um longo caminho.
Se você fosse para especificar informações suficientes sobre as circunstâncias exatas (por exemplo, é uma regressão, com este muito não-linearidade, que quantidade de variação nesta variável independente, este tipo e quantidade de dependência no termo de erro, que tipo de e quantidade de heterocedasticidade, essa forma de distribuição de erros), eu poderia simular valores p 'verdadeiros' para você comparar com os valores nominais p, para que você pudesse ver quando eles eram muito diferentes para o valor nominal ter algum significado.
Mas isso nos leva à segunda razão pela qual - mesmo se você especificou informações suficientes para simular os verdadeiros valores-p - eu ainda não conseguia declarar responsavelmente um corte para essas circunstâncias.
O que você denuncia depende das preferências das pessoas - a sua e o seu público. Imagine que você me contou o suficiente sobre as circunstâncias para eu decidir que queria traçar a linha com um nominal de 10 - 6 .p 10- 6
Tudo bem, podemos pensar - exceto sua própria função de preferência (o que parece certo para você, você deve observar a diferença entre os valores-p nominais dados pelos pacotes de estatísticas e os resultantes da simulação quando você supõe um conjunto específico falhas de suposições) pode colocá-lo em e os editores do periódico ao qual você deseja enviar podem ter sua regra geral cortada em 10 - 4 , enquanto o próximo periódico pode colocá-lo em 10 - 3 e o o próximo pode não ter regra geral e o editor específico que você recebeu pode aceitar valores ainda mais baixos do que eu forneci ... mas um dos árbitros pode ter um corte específico!10- 5 10- 4 10- 3
Na falta de conhecimento de suas funções e regras de preferência, e na falta de conhecimento de seus próprios utilitários, como sugiro responsavelmente qualquer escolha geral de quais ações executar?
Posso pelo menos dizer o tipo de coisa que faço (e não sugiro que seja uma boa escolha para você):
Isso é certamente útil para informar uma escolha - mas é mais provável que eu discuta os resultados da simulação que os use para escolher um valor de corte, dando aos outros a chance de escolherem o seu.
Uma alternativa à simulação é examinar alguns procedimentos mais robustos * para as várias falhas potenciais de suposição e ver quanta diferença em relação ao valor-p pode fazer. Seus valores-p também não serão particularmente significativos, mas pelo menos dão uma noção de quanto impacto pode haver. Se algumas são muito diferentes da nominal, também dá mais uma idéia de quais violações de suposições devem ser investigadas. Mesmo que você não relate nenhuma dessas alternativas, ele fornece uma imagem melhor de quão significativo é seu pequeno valor-p.
* Observe que aqui realmente não precisamos de procedimentos que sejam robustos a violações graves de alguma suposição; aqueles que são menos afetados por desvios relativamente leves da suposição relevante devem ser bons para este exercício.
Eu direi que quando / se você vier a fazer essas simulações, mesmo com violações bastante leves, em alguns casos, pode ser surpreendente até que ponto os valores p não tão pequenos podem estar errados. Isso fez mais para mudar a maneira como interpreto pessoalmente um valor p mais do que mudou os pontos de corte específicos que eu poderia usar.
Ao enviar os resultados de um teste de hipóteses real para um diário, tento descobrir se eles têm alguma regra. Caso contrário, tendem a me agradar e espero que os árbitros se queixem.
fonte
Qual prática comum pode depender do seu campo de pesquisa. O manual da American Psychological Association (APA), que é um dos estilos de citação mais usados, declara (p. 139, 6ª edição):
fonte
Esses valores p extremos ocorrem com mais frequência em campos com quantidades muito grandes de dados, como genômica e monitoramento de processos. Nesses casos, às vezes é relatado como -log 10 (valor-p). Veja, por exemplo, esta figura da Nature , onde os valores de p vão para 1e-26.
-log 10 (valor-p) é chamado "LogWorth" pelos estatísticos com quem trabalho no JMP.
fonte
em R, "<2e-16" não significa literalmente <2e-16, mas significa que o valor é tão pequeno que R não pode registrá-lo ou exibi-lo.
No teste de regressão, muitas vezes eu recebo p tão pequeno quanto 4.940656e-324, quando gera "<2e-16", esse é um número ainda menor que 4.940656e-324
fonte
<2e-16
, o valor é menor que2e-16
, literalmente.format.pval
ou experimente, como emformat.pval(1e-16)
.