Sei que isso é pedante e banal, mas como pesquisador em um campo fora da estatística, com educação formal limitada em estatística, sempre me pergunto se estou escrevendo "valor-p" corretamente. Especificamente:
- O "p" deveria ser capitalizado?
- O "p" deveria estar em itálico? (Ou em fonte matemática, em TeX?)
- Supõe-se que exista um hífen entre "p" e "valor"?
- Como alternativa, não existe uma maneira "adequada" de escrever "valor-p", e qualquer idiota entenderá o que quero dizer se eu apenas colocar "p" ao lado de "valor" em alguma permutação dessas opções?
hypothesis-testing
p-value
terminology
gotgenes
fonte
fonte
Respostas:
Não parece haver "padrões". Por exemplo:
Minha pesquisa breve e não científica sugere que a combinação mais comum é minúscula, itálico, p sem hífen.
fonte
Esse parece ser um problema de estilo, com diferentes periódicos e editoras adotando convenções diferentes (ou permitindo uma confusão de estilos, dependendo das preferências dos autores). Minha preferência, pelo que vale, é o valor p, hifenizado sem itálico e sem maiúsculas.
fonte
O ASA House Style parece recomendar colocar itálico ep com o hífen: p -value. Uma pesquisa no google scholar mostra grafias variadas .
fonte
O valor de p do ponto de vista teórico é uma realização da variável aleatória. Existe algum padrão (em probabilidade) para usar letras maiúsculas para variáveis aleatórias e letras minúsculas para realizações. Nos cabeçalhos das tabelas, devemos usar P (talvez em itálico ), no texto junto com seu valor p = 0,0012 e no texto que descreve, por exemplo, o valor p da metodologia.
fonte
Omitir o hífen às vezes pode alterar o significado das sentenças ou, pelo menos, pode se tornar ambíguo. Isso pode ocorrer principalmente em trabalhos que descrevem testes estatísticos ou introduzem algoritmos para avaliar valores-p, mas pode-se também descrever métodos que nada têm a ver com estatística e ainda calcular valores de p a partir de testes t (mas não os valores de p usando estatística testes t). Nesse tipo de contexto, os hífens seriam realmente necessários, mesmo que os escritores geralmente tentem evitar anotações que podem ser facilmente confundidas.
Exemplo (com uma má escolha de notações): gostaríamos de encontrar um conjunto de fortes padrões de associação e avaliar a probabilidade de o resultado ter ocorrido por acaso. Na primeira fase, procuramos os melhores padrões z com algum índice de bondade. Portanto, após a fase de pesquisa, teremos escores z (mas os escores z). Em seguida, avaliamos os melhores padrões com um teste de randomização. Geramos t conjuntos de dados aleatórios e avaliamos a pontuação do z: o melhor padrão em cada conjunto de dados. Portanto, realizamos testes t (mas não os testes t) e produzimos a pontuação do z: o melhor padrão. Descobrimos que os valores de p (mas não os valores de p) de todos os valores do escore t são melhores do que o z: o melhor padrão original. Portanto, podemos estimar que a probabilidade de obter z padrões tão bons por acaso é p / t.
fonte