Não sou estatístico, mas meu trabalho de pesquisa envolve estatística (análise de dados, leitura de literatura etc.). Lembrei-me novamente de um comentário em uma das minhas perguntas postadas aqui que existem algumas palavras comuns que têm significados ou conotações particularmente específicos para aqueles que são bem praticados no campo da estatística.
Será útil ter uma lista dessas palavras e pode haver frases e alguns comentários.
terminology
user4045
fonte
fonte
Respostas:
" significativo " - aqui, o uso comum da palavra na linguagem deve significar algo como 'importante' ou 'significativo'. O significado estatístico está informalmente mais próximo de "pode ser discernido a partir de variação aleatória sobre o nulo"; isso não significa que a diferença é grande o suficiente para importar.
Aqui estão alguns exemplos em que essa distinção pode ter sido a causa de alguma confusão: 1 2
" parâmetro " - muitas vezes parece acontecer - particularmente em experimentos científicos - que a palavra 'parâmetro' é usada da maneira que um estatístico usaria a palavra 'variável'. A Wikipedia coloca assim:
Exemplo em que este pode ser um problema: 1 - presumivelmente o post que levou a essa pergunta. (Vi outra recentemente, mas não consigo localizá-la agora)
fonte
"Erro" - nas estatísticas, geralmente significa qualquer desvio entre um valor observado e o previsto. Na vida real, isso significa um erro.
fonte
Encontrei um artigo revisado de 2010 que analisa essa questão.
Anderson-Cook CM. Jargão oculto: Palavras cotidianas com significados específicos para estatísticas. ICOTS8, Conferência Internacional sobre Ensino de Estatística, Ljubljana, Eslovênia, 11 a 17 de julho de 2010.
O artigo está disponível gratuitamente on-line , por isso estou fornecendo apenas uma lista parcial dos termos discutidos pelo autor:
fonte
Eu me deparei com o problema de usar "falsificação" como em "falsificar uma hipótese", enquanto outros pensavam que eu estava me referindo a "compor dados". Também " tendencioso " é quase impossível de mencionar sem causar confusão.
fonte
"normal" - em linguagem comum, normal significa como esperado, não fora do comum. Nas estatísticas, se uma variável é normalmente distribuída, está se referindo à distribuição gaussiana. Não acredito que seja padrão colocar em maiúscula a palavra "normal" para distingui-la do significado comum da fala.
"normalização / padronização" - Nas estatísticas, normalizar uma variável significa subtrair a média e dividir pelo desvio padrão.
"desvio padrão versus erro padrão" - o desvio padrão geralmente é calculado usando toda a população, enquanto o erro padrão é calculado usando a amostra.
fonte
"Paramétrico" versus "Não Paramétrico": categorias de testes que requerem dados "Normal" ou "não Normal". Os testes paramétricos são preferidos aos não paramétricos.
Testes comuns: teste T (emparelhado), Mann-Whitney U, ANOVA, Anderson-Darling, etc.
Outros termos incluem "significativo". É uma medida de se os dados indicam que sua hipótese é válida ou não. Quando você testa sua hipótese com um certo grau de probabilidade (normalmente 95%), um "valor-p" menor que 0,05 indicaria que você rejeitaria sua "hipótese nula" (ou seja, os conjuntos de dados não são diferentes) e aceitaria a sua " hipótese alternativa "(isto é, os conjuntos de dados são diferentes).
fonte
Inclinado nas estatísticas implica em distribuição assimétrica.
Na linguagem comum, e mesmo na ciência, a inclinação é frequentemente usada (e cada vez mais?) Para significar o que as pessoas estatísticas normalmente chamam de tendenciosa , como em "Os resultados para a altura média são distorcidos, incluindo tantos jogadores de basquete".
fonte
Estimativa - nas estatísticas, é o resultado de um cálculo. Por exemplo, a média da amostra é uma estimativa da média da população e o intervalo de confiança de uma média é uma estimativa do intervalo da média da população. Ambos são resultados de cálculos exatos. A "estimativa" é uma generalização precisa de tentar fazer uma inferência sobre uma população a partir de dados em uma amostra.
No uso comum, a palavra estimativa significa um palpite ou palpite informado ou o resultado de um cálculo aproximado.
fonte
Probabilidade - na linguagem comum, o sinônimo de probabilidade , mas nas estatísticas que têm uma relação inversa específica com a probabilidade, em que, para qualquer conjunto de parâmetrosθ e conjunto de dados X , L (θ | X) = Pr ( X| θ) .
Representante - tem vários significados às vezes conflitantes tanto na linguagem cotidiana quanto na científica. Consulte Kruskal & Mosteller 1979a , 1979b , 1979c e 1980 . A maioria dos estatísticos que conheço consideraria um representante da amostra se fosse amostrado com probabilidade conhecida; a maioria dos leigos que conheço consideraria representativo se as distribuições marginais fossem semelhantes à população.
fonte
Amostra : enquanto nas estatísticas isso se refere a um conjunto de casos , em muitas outras disciplinas uma amostra é uma amostra física . Obviamente, o tamanho da amostra também é ambíguo, referindo-se ao número de casos na amostra estatística ou ao tamanho físico (massa, volume, ...) da amostra.
Sensibilidade : para diagnósticos médicos, a fração de casos de doenças reconhecida pelo teste. Em química analítica: a inclinação da curva de calibração (veja abaixo).
Especificidade : em diagnósticos médicos, a fração de casos não relacionados a doenças é corretamente reconhecida pelo teste. Na química analítica, um método é específico se não houver sensibilidades cruzadas.
Calibração : na verdade, dois significados já estão listados para estatísticas no artigo da Wiki. Em química e física, o significado da regressão reversa é o usual. Porém, surge uma confusão:
(Na prática, muitas vezes é possível dizer que o erro no
Conjunto de validação : aqui eu gostaria de chamar a atenção para um uso potencialmente confuso de termos que, acredito, já surgem nos diferentes campos relacionados a estatísticas, embora eu volte a contrastar. No contexto de validação aninhada / dupla ou otimização versus validação / teste, uma linha de terminologia divide o treinamento - validação - teste e usa o conjunto de "validação" para otimização de hiperparâmetros.
Por exemplo, nos elementos de aprendizagem estatística, p. 222 na 2ª ed. :
Por outro lado, por exemplo, na validação de química analítica é o procedimento que demonstra que o modelo (na verdade, a avaliação do modelo final é apenas parte da validação de um método analítico) funciona bem para a aplicação e mede seu desempenho, ver, por exemplo, John K. Taylor: Validação de métodos analíticos, Analytical Chemistry 1983 55 (6), 600A-608A ou diretrizes de instituições como a FDA. Isso seria "teste" na outra linha de terminologia, onde a "validação" é realmente usada para otimização.
A diferença crucial é que os resultados da "validação de otimização" devem ser usados para alterar (selecionar) o modelo, enquanto as alterações em um método analítico validado (incluindo o modelo analítico de dados) significam que você deve revalidar (ou seja, prove que o método ainda funciona como deveria funcionar).
Se você precisar conversar com químicos, uma boa referência à terminologia da química analítica é Danzer: Química Analítica - Fundamentos Teóricos e Metrológicos, DOI 10.1007 / b103950
fonte