Ao ensinar estatística, use "normal" ou "gaussiano"?

42

Eu uso principalmente "distribuição gaussiana" em meu livro, mas alguém sugeriu que eu mudasse para "distribuição normal". Algum consenso sobre qual termo usar para iniciantes?

Obviamente, os dois termos são sinônimos , portanto não se trata de substância, mas apenas de qual termo é mais comumente usado. E é claro que eu uso os dois termos. Mas qual deve ser usado principalmente?

Harvey Motulsky
fonte
1
Existe uma seção de visualização / capítulo de amostra do seu livro disponível em algum lugar? Eu ouço coisas boas sobre isso.
Glen_b
2
@Glen_b O recurso "Look inside" do amazon.com permite que você visualize o livro. Além disso, três capítulos estão disponíveis aqui: intuitivebiostatistics.com/excerpts
Harvey Motulsky
6
A questão de "qual termo é mais comumente usado" pode ser facilmente abordada, embora de forma grosseira: uma pesquisa no Google de distribuição "Gaussiana" possui cerca de 2/3 dos resultados de uma pesquisa por "distribuição normal". A proporção é um pouco diferente no Google Scholar, onde agora a "distribuição gaussiana" tem metade dos acertos da "distribuição normal" (mas apenas um quarto quando a "inversa" é excluída). Esses resultados sugerem (1) "normal" é mais popular, mas (2) "gaussiano" é amplamente reconhecido. Observar os resultados sugere que frases como "assintoticamente normais" podem levar muito tempo para serem substituídas, se é que alguma vez.
whuber
2
Na extensão do @whuber, acho que também há uma diferença entre os campos: "gaussiano" parece relativamente mais predominante na ciência, enquanto "normal" parece ser o termo normal nas ciências sociais ...
abaumann
1
Tente "anormal": P
Mehrdad

Respostas:

47

Mesmo tendo a dizer 'normal' com mais frequência (já que foi o que aprendi quando aprendi pela primeira vez), acho que "gaussiano" é uma escolha melhor, desde que os alunos / leitores estejam familiarizados com os dois termos:

  • O normal não é particularmente típico, então o próprio nome é enganoso. Certamente desempenha um papel importante (principalmente por causa do CLT), mas os dados observados são muito menos frequentemente particularmente próximos de Gauss do que às vezes é sugerido.

  • A palavra (e palavras associadas como "normalizar") tem vários significados que podem ser relevantes nas estatísticas (considere "base ortonormal", por exemplo). Se alguém disser "normalizei minha amostra", não sei ao certo se eles se transformaram em normalidade, computaram escores z, escalaram o vetor para o comprimento da unidade, para o comprimento ou várias outras possibilidades. Se tendemos a chamar a distribuição de "gaussiana", pelo menos a primeira opção é eliminada e algo mais descritivo a substitui.n

  • Gauss, pelo menos, tem um grau razoável de reivindicação à distribuição.

Glen_b
fonte
3
+1 no bit "desde que os alunos / leitores estejam familiarizados com os dois termos". Eu acho que seria um desserviço para os alunos ensinar apenas "gaussiano", apenas porque "normal" é tão difundido.
Patrick Coulombe
6
Concordo que temos que ensinar os dois. Se estivéssemos começando do zero e soubéssemos o que sabemos agora, nunca permitiríamos que "normal" emergisse, porque (1) o termo está sobrecarregado de qualquer maneira (2) o normal (gaussiano) não é normal (usual ou esperado) De dados. "Gaussiano" é a alternativa mais comum, embora exista uma história antes de Gauss. ET Jaynes sugeriu "central", o que é uma ótima idéia, mas não pegou. (I reconhecer os argumentos que são baseados no teorema do limite central.)
Nick Cox
No que diz respeito ao item 2, quando se trata de ciência e matemática mais amplas como um todo, não está necessariamente claro se " normal " ou " Gauss " é mais comum. ;-)
cardeal
@ cardinal - Concordo plenamente com a sugestão de que ela tende a se inclinar muito mais para o "gaussiano" nessas áreas - e eu acrescentaria a engenharia também.
Glen_b
1
@Glen_b: Concordado. (No meu modelo mental, que incluem engenharia sob a égide geral da ciência, no entanto, que é, talvez, um pouco fora do, ahem, norma.) :-)
cardeal
36

Eu usaria gaussiano.

Um problema que as pessoas aprendem estatística é que usamos palavras em inglês comuns para significar coisas diferentes (poder, significância, distribuição, etc.). Na medida em que possamos minimizar isso, deveríamos. "Normal" já tem vários significados.

Peter Flom - Restabelece Monica
fonte
2
Peter: eu concordo. É por isso que sempre usei "gaussiano". Porém, um comentário de um revisor sobre a nova edição (concisa) pressionou fortemente "normal".
Harvey Motulsky
25

Um argumento a favor do normal é a notação entrincheirada de para a distribuição, na qual N significa "normal". Não vi ninguém propor mudar isso para G ( μ , σ 2 ) .N(μ,σ2)NG(μ,σ2)

Nate Eldredge
fonte
1
provavelmente conflito com Gamma, assim, que deve ser denotado Γ mas infelizmente que é tomada pela função com o mesmo nome. Uma alternativa pode ser L um u s s ou L um u s s i a n , o que também seria consistente com B e r n o u l l i e o abbrevation frequente de b i n o m i a l a b i n o mGΓGumavocêssGumavocêssEuumanBernovocêeueuEubEunomEuumaeubEunom. Mas, na verdade, gosto da notação , porque a escrevo constantemente e é uma carta fácil de rabiscar. N
Shadowtalker 9/09/14
Esse é um argumento justo, embora, se ambos os termos forem apresentados, o uso de possa ser introduzido então. N
Glen_b
8
Deixe- ;-)GN(μ,σ2)
Stéphane Laurent
1
N(μ,σ2)
10

Em alemão, é freqüentemente chamado de Gaußsche Normalverteilung, portanto é quase impossível entrar em conflito facilmente.

Seria apropriado combinar gaussian e normal ?

gismo141
fonte
8
Talvez gnormalfuncione em inglês!
Dilip Sarwate
2
@DilipSarwate 𝅘𝅥𝅮 Eu sou um gnormal, outro normal ap (desculpas aos senhores. Flanders e Swann)
hobbs
9

De acordo com a enciclopédia Wolfram :

Enquanto estatísticos e matemáticos usam uniformemente o termo "distribuição normal" para essa distribuição, os físicos às vezes o chamam de distribuição gaussiana e, devido à sua forma curvada e alargada, os cientistas sociais se referem a ele como "curva do sino".

Concordo que "normal" é mais fácil de confundir - mas suspeito que os livros de estatística usem "normal".

Gerenuk
fonte
+1 para uma resposta que é descritiva e não prescritiva. Na verdade, concordo com as outras respostas de que o Gaussian é preferível, não importa qual campo, mas é informativo começar do contexto do que é difundido no uso existente.
R ..
Quanto à frase "curva do sino", eu a evitaria inteiramente em qualquer ambiente de ensino. Ele tem implicações altamente racistas como resultado do infame livro com o mesmo nome, e qualquer um de seus alunos que está ciente disso provavelmente será distraído por ele e associará o que você está dizendo a teorias sem sentido sobre superioridade racial, em vez de ter o sujeito permanece por si próprio.
R ..
@R .. Descritivo, sim, mas essa descrição é diretamente contradita pelas respostas aqui, que indicam que uma fração significativa de estatísticos e matemáticos realmente usa o termo "Gaussiano".
precisa saber é o seguinte
Outro motivo para não usar o termo "curva de sino" para denotar a (função de densidade da) distribuição gaussiana / normal é que existem muitas distribuições cuja função de densidade de probabilidade (pdf) se assemelha a uma curva de sino. Até o pdf de uma distribuição Cauchy parece uma curva em forma de sino!
Mico
+1 para explicar termos relativos em diferentes disciplinas. Obrigado!
Entusiasta
7

Gostaria de salientar que S. Stigler usa a distribuição Normal / Gauss / Laplace-Gauss para provar a 'Lei de eponímia de Stigler' publicada em Statistics on the Table (algumas páginas estão disponíveis no books.google ).

Particularmente interessante e relevante para essas perguntas é que, nas páginas 287-288, existem tabelas do uso histórico de 'Normal' vs 'Gauss' vs 'Laplace' e parece que, ao longo dos anos, o uso passou de 2:15 a favor de normal em 1816-1884 a 8:14 (1888-1917) a 5:17 (1919-1939) a 9:10 (1947-1976).

Então, de acordo com isso, o uso de 'normal' vs 'Gauss' está ficando mais igual. Ou se você acredita que a tendência continuará, o 'Gauss' vencerá o 'normal' em 50 a 100 anos.

pes
fonte
5

Uma resposta que ainda não vi entre todas as boas respostas:

Geralmente uso "normal" por razões de familiaridade anterior, mas gosto de colocar em maiúscula para enfatizar seu significado técnico: "... se os dados são normalmente distribuídos ..." (não sei se copiei essa prática de em outro lugar ou (re) inventei eu mesmo)

Ben Bolker
fonte
5

Qual usar depende do nível de estatística que está sendo ensinado. Infelizmente, minha experiência de ensino indica que a maioria dos estudantes de graduação nunca entende completamente o conceito de distribuição de probabilidade. No entanto, todos eles precisam, de alguma forma, se familiarizar com o CLT e maneiras de pensar sobre a incerteza. Para uma turma de graduação, o Normal é preferível porque não adiciona a ansiedade de uma nova palavra desconhecida. Para os estudantes de pós-graduação, Gaussian é o preferido por causa de toda a confusão acima mencionada sobre a normalização e o contexto histórico que ela fornece. Dou aulas de pesquisa de graduação que exigem duas aulas de estatística de pré-requisito e todos os livros de graduação que eu vi usados ​​nos últimos 30 anos usaram Normal.

TJ Olney
fonte
1
"a maioria dos estudantes de graduação nunca entende completamente o conceito de distribuição de probabilidade" +1
Code-Guru
4

O nome normalveio de algumas das observações de que os erros se comportam normalmente. Você encontrará mais detalhes aqui . Se esse for o motivo para chamar essa distribuição de distribuição normal, isso poderá criar uma nova confusão, como ocorre na distribuição normal de contagens de acidentes poisson. Acredito que devemos seguir em frente e começar a chamá-lo de Gaussianalternativa.

Mahbubul Majumder
fonte