Estou prestes a apresentar a tabela normal padrão na minha aula de estatística introdutória, e isso me fez pensar: quem criou a primeira tabela normal padrão? Como eles fizeram isso antes da chegada dos computadores? Estremeço ao pensar em alguém de força bruta calculando mil somas de Riemann à mão.
normal-distribution
algorithms
history
tables
Daniel Smolkin
fonte
fonte
Respostas:
Laplace foi o primeiro a reconhecer a necessidade de tabulação, apresentando a aproximação:
A primeira tabela moderna da distribuição normal foi posteriormente construída pelo astrônomo francês Christian Kramp em Analyse des Réfractions Astronomiques et Terrestres. . Das Tabelas Relacionadas à Distribuição Normal: Uma Breve História Autor (es): Herbert A. David Fonte: The American Statistician, vol. 59, n. 4 (novembro de 2005), pp. 309-311 :
Mas ... quão preciso ele poderia ser? OK, vamos considerar2.97 como exemplo:
Surpreendente!
Vamos para a expressão moderna (normalizada) do pdf gaussiano:
Fantástico!
Tão perto...
A coisa é ... quão perto, exatamente? Depois de todos os votos recebidos, não pude deixar a resposta real em suspenso. O problema era que todos os aplicativos de reconhecimento óptico de caracteres (OCR) que eu experimentei estavam incrivelmente desanimados - não surpreende se você deu uma olhada no original. Por isso, aprendi a apreciar Christian Kramp pela tenacidade de seu trabalho, enquanto digitava pessoalmente cada dígito na primeira coluna de sua Table Première .
Após uma ajuda valiosa do @Glen_b, agora ela pode ser muito precisa e está pronta para copiar e colar no console do R neste link do GitHub .
Aqui está uma análise da precisão de seus cálculos. Prepare-se...
mean(abs(difference))
comdifference = R - kramp
:Na entrada em que seus cálculos eram mais divergentes em comparação com [R], o primeiro valor decimal diferente estava na oitava posição (cem milionésimos). Em média (mediana), seu primeiro "erro" foi no décimo dígito decimal (décimo bilionésimo!). E, embora ele não tenha concordado totalmente com [R] em nenhum caso, a entrada mais próxima não diverge até a treze entradas digitais.
mean(abs(R - kramp)) / mean(R)
(igual aall.equal(R[,2], kramp[,2], tolerance = 0)
):sqrt(mean(difference^2))
:Se você encontrar uma foto ou retrato de Chistian Kramp, edite esta publicação e coloque-a aqui.
fonte
Segundo HA [1], Laplace reconheceu a necessidade de tabelas da distribuição normal "já em 1783" e a primeira tabela normal foi produzida por Kramp em 1799.
No entanto, Kramp não usou essas séries de Laplace, pois havia uma lacuna nos intervalos em que elas poderiam ser úteis.
Para ser específico, citando as duas frases relevantes:
David indica que as tabelas foram amplamente usadas.
Então, em vez de milhares de somas de Riemann, foram centenas de expansões de Taylor.
Em uma nota menor, em uma pitada (travada com apenas uma calculadora e alguns valores lembrados da tabela normal), apliquei com êxito a regra de Simpson (e regras relacionadas à integração numérica) para obter uma boa aproximação de outros valores; não é tudo que tedioso para produzir uma tabela * abreviado para alguns números de precisão. [Porém, produzir tabelas com a escala e a precisão de Kramp seria uma tarefa bastante grande, mesmo usando um método mais inteligente, como ele fez.]
* Por uma tabela abreviada, quero dizer uma em que você pode se basear na interpolação entre valores tabulados sem perder muita precisão. Se você quer apenas dizer precisão de cerca de 3 dígitos, realmente não precisa calcular todos esses valores. Usei efetivamente a interpolação polinomial (mais precisamente, técnicas de diferenças finitas aplicadas), que permitem uma tabela com menos valores do que a interpolação linear - se um pouco mais de esforço na etapa de interpolação - e também fiz interpolação com uma transformação de logit, que torna a interpolação linear consideravelmente mais eficaz, mas é muito útil se você tiver uma boa calculadora).
[1] Herbert A. David (2005),
"Tabelas Relacionadas à Distribuição Normal: Uma Breve História"
The American Statistician , vol. 59, n. 4 (nov.), Pp. 309-311
[2] Kramp (1799),
Analyse des Réfractions Astronomiques et Terrestres,
Leipzig: Schwikkert.
fonte
Questão interessante! Penso que a primeira ideia não surgiu através da integração de fórmulas complexas; antes, o resultado da aplicação dos assintóticos na combinatória. O método de caneta e papel pode levar várias semanas; não é tão difícil para Karl Gauss em comparação com o cálculo da torta para seus antecessores. Eu acho que a ideia de Gauss foi corajosa; o cálculo foi fácil para ele.
Exemplo de criação da tabela z padrão a partir do zero:
1. Pegue uma população de n (digamos que n seja 20) e liste todas as amostras possíveis de tamanho r (digamos que r seja 5).
2. calcular as médias da amostra. Você obtém médias de amostra nCr (aqui, 20c5 = 15504 significa).
3. Sua média é igual à média da população. Encontre o stdev das médias da amostra.
4. Encontre z escores das médias da amostra usando as médias pop e stdev das médias da amostra.
5. Classifique z em ordem crescente e encontre a probabilidade de z estar em um intervalo em seus valores de nCr z.
6. Compare valores com tabelas normais. N menor é bom para cálculos manuais. N maior produzirá aproximações mais próximas dos valores normais da tabela.
O código a seguir está em r:
Probabilidade de z cair entre 0 e valor positivo q abaixo; compare com uma tabela conhecida. Manipule q abaixo entre 0 e 3.5 para comparar.
fonte