John Kerrich Coin-flip Data

12

Alguém pode sugerir onde obter os resultados dos 10.000 lançamentos de moedas (ou seja, todas as 10.000 caras e coroas) realizados por John Kerrich durante a Segunda Guerra Mundial?

Thomas
fonte
1
Dado que ele estava trancado em uma prisão nazista na época, eu me pergunto se ele tinha papel suficiente para registrar todos os 10 mil resultados, ou se ele realmente apenas anotou os valores resumidos.
Corone
6
Os resultados do @Corone 10K podem ser facilmente gravados em uma folha de papel padrão usando, digamos, um código de barras e pontos (como em ||||..|....||.|..||.etc). Isso pode ser compactado usando (por exemplo) hexadecimal. No exemplo anterior, deixando |1 e .0, a representação hexadecimal é f21a6. Ao escrever caracteres pequenos mas visíveis, posso facilmente ajustar 50 desses caracteres em uma linha de escrita e 50 linhas em uma folha, representando assim uma sequência de 50 * 50 * 4 = 10.000 resultados.
whuber
2
@ Whuber haha, sim, comecei a ponderar coisas semelhantes após o meu comentário. Duvido que, na era pré-computador, o hexadecimal tivesse surgido na mente como acontece agora, embora o octal ainda lhe desse uma chance. Ainda assim, tentei pontuar e correr sozinho, conseguindo mais de 100 em uma folha, por isso, se ele usasse os dois lados, 10K se encaixariam. Talvez seja por isso que ele parou em 10K!
Corone
Uma prisão nazista, sim, mas na Dinamarca, não era um campo de extermínio ...
kjetil b halvorsen
@kjetilbhalvorsen - na verdade um campo de prisioneiros dinamarquês em Hald com guardas dinamarqueses etc. para proteger os internos dos alemães
Henry

Respostas:

13

Eu nunca tinha ouvido falar de Kerrich antes ... que história bizarra. A digitalização de livros do Google (compartilhada por reftt) de "Uma introdução experimental à teoria da probabilidade" não parece incluir o corpo do texto. Sentindo-me um pouco antiquado, chequei uma cópia da edição de 1950 da biblioteca.

Digitalizei algumas páginas que achei interessantes. As páginas descrevem suas condições de teste, dados dos primeiros lançamentos de moedas de 2000 e dados dos primeiros 500 de uma série de 5000 experimentos de urna com sons igualmente implausíveis (com 2 bolas de pingue-pongue vermelhas e 2 verdes).


Reconhecimento de texto (e alguma limpeza) usando o Mathematica 9 fornece essa sequência de 2000 caudas (0) e cabeças (1) da Tabela 1. A contagem de cabeças de 1014 é uma mais que 502 + 511 = 1013 na Tabela 2, portanto o reconhecimento foi imperfeito, mas parece muito bom - pelo menos tem o número certo de caracteres! (Leitores de olhos afiados são convidados a corrigi-lo.)

Aqui está um resumo gráfico dessa caminhada aleatória, seguido pelos próprios dados. A diferença acumulada entre as contagens de cabeça e cauda prossegue da esquerda para a direita, cobrindo todos os resultados de 2000.

Figura

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111
Bill Bradley
fonte
3
Seja bem-vindo. Sobreponha uma plotagem desses dados na sua imagem digitalizada, esperando que isso tornasse óbvias as discrepâncias, mas não consigo encontrar nenhuma diferença. Ou não há erros e Kerrich contado mal ou eu simplesmente não consigo encontrar o erro, mas em qualquer caso, os dados publicados aqui são uma renderização de texto exato da sua Tabela 1.
whuber
4

Esta apresentação mostra os dados para intervalos definidos de lançamentos. Também faz referência à fonte primária de Kerrich.


fonte
2
A fonte dos dados (resumo) dessa apresentação é Freedman, Pisani, & Purves Statistics (qualquer edição). No entanto, é apenas um resumo, não uma conta de todos os resultados solicitados aqui. Kerrich publicou seus resultados em 1946 em um pequeno livro; O Google digitalizou .
whuber
Como eu disse, ele possui dados para "intervalos de lançamentos" e a apresentação faz referência à monografia de Kerrich, onde ele publicou seus resultados. Não sei se Kerrich publicou uma lista de todos os seus lançamentos. Achei que isso era pelo menos mais útil do que apenas a proporção geral.
@ whuber: sim, essa foi a monografia mencionada na apresentação. parece ter disponibilidade limitada. alguém encontrou um pdf?
2

Há outra referência de Kerrich no livro "Encontros de sorte: um primeiro curso em análise e inferência de dados", de Chris Wild e George Seber, que afirma no capítulo 4 (pode fazer o download do suplemento desta página ) que os dados são publicados em Kerrich [1964] e Freedman [1991, Tabela 1, p. 248] O livro de Kerrich é provavelmente uma Introdução Experimental à Teoria da Probabilidade , e Freedman é o mesmo livro já mencionado. Duvido que a monografia de 1964 contenha mais dados do que a de 1946.

reftt
fonte
2

Esse livro de Kerrich pode ser comprado usado na Amazon, mas o preço cotado é bastante rígido!

Uma opção melhor é https://openlibrary.org.
Você precisa criar uma conta lá e instalar o Adobe Digital Editions para ler o livro. (parece que nenhum outro programa serve, o livro baixado possui DRM, gerenciamento de restrições digitais). Então você pode baixar ("emprestar") o livro. Estou lendo agora. Acho que posso tirar uma cópia da tela das páginas com os resultados e usar o ocr nisso. Para mais tarde ...

(Não, eu fui rápido no livro, parece que apenas os primeiros lançamentos de 2000 são dados individualmente, mas existem muitas tabelas diversas com resumos dos arremessos. Existem também tabelas para algumas outras experiências, como desenhar bolas de uma urna , no mesmo espírito.

kjetil b halvorsen
fonte
3
Não está claro se você notou que os primeiros resultados individuais de 2000 já estão disponíveis neste tópico na resposta de Bill Bradley . O livro aparece nos livros do Google. Forneci um link em outro comentário . Atualmente, o Google vincula outras livrarias, além da Amazon, onde o preço cotado (incluindo frete) é consideravelmente mais barato.
whuber
Obrigado, observei os lançamentos de 2000, quando disponíveis acima, mas esperava encontrar mais no próprio livro. Parecem não. Não consigo ler o livro via google books, talvez esse acesso dependa da geografia? By the way, eu agora voltou meu empréstimo do Open Library, para que outros possam tentar ...
b Kjetil Halvorsen
1
Tentei a mesma coisa quando este tópico apareceu, com os mesmos resultados negativos. :-( Eu não quis dizer que realmente podemos ler a versão nos livros do Google: é apenas uma espécie de pesquisa. O principal valor do GB (pelo menos até que a política do Google mude) é fornecer links para locais onde poderíamos comprá-lo.
whuber
1

Me deparei com isso ao fazer uma pesquisa de fundo sobre Kerrich. Peguei os dados da resposta de Bill Bradley - realmente aprecio que os dados foram digitalizados! Adicionei os dados ao pacote R que uso no ensino, disponível no GitHub .

chris prener
fonte