Existem lições estatísticas do episódio "Código da Bíblia"

31

Embora essa pergunta seja um pouco subjetiva, espero que seja qualificada como uma boa pergunta subjetiva, de acordo com as diretrizes do FAQ . É baseado em uma pergunta que Olle Häggström me fez há um ano e, embora eu tenha algumas idéias sobre isso, não tenho uma resposta definitiva e gostaria de receber ajuda de outras pessoas.

Fundo:

Um artigo intitulado "Sequências equidistantes de letras no livro de Gênesis", de D. Witztum, E. Rips e Y. Rosenberg, fez a extraordinária alegação de que o texto hebraico do Livro de Gênesis codifica eventos que não ocorreram até milênios após o texto foi escrito. O artigo foi publicado pela "Statistical Science" em 1994 (Vol. 9 429-438) e foi oferecido como um "quebra-cabeça desafiador" cuja solução pode contribuir para o campo da estatística.

Em resposta, outro artigo intitulado "Resolvendo o quebra-cabeça do código bíblico" de B. McKay, D. Bar-Natan, M. Bar-Hillel e G. Kalai apareceu na ciência estatística em 1999 (Vol. 14 (1999) 150-173) . O novo artigo argumenta que o caso de Witztum, Rips e Rosenberg é fatalmente defeituoso, de fato que seu resultado reflete apenas nas escolhas feitas ao projetar seu experimento e coletar os dados para ele. O artigo apresenta ampla evidência em apoio a essa conclusão.

(Meus próprios interesses, resumidos na Seção 8 do nosso artigo, estão detalhados em outro relatório técnico com Bar Hillel e Mckay, intitulado "Os dois famosos experimentos com rabinos: quão semelhante é muito semelhante?", Consulte também este site .)

As questões:

A pergunta específica de Olle Häggström era:

"Uma vez sugeri que seu artigo poderia ser útil em um curso de estatística em nível avançado de graduação, com o objetivo de ilustrar as armadilhas da mineração de dados e técnicas relacionadas. Você concorda?"

Além da pergunta de Olle, deixe-me fazer uma pergunta mais geral.

Existe algo relacionado às estatísticas que aprendemos (incluindo talvez algumas perguntas interessantes a serem feitas) do episódio do Código da Bíblia.

Só para esclarecer, minha pergunta é restrita a informações relacionadas a estatísticas e não a qualquer outro aspecto deste episódio.

Gil Kalai
fonte
Este é um assunto interessante. Estou curioso para saber por que você (McKay et al 1999) escolheria 'Guerra e Paz' como um controle, em vez de, por exemplo, seqüências aleatórias de letras (talvez ponderadas pelas frequências observadas). Em outras palavras, é suficiente que o texto seja suficientemente longo ou precisa ser suficientemente longo e compreensível (ou suficientemente longo e com algum valor literário)?
David LeBauer
2
David, a escolha de "Guerra e paz" como um texto de controle (mais precisamente o início da tradução hebraica de "Guerra e paz" do mesmo tamanho que o livro de Gênesis) foi feita pelos pesquisadores originais. A história de acordo com Aumann é a seguinte: Quando Bob Aumann, que seguiu cuidadosamente o experimento, contou a Kenneth Arrow sobre as maravilhosas descobertas em "Genesis", Arrow perguntou o que dizer de "Guerra e Paz". Aumann então começou a relatar sobre a guerra e a situação de paz em Israel, mas descobriu-se que o que Arrow perguntou era se o mesmo fenômeno não pode ser encontrado em "Guerra e Paz".
Gil Kalai
1
O episódio do código da Bíblia seria uma boa ilustração dos pontos fortes da visão bayesiana da probabilidade. Em particular, o fator Bayes é insuficientemente grande, dado que atribuiríamos uma pequena probabilidade anterior a . (Sendo H a hipótese de existir algum mecanismo pelo qual os acontecimentos do mundo são codificados na Bíblia.)P ( H )P(D|H)/P(D|notH)P(H)
charles.y.zheng
A propósito, você é livre para postar suas próprias respostas. Eu ficaria muito interessado, pois você presumivelmente passou por muitas análises de toda a experiência.
Iterator
Caro Iterador, sim, sim, pretendo fazê-lo ao mesmo tempo.
Gil Kalai

Respostas:

1

Aparentemente não, se você considerar que isso ainda não foi respondido.

Mais seriamente: na verdade, houve algumas idéias na pergunta e nos comentários. O principal insight parece ser que você precisa de um controle se quiser demonstrar que algo é incomum.

Thomas Levine
fonte
-1. Isso realmente não responde à pergunta e deveria ter sido um comentário.
Ameba diz Reinstate Monica