Acabei de assistir a uma palestra sobre inferência estatística ("comparando proporções e médias"), parte de uma introdução ao curso on-line de estatísticas. O material fez tão pouco sentido para mim como sempre (agora eu já deveria ter visto esse material dezenas de vezes, espalhado nas últimas três décadas).
Estou procurando um livro sobre "Estatísticas básicas-101" (estimativa pontual, avaliação estimada, inferência estatística, teste de hipóteses, desenho de estudo) que leve a sério o problema de convencer um leitor cético ...
Abaixo, dou alguns exemplos do tipo de pergunta que o autor que estou procurando levaria a sério e saberia lidar de maneira convincente.
Mas, primeiro, permita-me salientar que neste post não estou fazendo essas perguntas. Por favor, não responda! Dou-lhes apenas exemplos, e como "teste decisivo" (para o tipo de autor de pesquisa).
Se uma "proporção" é simplesmente a média de uma variável booleana (ou seja, que aceita apenas os valores 0 e 1), por que diferentes procedimentos são ensinados para fazer inferência estatística com "proporções" e com "meios"?
Se a distribuição normal é tão robusta que, assumindo a normalidade, obtém bons resultados, mesmo nos casos em que esses dados não são normalmente distribuídos normalmente, e se a distribuição t é tão normal, por que todo o barulho de usar a distribuição t em vez de normal?
O que exatamente são "graus de liberdade" e por que nos preocupamos com eles?
O que significa falar do valor "verdadeiro" de um parâmetro, considerando que estamos apenas usando distribuições que parecem semelhantes aos dados?
Por que a "análise exploratória de dados" é uma coisa boa, enquanto a "espionagem de dados" é uma coisa má?
Como já disse, fico impressionado com a atitude implícita na negligência de tais perguntas. Não é a "postura epistemológica" que quero ver em alguém que está me ensinando alguma coisa. Procuro autores que respeitem o ceticismo e a racionalidade do leitor e que sabem como abordá-los (sem necessariamente entrar em páginas e páginas de formalismos e detalhes técnicos).
Percebo que essa é uma tarefa difícil, e talvez especialmente quando se trata de estatística. Portanto, não espero que muitos autores tenham conseguido. Mas no momento eu ficaria satisfeito em encontrar apenas um .
Deixe-me acrescentar que não sou avesso à matemática. Pelo contrário, eu amo matemática. (Estou acostumado com a análise [aka "cálculo avançado"], álgebra linear, teoria das probabilidades e até teoria básica das medidas.)
Dito isto, meu interesse no momento está nas estatísticas "aplicadas", "práticas", "cotidianas" e "do mundo real" (em oposição às sutilezas teóricas). (Mas também não quero um livro de receitas!)
FWIW, li os primeiros capítulos da análise de dados usando modelos de regressão e modelos multiníveis / hierárquicos de Gelman e Hill, e gosto do tom dos autores. Seu foco é prático, mas entre na teoria quando necessário. Eles também costumam recuar e avaliar criticamente as práticas padrão, e oferecem opiniões sinceras que apelam ao bom senso de um leitor cético. Infelizmente, esses autores não escreveram um livro dedicado ao assunto sobre o qual estou perguntando neste post (material "Estatísticas 101", como descrito acima). Também estou ciente de que um desses autores (Gelman) foi co-autor da análise de dados Bayesiana, altamente conceituada , mas, novamente, não é isso que estou procurando no momento.
EDITAR:
Dikran Marsupial levanta a seguinte objeção:
Eu não acho que exista necessariamente algo errado em negligenciar as perguntas; chega um momento em que abordar todas as questões diminui a exposição dos conceitos básicos que geralmente são mais importantes (especialmente em um livro sobre estatísticas 101).
Eu concordo com isso. Seria mais preciso dizer que estou procurando uma "segunda olhada nas estatísticas básicas". De fato, com essa motivação, observei os livros didáticos usados nos cursos de graduação em inferência (por exemplo) e descobri que eles também negligenciavam questões como as que eu listei. Na verdade, eles pareciam ainda menos inclinados a se aprofundar em tais questões (para que pudessem se concentrar em assuntos como as condições para alguma convergência ou outra disso ou daquilo ...).
O problema é que os livros mais avançados são dirigidos a uma população radicalmente diferente de leitores, onde o "ceticismo do forasteiro" foi drasticamente esgotado. IOW, aqueles que estão fazendo estatísticas no nível da pós-graduação já passaram do ponto de se incomodarem com as perguntas que me incomodam. Eles não estão mais céticos sobre nada disso. (Como eles superaram a crise de ceticismo? Talvez alguns nunca tenham sido muito críticos em primeiro lugar, especialmente se eles aprenderam suas estatísticas bem cedo - eu sei que eu não era um calouro particularmente crítico, por exemplo, embora eu não tenha faça estatísticas. Outros podem ter professores que informaram onde seus livros ficaram aquém. Alguns podem ter sido espertos o suficiente para descobrir por si próprios as respostas a essas perguntas. Quem sabe.)
Respostas:
Você já tem boas sugestões. Aqui estão mais alguns. Primeiro, dois blogs que eu leio esporadicamente e onde perguntas como você se pergunta são discutidas algumas vezes. Como são blogs, você pode até fazer perguntas e obter respostas muito boas! Lá vem eles:
http://andrewgelman.com/ (Andrew Gelman)
http://errorstatistics.com/ (Deborah Mayo)
E alguns livros que acho que irão ajudá-lo: Box, Hunter & Hunter: Estatísticas para experimentadores.
Como o título diz, este é um ("primeiro", mas realmente, muito ... segundo) curso para pessoas que gostariam de projetar seus próprios experimentos e analisá-los. Muito alto na parte "por que".
Então: DR Cox: Principles of Statistical Inference, outro livro muito bom sobre o "por que" e não o "como".
E, como você pergunta por que os meios e as proporções são tratados de maneira diferente, aqui está um livro que não faz isso: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = livros & ie = UTF8 & qid = 1373395118 & sr = 1-1 & palavras-chave = freedman + statistics
Pouco em matemática, alto em princípios.
fonte
Duvido que exista um único livro que seja adequado a você, pois as pessoas tendem a ser céticas quanto a coisas diferentes, e os livros são escritos para um público-alvo, e não para indivíduos. Essa é uma das coisas boas de ser ensinado por uma pessoa, e não apenas um livro, que você pode fazer perguntas à medida que avança. Isso é algo bastante difícil de fazer em um texto linear.
Eu não acho que exista necessariamente algo errado em negligenciar as perguntas; chega um momento em que abordar todas as questões diminui a exposição dos conceitos básicos que geralmente são mais importantes (especialmente em um livro sobre estatísticas 101).
Suspeito que a melhor abordagem é obter um bom livro e procurar a resposta para perguntas não respondidas em outros lugares. Eu tenho uma estante cheia de textos estatísticos na minha frente, simplesmente porque nenhum deles isoladamente é tudo o que eu preciso (nem mesmo o livro de Jaynes; o).
Para o iniciante, acho que o livro de Grant Foster "Understanding Statistics" é um bom ponto de partida, mas suspeito que seja bastante básico nesse caso.
fonte
fonte
Abelson (1995), Estatística como argumento de princípios é introdutório e tem uma visão interessante de algumas das perguntas que frequentemente confundem os alunos.
Mas talvez você só precise ler alguns livros sobre estatística teórica (ignorando todo o material sobre convergência, espaços métricos etc.) e, mesmo que eles não respondam especificamente a perguntas como os seus exemplos, você poderá responder a maioria das perguntas. você mesmo e procure o resto, como sugere @Dikran.
Sugeri em outro tópico a leitura de Cox & Hinkley, Estatística Teórica ou Cox, Princípios de Inferência Estatística, juntamente com Casella & Berger, Inferência Estatística , para entender as diferentes perspectivas existentes.
fonte