Já tive cursos suficientes de estatística durante meus anos de escola e na universidade. Eu tenho um entendimento justo dos conceitos, como IC, valores de p, interpretação da significância estatística, testes múltiplos, correlação, regressão linear simples (com mínimos quadrados) (modelos lineares gerais) e todos os testes de hipótese. Eu tinha sido apresentado a ele muitos dos dias anteriores, principalmente matematicamente. Ultimamente, com a ajuda do livro Bioestatística Intuitiva , compreendi e compreendi sem precedentes a teoria conceitual real, acredito.
Agora, o que acho que falta é a compreensão dos modelos de ajuste (estimativa de parâmetros para o modelo) e similares. Em particular, conceitos como estimativa de máxima verossimilhança, modelos lineares generalizados , abordagens bayesianas da estatística inferencial sempre me parecem estranhos. Não há exemplos ou tutoriais suficientes ou conceitualmente sólidos, como se poderia encontrar em modelos probabilísticos simples ou em outros tópicos (básicos) da Internet.
Eu sou um bioinformático e trabalho com dados de RNA-Seq que lida com contagens brutas de leitura para encontrar, digamos, expressão gênica (ou expressão gênica diferencial). Pela minha formação, mesmo que eu não esteja familiarizado com modelos estatísticos, sou capaz de entender o motivo de uma suposição de distribuição de poisson e binômios negativos e assim por diante. Eu acredito que tenho o background necessário para entender.
Acho que o que estou pedindo é uma abordagem que alguns especialistas considerem úteis e (a) livro (s) que me ajudem a entender esses conceitos de uma maneira mais intuitiva (não apenas matemática rigorosa, mas teoria apoiada na matemática). Como vou aplicá-las principalmente, eu ficaria satisfeito (no momento) com a compreensão do que é o quê e, mais tarde, posso voltar a provas matemáticas rigorosas ... Alguém tem alguma recomendação? Não me importo de comprar mais de um livro se os tópicos solicitados estiverem realmente dispersos para serem abordados em um livro.
Muito obrigado!
Respostas:
Você encontrará tudo o que não é bayesiano sobre as estratégias de modelagem de regressão de Frank Harrell . Gostaria de deixar recomendações bayesianas para pessoas mais informadas (embora eu tenha Gelman, Carlin, Stern e Rubin , assim como Gilks, Richardson e Speigelhalter , na minha estante). Deveria haver alguns livros biostáticos bayesianos no mercado.
Atualização: McCullach e Nelder (1989) é um livro clássico sobre GLMs, é claro. Foi inovador para a época, mas acho francamente entediante. Além disso, ele não cobre as adições posteriores, como diagnóstico residual, modelos inflados a zero ou extensões hierárquicas / multiníveis. Hardin e Hilbe (2007) cobrem algumas dessas coisas mais recentes em bons detalhes com exemplos práticos em Stata (onde GLMs e extensões são muito bem implementadas; Hardin costumava trabalhar na Stata Corp. escrevendo muitos desses comandos, além de contribuir para o estimador sanduíche).
fonte
Eu recomendaria dois livros seguintes:
fonte