Quais tópicos de estatísticas freqüentes devo saber antes de aprender as estatísticas bayesianas?

8

Fiquei me perguntando se existe um subconjunto de tópicos de estatística freqüentista que se deve saber antes de começar a aprender estatística bayesiana. Uma vez eu li que parece que as duas tendências são antagônicas; como por exemplo, a análise freqüentista é fortemente baseada em suposições (hipóteses) feitas sobre os dados observados; enquanto as estatísticas bayesianas se baseiam mais na construção de um modelo anterior para inferir informações posteriores sobre ele.

De qualquer forma, quais tópicos de estatísticas freqüentes ou gerais devo conhecer antes de iniciar as estatísticas bayesianas?

Layla
fonte
"antagonista um do outro" -> "antagonista um do outro"?
Faheem Mitha 17/03/2015

Respostas:

6

Não é necessário chamá-lo de material freqüentista, mas material de probabilidade e estatística em geral.

Aqui estão alguns exemplos de conhecimento prévio que, na minha opinião, seriam úteis:

  1. O que são densidades, distribuições (condicionais), expectativas etc.?
  2. Algumas famílias distributivas específicas (Beta, normal, uniforme etc.)
  3. Muito provavelmente você desejará aplicar métodos bayesianos a dados reais, portanto, software estatístico. Meu favorito: R
  4. Alguma matemática: álgebra matricial, integração, ...
  5. Além disso, pode ser útil conhecer alguns modelos estatísticos, como o modelo linear .y=Xβ+u
  6. Dada a forte ênfase na probabilidade, não custa nada ouvir sobre a máxima probabilidade antes de

Sendo o paradigma bayesiano um subjetivo, tenho certeza que outros discordarão ou adicionarão a esta lista ...

Christoph Hanck
fonte
Portanto, sua resposta à pergunta "que tópicos freqüentistas devo aprender" é basicamente "nenhum"? Porque você explicitamente deixado de fora quaisquer tópicos frequentistas como hipóteses nulas e valores p ou em estimadores imparciais
Nikie
1
Bem, devo dizer que nunca conheci (ou pelo menos conversei com) alguém que aprendeu estatística bayesiana antes das estatísticas freqüentistas, mas essa seria minha opinião, sim, pois, de fato, esses tópicos são relativamente menos importantes do ponto de vista bayesiano . Obviamente, existem resultados em testes de hipóteses bayesianas e propriedades freqüentes de estimadores de Bayes (como imparcialidade). Mas eu argumentaria que estes não são necessários para começar a aprender, como você pediu.
Christoph Hanck 17/03/2015
10

Você não precisa aprender estatísticas 'freqüentistas' ou bayesianas em nenhuma ordem específica. Você deve primeiro aprender o que for necessário para entender as descobertas em seu campo e, em seguida, entender as relações matemáticas (computação) e filosóficas (interpretação) entre as técnicas. Não há professores como dados reais, portanto essa é sempre a primeira preocupação.

Não há motivo específico para você não poder aprendê-los ao mesmo tempo. É útil conhecer a essência do cálculo para Bayes, que é presumivelmente de onde vem sua reputação de ser "mais difícil", mas eu não diria que é necessário agora que temos um software muito melhor do que apenas alguns anos atrás. Se você é iniciante em estatística e deseja brincar com a estrutura freqüentista e bayesiana, posso recomendar o novo software JASP . Se você gosta de R, o pacote BayesFactor é sólido.

Se você deseja começar pelo frequentismo, sugiro saber o seguinte:

  1. A interpretação completa e exata de todos os itens a seguir.
  2. A relação entre valores-p, intervalos de confiança, tamanhos de amostra, potência e taxas de erro.
  3. A relação entre testes Z, testes t, análise de variância e regressão linear.
  4. A relação entre regressão linear e regressão não linear, bem como testes paramétricos versus não paramétricos.
  5. A relação entre variáveis ​​fictícias, contrastes e codificação de efeitos.
  6. A interpretação completa e exata de todos os itens anteriores.

Isso parece muito, mas essas coisas estão todas conectadas de maneiras fundamentais. Toda inferência se resume à mesma coisa essencial: queremos fazer previsões corretas sobre dados não observados, com base em um modelo de dados observados, comparando dois ou mais modelos. Fazemos isso calculando nossa confiança, para alguma definição de "confiança", em dois ou mais modelos e calculando a proporção. Na sua forma mais básica, é tudo.

Muita controvérsia é realmente sobre formalizar "confiança" e, embora seja uma discussão importante que eu estou feliz que estamos tendo, também não é algo que você precisa conhecer agora. Na estrutura freqüentista, são tomadas medidas especiais para criar um modelo nulo implícito a ser colocado no denominador, enquanto na estrutura bayesiana, ambos os modelos são declarados explicitamente, mas a saída e as interpretações reais para ambas as estruturas envolvem um grau substancial de subjetividade. Para o freqüentismo, está na construção da máxima probabilidade e na escolha da taxa de erro, e para os bayesianos, está no anterior. Todos devem aprender os dois, na minha opinião.

Christian Hummeluhr
fonte