Simplificando: existem diferenças nas abordagens bayesiana e freqüentista da análise exploratória de dados?
Não conheço nenhum viés inerente nos métodos de EDA, pois um histograma é um histograma, um gráfico de dispersão é um gráfico de dispersão etc., nem encontrei exemplos de diferenças em como a EDA é ensinada ou apresentada (ignorando um artigo particularmente teórico de A. Gelman) . Finalmente, olhei para o CRAN, o árbitro de todas as coisas aplicadas: não encontrei pacotes adaptados a uma abordagem bayesiana. No entanto, eu pensei que o CV poderia ter algumas pessoas que poderiam esclarecer isso.
Por que deveria haver diferenças?
Para iniciantes:
- Ao identificar distribuições anteriores apropriadas, não se deve investigar isso visualmente?
- Ao resumir os dados e sugerir a utilização de um modelo freqüentista ou bayesiano, a EDA não deveria sugerir que direção seguir?
- As duas abordagens têm diferenças muito claras sobre como lidar com modelos de mistura. Identificar que uma amostra provavelmente provém de uma mistura de populações é desafiador e está diretamente relacionado à metodologia usada para estimar os parâmetros da mistura.
- Ambas as abordagens incorporam modelos estocásticos e a seleção do modelo é orientada pela compreensão dos dados. Dados mais complexos ou modelos mais complexos exigem mais tempo na EDA. Com tais distinções entre modelos estocásticos ou processos geradores, existem diferenças nas atividades de EDA; portanto, não deveriam existir distinções decorrentes de diferentes abordagens estocásticas?
Nota 1: Não estou preocupado com as filosofias de nenhum dos "campos" - quero apenas solucionar quaisquer lacunas no meu kit de ferramentas e métodos EDA.
fonte
Eu acho que a EDA ajuda você a construir um modelo, fazer algumas suposições e (se necessário) atualizar o modelo e suas suposições. Eu seleciono uma abordagem pragmática para usar no ajuste e avaliação do modelo.
fonte