Eu gostaria de saber ou ter referências sobre o processo de análise que a maioria dos analistas de dados estatísticos passa por cada projeto de análise de dados.
Se eu fizer uma "lista", para concluir o projeto de análise de dados, um analista deverá:
- primeiro colete os requisitos para o projeto,
- planejar / projetar sua análise de dados com base nesses requisitos antes
- na verdade, pré-processamento de dados,
- executando a análise de dados e
- escrevendo um relatório com base em seus resultados de análise.
Para esta pergunta, estou interessado em mais detalhes da Etapa 2. Mas entendo que isso não é praticamente claro, pois o analista pode ter que mudar seu plano ou design de acordo com a saída da análise de dados. Existe alguma referência sobre este assunto?
fonte
Eu achei o fluxo de trabalho de análise de dados usando Stata um bom livro, particularmente (mas não apenas) como usuário Stata. Descobri muito com o que discordar, mas mesmo isso ajudou a esclarecer por que faço as coisas de certas maneiras.
fonte
CRISP-DM , cunhado pela empresa SPSS (agora pertence à IBM) é um acrônimo para o processo de mineração de dados, que é o mesmo que para "análise de dados". O SAS tem um processo semelhante chamado SEMMA .
fonte