Estatísticas e Big Data

56
O “híbrido” entre as abordagens de Fisher e Neyman-Pearson para o teste estatístico é realmente uma “confusão incoerente”?

Existe uma certa escola de pensamento segundo a qual a abordagem mais difundida dos testes estatísticos é um "híbrido" entre duas abordagens: a de Fisher e a de Neyman-Pearson; essas duas abordagens, afirma a alegação, são "incompatíveis" e, portanto, o "híbrido" resultante é uma "confusão...

56
Desafios da indústria versus Kaggle. A coleta de mais observações e o acesso a mais variáveis ​​são mais importantes que a modelagem extravagante?

Eu espero que o título seja auto-explicativo. No Kaggle, a maioria dos vencedores usa o empilhamento com algumas vezes centenas de modelos de base, para extrair alguns% extra de MSE, precisão ... Em geral, na sua experiência, o quão importante é a modelagem sofisticada, como empilhar versus...

55
Teste de Wald para regressão logística

Tanto quanto eu entendo, o teste de Wald no contexto da regressão logística é usado para determinar se uma determinada variável preditora é significativa ou não. Rejeita a hipótese nula do coeficiente correspondente sendo zero.XXX O teste consiste em dividir o valor do coeficiente pelo erro padrão...