Perguntas com a marcação «validation»

14
logloss vs gini / auc

Treinei dois modelos (classificadores binários usando o h2o AutoML) e quero selecionar um para usar. Eu tenho os seguintes resultados: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685...

14
Quais são os estudos de caso na pesquisa de políticas de saúde pública em que estudos ou modelos não confiáveis ​​/ confusos / inválidos foram utilizados indevidamente?

Estou redigindo uma revisão de literatura sobre um problema de saúde pública atual em que os dados são confundidos: Quais são os estudos de caso históricos comuns usados ​​na educação em saúde pública / epidemiologia em que relações ou inferências inválidas ou confusas foram intencional ou...

13
Avaliar floresta aleatória: OOB vs CV

Quando avaliamos a qualidade de uma floresta aleatória, por exemplo, usando AUC, é mais apropriado calcular essas quantidades nas amostras fora da bolsa ou no conjunto de validação cruzada de espera? Ouvi dizer que calculá-lo sobre as amostras OOB oferece uma avaliação mais pessimista, mas não...

12
Você pode comparar diferentes métodos de armazenamento em cluster em um conjunto de dados sem uma verdade básica por validação cruzada?

Atualmente, estou tentando analisar um conjunto de dados de documento de texto que não tem nenhuma verdade. Disseram-me que você pode usar a validação cruzada k-fold para comparar diferentes métodos de armazenamento em cluster. No entanto, os exemplos que eu vi no passado usam uma verdade básica....