Perguntas com a marcação «overfitting»

O erro de modelagem (especialmente erro de amostragem) em vez de relacionamentos replicáveis ​​e informativos entre variáveis ​​melhora as estatísticas de ajuste do modelo, mas reduz a parcimônia e piora a validade explicativa e preditiva.

41
Random Forest - Como lidar com o excesso de ajustes

Tenho formação em ciência da computação, mas estou tentando me ensinar ciência de dados resolvendo problemas na internet. Eu tenho trabalhado nesse problema nas últimas duas semanas (aproximadamente 900 linhas e 10 recursos). Eu estava inicialmente usando regressão logística, mas agora mudei para...

25
Um modelo equipado demais é necessariamente inútil?

Suponha que um modelo tenha 100% de precisão nos dados de treinamento, mas 70% de precisão nos dados de teste. O argumento a seguir é verdadeiro sobre esse modelo? É óbvio que este é um modelo com excesso de ajuste. A precisão do teste pode ser aprimorada, reduzindo o sobreajuste. Mas, esse modelo...

20
Overfitting e Underfitting

Fiz algumas pesquisas sobre sobreaquecimento e desajustamento e compreendi o que elas são exatamente, mas não consigo encontrar os motivos. Quais são as principais razões para sobreajustar e não adequar? Por que enfrentamos esses dois problemas no treinamento de um

20
Discussão sobre overfit no xgboost

Minha configuração é a seguinte: Estou seguindo as diretrizes em "Modelagem Preditiva Aplicada". Assim, filtramos os recursos correlatos e terminamos com o seguinte: 4900 pontos de dados no conjunto de treinamento e 1600 pontos de dados no conjunto de teste. Eu tenho 26 recursos e o alvo é uma...