Me deparei com uma pergunta simples sobre a comparação de modelos flexíveis (ou seja, splines) versus modelos inflexíveis (por exemplo, regressão linear) em diferentes cenários. A questão é:
Em geral, esperamos que o desempenho de um método flexível de aprendizado estatístico tenha um desempenho melhor ou pior que um método inflexível quando:
- O número de preditores é extremamente grande e o número de observações é pequeno? n
- A variação dos termos do erro, ou seja, , é extremamente alta?
Penso em (1), quando é pequeno, modelos inflexíveis são melhores (não tenho certeza). Para (2), não sei qual modelo é (relativamente) melhor.
machine-learning
model
alittleboy
fonte
fonte
Respostas:
Nessas 2 situações, o desempenho comparativo flexível versus modelo inflexível também depende de:
Se a relação for próxima de linear e você não restringir a flexibilidade, o modelo linear deverá fornecer um erro de teste melhor em ambos os casos, porque o modelo flexível provavelmente se ajustará em excesso nos dois casos.
Você pode vê-lo assim:
Se, no entanto, a verdadeira relação for muito não linear, é difícil dizer quem vencerá (ambos perderão :)).
Se você ajustar / restringir o grau de flexibilidade e fazê-lo da maneira correta (digamos por validação cruzada), o modelo flexível deverá vencer em todos os casos.
fonte
É claro que depende dos dados subjacentes que você deve sempre explorar para descobrir algumas de suas características antes de tentar ajustar um modelo, mas o que aprendi como regras gerais gerais são:
fonte
Bem, para a segunda parte, acho que o modelo mais flexível tentará ajustá-lo bastante e os dados de treinamento contenham um ruído alto; portanto, o modelo flexível também tentará aprender esse ruído e resultará em mais erros de teste. Conheço a fonte dessa pergunta, pois também estou lendo o mesmo livro :)
fonte
Para a primeira parte, eu esperaria que o modelo inflexível tivesse melhor desempenho com um número limitado de observações. Quando n é muito pequeno, ambos os modelos (flexíveis ou inflexíveis) não produziriam uma previsão suficientemente boa. No entanto, o modelo flexível tenderia a superestimar os dados e apresentaria um desempenho inferior quando se trata de um novo conjunto de testes.
Idealmente, eu coletaria mais observações para melhorar o ajuste, mas se esse não for o caso, usaria o modelo inflexível, tentando minimizar um erro de teste com um novo conjunto de testes.
fonte
Para a segunda pergunta, acredito que a resposta é que ambos terão o mesmo desempenho (supondo que esses erros sejam irredutíveis, ou seja, esse erro). Mais informações são fornecidas em Introdução à aprendizagem estatística na página 18 (tópico: Por que estimar ) onde o autor explica dizendof
fonte
Para cada uma das partes (a) a (d), indique se i. ou ii. está correto e explique sua resposta. Em geral, esperamos que o desempenho de um método flexível de aprendizado estatístico tenha um desempenho melhor ou pior que um método inflexível quando:
O tamanho da amostra n é extremamente grande e o número de preditores p é pequeno?
O número de preditores p é extremamente grande e o número de observações n é pequeno?
A relação entre os preditores e a resposta é altamente não linear?
A variação dos termos de erro, ou seja, σ2 = Var (ε), é extremamente alta?
Tomado daqui .
fonte