Perguntas com a marcação «fitting»

8
Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?

Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis ​​(id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly...

8
Parada antecipada vs validação cruzada

Atualmente, estou usando a parada antecipada no meu trabalho para evitar o excesso de ajuste. Especificamente, aqueles tomados em forma de parada antecipada, mas quando? . Agora estou querendo comparar com outros algoritmos de classificação, onde parece que a validação cruzada de 10 vezes é...

8
Como executar SVD para atribuir valores ausentes, um exemplo concreto

Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...

7
Regressão para a lei do poder

Este é um post cruzado do Math SE . Eu tenho alguns dados (tempo de execução de um algoritmo) e acho que segue uma lei de energia yr e g= k xumayreg=kxumay_\mathrm{reg} = k x^a Eu quero determinar e . O que fiz até agora é fazer uma regressão linear (mínimos quadrados) através de e determinar e...

7
Por que a codificação do tratamento resulta em uma correlação entre inclinação aleatória e interceptação?

Considere um planejamento fatorial dentro do sujeito e dentro do item, onde a variável de tratamento experimental possui dois níveis (condições). Seja m1o modelo máximo e m2o modelo sem correlações aleatórias. m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition +...

7
Como se supera facilmente?

Esta é uma pergunta estranha, eu sei. Eu sou apenas um noob e tentando aprender sobre diferentes opções de classificadores e como elas funcionam. Então, eu estou fazendo a pergunta: Dado um conjunto de dados de n1-dimensões e n2-observações em que cada observação pode ser classificada em...