Estatísticas e Big Data

9
Como obter limites de decisão do SVM linear em R?

Estou precisando de um pacote que possa me dar a equação para um modelo SVM linear. Atualmente estou usando o e1071 assim: library(e1071) m = svm(data, labels, type='C', kernel='linear', cost=cost, probability=FALSE, scale=scale) w = t(m$coefs) %*% data[m$index,] #Weight vector b = -model$rho...

9
Como é normalizado o RMSE pelo valor médio observado?

Eu tenho usado o Root Mean Squared Error(RMSE) para medir a precisão dos valores previstos usando um modelo. Entendo que o valor retornado está usando as unidades das minhas medidas (em vez de uma porcentagem). No entanto, gostaria de citar meus valores como uma porcentagem. A abordagem adotada é...

9
auto.arima avisa NaNs produzidos em erro padrão

Meus dados são uma série temporal da população empregada, L, e o período, ano. n.auto=auto.arima(log(L),xreg=year) summary(n.auto) Series: log(L) ARIMA(2,0,2) with non-zero mean Coefficients: ar1 ar2 ma1 ma2 intercept year 1.9122 -0.9567 -0.3082 0.0254 -3.5904 0.0074 s.e. NaN NaN NaN NaN...

9
Melhor desempenho esperado possível em um conjunto de dados

Digamos que eu tenha um problema simples de aprendizado de máquina, como uma classificação. Com algumas referências em visão ou reconhecimento de áudio, eu, como humano, sou um classificador muito bom. Portanto, tenho uma intuição de quão bom um classificador pode ser. Mas com muitos dados, um...

9
Como funciona a imputação de ratos?

Fiquei me perguntando se alguém tinha experiência usando a função de ratos, como descrito em ratos: Imputação multivariada por equações encadeadas em R (JSS 2011 45 (3))? Eu tenho um conjunto de dados com um número de variáveis, cada uma com diferentes graus de dados ausentes. Minha pergunta...