Perguntas com a marcação «r»

13
Previsões usando glmnet em R

Estou tentando modelar alguns dados usando o glmnetpacote em R. Digamos que tenho os seguintes dados training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3), variable2 = c(1, 2, 3, 4, 5)) y <- c(1, 2, 3, 4, 5) (Isso é uma simplificação; meus dados são muito mais complicados.) Então usei o...

13
Ajude-me a entender os valores de

Estou tentando executar um logit bayesiano nos dados aqui . Estou usando bayesglm()no armpacote em R. A codificação é direta o suficiente: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"),...

13
Implementação de laço não negativo em R

Estou procurando algum código-fonte aberto ou uma biblioteca existente que eu possa usar. Tanto quanto eu digo, o pacote glmnet não é muito facilmente extensível para cobrir o caso não negativo. Posso estar errado, qualquer pessoa com alguma idéia muito apreciada. Por não negativo, quero dizer que...

13
Lidar com laços, pesos e votação em kNN

Estou programando um algoritmo kNN e gostaria de saber o seguinte: Tie-breaks: O que acontece se não houver um vencedor claro na votação majoritária? Por exemplo, todos os k vizinhos mais próximos são de classes diferentes, ou para k = 4 existem 2 vizinhos da classe A e 2 vizinhos da classe B? O...

13
Agrupe Big Data em R e a amostragem é relevante?

Eu sou novo na ciência de dados e tenho um problema ao encontrar clusters em um conjunto de dados com 200.000 linhas e 50 colunas em R. Como os dados têm variáveis ​​numéricas e nominais, métodos como o K-significa que usa a medida de distância euclidiana não parece ser uma escolha apropriada....