Perguntas com a marcação «r»

49
Bootstrap vs. jackknife

Os métodos bootstrap e jackknife podem ser usados ​​para estimar o viés e o erro padrão de uma estimativa e os mecanismos de ambos os métodos de reamostragem não são muito diferentes: amostragem com substituição vs. deixar de fora uma observação de cada vez. No entanto, o canivete não é tão popular...

49
Tempo aleatório de computação na floresta em R

Estou usando o pacote de festa no R com 10.000 linhas e 34 recursos, e alguns recursos de fator têm mais de 300 níveis. O tempo de computação é muito longo. (Demorou 3 horas até agora e ainda não terminou.) Quero saber quais elementos têm um grande efeito no tempo de computação de uma floresta...

48
Qual é a diferença entre NaN e NA?

Gostaria de saber por que algumas línguas como R têm NA e NaN. Quais são as diferenças ou são igualmente iguais? É realmente necessário ter

47
Como fazer a seleção de subconjuntos de regressão logística?

Estou ajustando uma família binomial de glm em R, e tenho um grupo inteiro de variáveis ​​explicativas, e preciso encontrar o melhor (R ao quadrado, se uma medida for boa). Antes de escrever um script para percorrer diferentes combinações aleatórias das variáveis ​​explicativas e depois gravar qual...

46
Interpretação do preditor e / ou resposta transformada em log

Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...

45
O que é Deviance? (especificamente em CART / rpart)

O que é "desvio", como é calculado e quais são seus usos em diferentes campos nas estatísticas? Em particular, estou pessoalmente interessado em seus usos no CART (e sua implementação no rpart no R). Estou perguntando isso, já que o artigo wiki parece um pouco ausente e suas idéias serão muito...