Perguntas com a marcação «r-squared»

O coeficiente de determinação, geralmente simbolizado por R 2 R2 , é a proporção da variação total da resposta explicada por um modelo de regressão. Também pode ser usado para vários pseudo-quadrado R propostos, por exemplo, para regressão logística (e outros modelos).

233
É

Eu estava folheando algumas anotações de aula de Cosma Shalizi (em particular, seção 2.1.1 da segunda aula ), e me lembrei de que você pode obter muito baixo, mesmo quando você tem um modelo completamente linear.R2R2R^2 Parafraseando o exemplo de Shalizi: suponha que você tenha um modelo , em que...

77
Quando R ao quadrado é negativo?

Meu entendimento é que não pode ser negativo, pois é o quadrado de R. No entanto, executei uma regressão linear simples no SPSS com uma única variável independente e uma variável dependente. Minha saída do SPSS me fornece um valor negativo para . Se eu fosse calcular isso manualmente a partir de R,...

46
Interpretação do preditor e / ou resposta transformada em log

Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...

40
Relações entre

Digamos que eu tenha duas matrizes unidimensionais, uma1a1a_1 e uma2a2a_2 . Cada um contém 100 pontos de dados. uma1a1a_1 são os dados reais, e uma2a2a_2 é a previsão do modelo. Nesse caso, o valor de R2R2R^2 seria: R2= 1 - SSr e sSSt o t  ( 1 ) .R2=1−SSresSStot  (1). R^2 = 1 -...

38
Manualmente calculado

Sei que essa é uma Rpergunta bastante específica , mas posso estar pensando na variação proporcional explicada, , incorretamente. Aqui vai.R2R2R^2 Estou tentando usar o Rpacote randomForest. Eu tenho alguns dados de treinamento e dados de teste. Quando encaixo um modelo de floresta aleatório, a...

29
Como lidar com dados hierárquicos / aninhados no aprendizado de máquina

Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...

23
Um

Esta pergunta foi migrada do Stack Overflow porque pode ser respondida em Validação cruzada. Migrou há 3 anos . Nas estatísticas, estamos fazendo regressões lineares, o próprio começo delas. Em geral, sabemos que quanto maior o , melhor, mas existe um cenário em que um...

21
Quadrado R na regressão quantílica

Estou usando a regressão quantílica para encontrar preditores do percentil 90 dos meus dados. Estou fazendo isso no R usando o quantregpacote. Como posso determinar r2r2r^2 para a regressão quantílica, que indicará quanto da variabilidade está sendo explicado pelas variáveis ​​preditoras? O que eu...

20
Interpretação de saída de regressão linear simples

Eu executei uma regressão linear simples do log natural de 2 variáveis ​​para determinar se elas se correlacionam. Minha saída é esta: R^2 = 0.0893 slope = 0.851 p < 0.001 Estou confuso. Olhando para o valor de , eu diria que as duas variáveis não estão correlacionadas, uma vez que é tão...