Perguntas com a marcação «residuals»

14
Por que dizemos "erro padrão residual"?

Um erro padrão estimado é o desvio padrão σ ( θ ) de um estimador θ para um parâmetro θ .σ^(θ^)σ^(θ^)\hat \sigma(\hat\theta)θ^θ^\hat\thetaθθ\theta Por que o desvio padrão estimado dos resíduos é chamado de "erro padrão residual" (por exemplo, na saída da summary.lmfunção de R ) e não "desvio...

13
Avaliando modelos de regressão logística

Essa questão surge da minha confusão real sobre como decidir se um modelo logístico é bom o suficiente. Eu tenho modelos que usam o estado dos pares de projetos individuais dois anos após serem formados como uma variável dependente. O resultado é bem-sucedido (1) ou não (0). Eu tenho variáveis...

12
Teste Exato de Fisher e Distribuição Hipergeométrica

Queria entender melhor o teste exato de Fisher, então inventei o seguinte exemplo de brinquedo, em que f e m correspondem a homens e mulheres e n e y correspondem a "consumo de refrigerante" como este: > soda_gender f m n 0 5 y 5 0 Obviamente, isso é uma simplificação drástica, mas eu não...

12
Pacote GBM vs. Caret usando GBM

Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 como métrica de...

12
São normalmente distribuídos X e Y com maior probabilidade de resultar em resíduos normalmente distribuídos?

Aqui, a interpretação errônea da suposição de normalidade na regressão linear é discutida (que a 'normalidade' refere-se ao X e / ou Y ao invés dos resíduos), e o pôster pergunta se é possível ter X e Y distribuídos normalmente. e ainda tem resíduos normalmente distribuídos. Minha pergunta é:...

12
Análise residual de regressão logística

Essa pergunta é geral e prolongada, mas por favor, tenha paciência comigo. No meu aplicativo, tenho muitos conjuntos de dados, cada um consistindo em ~ 20.000 pontos de dados com ~ 50 recursos e uma única variável binária dependente. Estou tentando modelar os conjuntos de dados usando regressão...

12
Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <-...

11
Resíduos de Schoenfeld

Em um modelo de riscos proporcionais de Cox com muitas variáveis, se os resíduos de Schoenfeld não são baixos para uma das variáveis, isso invalida o modelo inteiro ou pode apenas a variável com baixo desempenho ser ignorada? Ou seja, interprete os coeficientes para as outras variáveis, mas não...