Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Medidas de diagnóstico (como resíduos ou algumas estatísticas resumidas calculadas a partir de resíduos) são usadas para avaliar algum aspecto da qualidade do ajuste do modelo aos dados.
Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Estou procurando orientações sobre como interpretar gráficos residuais de modelos de glm. Especialmente modelos poisson, binomial negativo e binomial. O que podemos esperar desses gráficos quando os modelos estão "corretos"? (por exemplo, esperamos que a variação cresça à medida que o valor...
Eu queria fazer uma demonstração de classe em que comparasse um intervalo t com um intervalo de autoinicialização e calculasse a probabilidade de cobertura de ambos. Como eu queria que os dados viessem de uma distribuição assimétrica, decidi gerá-los como exp(rnorm(10, 0, 2)) + 1uma amostra do...
Suponha que eu faça uma regressão logística univariada em várias variáveis independentes, como esta: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Fiz uma comparação de modelo (teste de razão de verossimilhança) para...
Seguindo minha pergunta para o OLS , pergunto-me: que gráficos de diagnóstico existem para a regressão quantílica? (e há R implementação deles?) Uma rápida pesquisa no Google já veio com o gráfico de worms (sobre o qual nunca ouvi falar antes), e ficaria feliz em saber de mais métodos que você...
Um experimento de detecção de sinal normalmente apresenta ao observador (ou sistema de diagnóstico) um sinal ou um não sinal, e o observador é solicitado a relatar se eles acham que o item apresentado é um sinal ou não. Tais experimentos produzem dados que preenchem uma matriz 2x2: A teoria da...
Estou executando um amostrador Metropolis (C ++) e quero usar os exemplos anteriores para estimar a taxa de convergência. Um diagnóstico fácil de implementar que encontrei é o diagnóstico Geweke , que calcula a diferença entre as duas médias da amostra divididas pelo erro padrão estimado. O erro...
Eu ajustei meu modelo e estou tentando entender se é bom. Calculei as métricas recomendadas para avaliá-las ( / AUC / precisão / erro de previsão / etc), mas não sei como interpretá-las. Em resumo, como posso saber se meu modelo é bom com base na métrica? Um de 0,6 (por exemplo) é suficiente para...
Eu já vi fórmulas na Wikipedia. que relacionam a distância e a alavancagem de Mahalanobis: A distância de Mahalanobis está intimamente relacionada à estatística de alavancagem, hhh , mas tem uma escala diferente: D2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). Em um artigo...
Estou observando padrões estranhos em resíduos para meus dados: [EDIT] Aqui estão os gráficos de regressão parcial para as duas variáveis: [EDIT2] Adicionado o gráfico PP A distribuição parece estar indo bem (veja abaixo), mas não tenho idéia de onde essa linha reta possa estar vindo....
Eu tenho dados de demanda por hora e meia, que é uma série temporal multi-sazonal. Eu usei tbatsno forecastpacote em R e obtive resultados como este: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Isso significa que a série não deve necessariamente usar a transformação...
Na regressão linear simples, geralmente se deseja verificar se certas premissas são atendidas para poder fazer inferência (por exemplo, os resíduos são normalmente distribuídos). É razoável verificar as premissas, verificando se os valores ajustados são normalmente distribuídos?...
Estou ciente do teste de Ramsey Reset, que pode detectar dependências não lineares. No entanto, se você apenas jogar fora um dos coeficientes de regressão (dependências meramente lineares), poderá obter um viés, dependendo das correlações. Obviamente, isso não é detectado pelo teste de...
Comecei a cavar um pouco a função plot.lm , essa função fornece seis gráficos para lm, são eles: uma plotagem de resíduos contra valores ajustados uma plotagem Scale-Location de sqrt (| resíduos |) em relação aos valores ajustados um gráfico QQ normal, um gráfico das distâncias de Cook versus...
Ao executar a regressão linear múltipla do OLS, em vez de plotar os resíduos contra os valores ajustados, ploto os resíduos Studentizados (internos) contra os valores ajustados (o mesmo para covariáveis). Esses resíduos são definidos como: e∗Eu= eEus2( 1 - heu eu)---------√eEu∗=eEus2(1...
Antes de fazer essa pergunta, pesquisei em nosso site e encontrei muitas perguntas semelhantes (como aqui , aqui e aqui ). Mas acho que essas perguntas relacionadas não foram bem respondidas ou discutidas, portanto, gostaria de levantar essa questão novamente. Eu acho que deve haver uma grande...
Existem suposições particulares em relação aos erros de regressão logística, como a variação constante dos termos do erro e a normalidade dos resíduos? Também normalmente quando você tem pontos com uma distância de Cook maior que 4 / n, você os remove? Se você os remover, como saber se o modelo...
O ensino padrão diz que sensibilidade e especificidade são propriedades do teste e são independentes da prevalência. Mas isso não é apenas uma suposição? Os princípios da medicina interna de Harrison Há muito tempo se afirma que a sensibilidade e a especificidade são parâmetros independentes da...
Estou tentando replicar o que a função dfbetas()faz R . dfbeta() não é um problema ... Aqui está um conjunto de vetores: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Se eu encaixar dois modelos de regressão da seguinte maneira: fit1 <- lm(y ~...
Antecedentes: Estou trabalhando em uma revisão sistemática, incluindo várias modalidades de imagem para doença arterial coronariana, mas a rede de evidências é bastante grande, incluindo diferentes modalidades, geralmente comparada entre si em uma ampla rede. A metanálise de rede é uma abordagem...