Perguntas com a marcação «proportion»

Uma proporção é a fração de algum total de um tipo específico, (i) como uma contagem de um tipo de coisa da contagem total ou (ii) como um componente de uma variável contínua.

78
Um exemplo: regressão do LASSO usando glmnet para resultado binário

Estou começando a se envolver com o uso de glmnetcom LASSO Regressão onde meu desfecho de interesse é dicotômica. Criei um pequeno quadro de dados simulado abaixo: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67,...

20
Quais são os valores corretos para precisão e rechamada em casos extremos?

Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando...

15
Em que nível um teste

JUSTIFICATIVA: Pule com segurança - está aqui para referência e para legitimar a pergunta. A abertura deste artigo diz: "O famoso teste de contingência qui-quadrado de Karl Pearson é derivado de outra estatística, chamada estatística z, com base na distribuição Normal. As versões mais simples do...

12
O teste

Acabei de ler em uma revista científica (popular) bastante respeitada (o PM alemão, 02/2013, p.36) sobre um experimento interessante (sem fonte, infelizmente). Isso chamou minha atenção porque intuitivamente duvidei do significado do resultado, mas as informações fornecidas foram suficientes para...

12
Clopper-Pearson para não matemáticos

Fiquei imaginando se alguém poderia me explicar a intuição além do IC de Clopper-Pearson para proporções. Até onde eu sei, todo IC inclui uma variação nele. No entanto, para proporções, mesmo que minha proporção seja 0 ou 1 (0% ou 100%), o IC de Clopper-Pearson pode ser calculado. Tentei examinar...

12
Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <-...

10
Por que Anova () e drop1 () forneceram respostas diferentes para os GLMMs?

Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois...