Tenho um experimento de medidas repetidas em que a variável dependente é uma porcentagem e tenho vários fatores como variáveis independentes. Eu gostaria de usar glmer
o pacote R lme4
para tratá-lo como um problema de regressão logística (especificando family=binomial
), pois parece acomodar essa configuração diretamente.
Meus dados são assim:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
e aqui está o comando R que eu esperava que fosse apropriado:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
O problema com isso é que o comando reclama da minha variável dependente não ser números inteiros:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
e a análise desses dados (piloto) fornece respostas estranhas como resultado.
Entendo por que a binomial
família espera números inteiros (sim-não conta), mas parece que não há problema em regredir dados percentuais diretamente. Como fazer isso?
Respostas:
Para usar um vetor de proporções como a variável de resposta
glmer(., family = binomial)
, é necessário definir o número de tentativas que levaram a cada proporção usando oweights
argumento Por exemplo, usando oscbpp
dados dolme4
pacote:Se você não souber o número total de tentativas, um modelo binomial não é apropriado, conforme indicado na mensagem de erro.
fonte
cbpp
página de ajuda.fonte