Eu tenho um problema de regressão em que os resultados não são estritamente 0, 1, mas sim na faixa de todos os números reais 0-1 incluído .
Esse problema já foi discutido neste tópico , embora minha pergunta seja um pouco diferente.
Não posso usar regressão linear pelas mesmas razões pelas quais a regressão logística é normalmente usada. Na regressão linear A) valores IVs muito altos inclinam o resultado previsto para 1 e B) o resultado da regressão linear não está limitado aos limites de 0,1.
Olhando para esta função de custo logístico do meu livro Eu deduzo que a equação foi projetada para calcular um custo maior que 0 apenas quando y e x não tem o mesmo valor 0 ou 1.
Seria possível usar a regressão logística modificando a função de custo para medir todos os erros de hipótese?
fonte
glm()
função R faz quando é alimentada com resposta contínua efamily=quasibinomial
? Ou seja, ele estimará os coeficientesfamily=binomial
e, em uma etapa extra, computará os erros padrão levando em consideração a dispersão excessiva? Se sim, é o mesmo que calcular "erros padrão robustos"? Eu tenho alguns dados apropriados e tentei ambas as famíliasglm
; Eu recebo coeficientes idênticos, mas com erros padrão diferentes. Obrigado.Quando Y é delimitado, a regressão beta geralmente faz sentido; veja o artigo "Um espremedor de limão melhor"
Isso permite efeitos de piso e teto; também permite modelar a variação e a média.
fonte
Como y não é estritamente zero ou um (como você disse), o custo deve ser sempre maior que zero. Portanto, não acho que você precise da modificação no modelo.
fonte
Sugiro dois modelos alternativos:
Se seus resultados (variáveis y) forem ordenados, tente um modelo de Probabilidade Ordenada.
Se seus resultados (variáveis y) não forem ordenados, tente um modelo Logit Multinomial.
fonte