Várias postagens ( aqui e aqui ) sugerem que a regressão beta é mais apropriada quando a variável dependente é naturalmente limitada entre 0 e 1. Minha pergunta é, deixando de lado a adequação, é tecnicamente incorreto ajustar uma regressão logística à variável de resposta proporcional? R emitirá um aviso, mas ainda produzirá um resultado.
Parece-me que a função de probabilidade não será uma probabilidade válida quando a variável de resposta for proporcional em vez de binária, mas matematicamente falando, ainda pode ser minimizada para dar uma solução. Eu me pergunto que violação / erro, se houver, é cometido ao ajustar uma regressão logística a dados proporcionais.
regression
logistic
proportion
Comunidade
fonte
fonte
Respostas:
O que você propõe às vezes é chamado de logit fracionário. Certamente tem seus méritos, desde que você se lembre de usar erros padrão robustos. Em 2010, dei uma palestra na reunião dos usuários Stata alemães, comparando, entre outras coisas, a regressão beta e o logit fracionário. Os slides podem ser encontrados aqui: http://www.maartenbuis.nl/presentations/berlin10.pdf
fonte
weights
argumento paraglm
), veja, por exemplo, aqui stats.stackexchange.com/a/26779/28666 . Como o "logit fracionário" com "erros padrão robustos" se relaciona com essa abordagem? É a mesma coisa ou não?Modelos desse tipo são frequentemente definidos e usados como um tipo de modelo linear generalizado. Para uma revisão concisa, consulte http://www.stata-journal.com/article.html?article=st0147 O argumento é que o binômio é uma família razoável, mesmo para proporções contínuas, pois a variação também se aproxima de 0 à medida que a média se aproxima. 0 ou 1.
Se programas ou funções específicos em um software específico os acomodam é uma questão diferente. Dizer que "R lançará um aviso, mas ainda produzirá um resultado" transmite pouca informação. A qual pacote você está se referindo? É realmente o único pacote relevante? De qualquer forma, como o artigo mencionado acima indica, este modelo é bem suportado no Stata, por exemplo.
Isso ainda deixa margem para uma discussão detalhada dos méritos relativos de um modelo de logit para proporções contínuas e regressão beta.
fonte