Atualmente, estou tentando aplicar um modelo linear ( family = gaussian
) a um indicador de biodiversidade que não pode assumir valores inferiores a zero, é inflado a zero e é contínuo. Os valores variam de 0 a um pouco acima de 0,25. Como conseqüência, há um padrão bastante óbvio nos resíduos do modelo dos quais não consegui me livrar:
Alguém tem alguma idéia de como resolver isso?
Respostas:
Existem várias soluções para o caso de distribuições contínuas semi- infladas a zero:
Ou, se sua estrutura de dados é bastante simples, você pode simplesmente usar modelos lineares e usar testes de permutação ou alguma outra abordagem robusta para garantir que sua inferência não seja prejudicada pela interessante distribuição dos dados.
Existem pacotes / soluções R disponíveis para a maioria desses casos.
Há outras perguntas sobre SE sobre dados contínuos (semi) zero inflacionados (por exemplo, aqui , aqui e aqui ), mas eles não parecem oferecer uma resposta geral claro ...
Veja também Min & Agresti, 2002, Modelando Dados Não Negativos com Agrupamento em Zero: Uma Pesquisa para uma visão geral.
fonte