A raiz quadrada é aproximadamente estabilizadora de variância para o Poisson . Existem várias variações na raiz quadrada que aprimoram as propriedades, como adicionar38 antes de obter a raiz quadrada ou o Freeman-Tukey ( - embora também seja frequentemente ajustado para a média).X−−√+X+1−−−−−√
A transformação da raiz quadrada melhora um pouco a simetria - embora não tão bem quanto o poder [1]:23
Se você deseja particularmente uma quase normalidade (desde que o parâmetro do Poisson não seja muito pequeno) e não se importe / possa ajustar a heterocedasticidade, tente power.23
O link canônico geralmente não é uma transformação particularmente boa para os dados de Poisson ; o log zero é um problema específico (outro é a heterocedasticidade; você também pode ter inclinação à esquerda mesmo quando não possui zeros). Se os menores valores não estiverem muito próximos de 0, pode ser útil para linearizar a média. É uma boa 'transformação' para a média da população condicional de um Poisson em vários contextos, mas nem sempre dos dados de Poisson. No entanto, se você deseja transformar, uma estratégia comum é adicionar uma constante que evita o problema . Nesse caso, devemos considerar qual constante adicionar. Sem ficar muito longe da questão em questão, valores de entrey∗=log(y+c)0c0.4e funcionam muito bem (por exemplo, em relação ao viés na estimativa da inclinação) em uma faixa de valores de . Normalmente, uso apenas pois é simples, com valores em torno de muitas vezes se saindo um pouco melhor.0.5μ120.43
Quanto ao motivo pelo qual as pessoas escolhem uma transformação em detrimento de outra (ou nenhuma) - isso é realmente uma questão do que elas estão fazendo para alcançar.
[1]: Gráficos padronizados após os gráficos de Henrik Bengtsson em seu folheto "Modelos lineares generalizados e resíduos transformados", veja aqui
(veja o primeiro slide na p4). Eu adicionei um pouco de instabilidade e omiti as linhas.