Tentando aprender um pouco de Python e Sklearn, mas para o meu trabalho eu preciso executar regressões que usem distribuições de erro das famílias Poisson, Gamma e, especialmente, Tweedie.
Não vejo nada na documentação sobre eles, mas eles estão em várias partes da distribuição R, então eu queria saber se alguém já viu implementações em algum lugar para Python. Seria muito legal se você pudesse me indicar as implementações SGD da distribuição Tweedie!
Respostas:
Há um movimento para implementar modelos lineares generalizados com distribuições de erro Poisson, gama e Tweedie no scikit-learn.
O Statsmodels possui implementações de modelos lineares generalizados com distribuições de erro de Poisson, Tweedie e gama.
Enquanto estou atualizando esta resposta, o Spark ML também (experimentalmente) suporta distribuições Poisson, Tweedie e gama.
fonte
H2O tem modelo linear generalizado s.
No entanto, eles usam H2O Frames, então você não pode usar Pandas / Numpy diretamente.
fonte