Perguntas com a marcação «model»

12
Teste Exato de Fisher e Distribuição Hipergeométrica

Queria entender melhor o teste exato de Fisher, então inventei o seguinte exemplo de brinquedo, em que f e m correspondem a homens e mulheres e n e y correspondem a "consumo de refrigerante" como este: > soda_gender f m n 0 5 y 5 0 Obviamente, isso é uma simplificação drástica, mas eu não...

12
Calcular probabilidade logarítmica "à mão" para regressão não-linearizada dos mínimos quadrados generalizada (nlme)

Estou tentando calcular a probabilidade de log para uma regressão de mínimos quadrados não linear generalizada para a função f(x)=β1(1+xβ2)β3f(x)=β1(1+xβ2)β3f(x)=\frac{\beta_1}{(1+\frac x\beta_2)^{\beta_3}}otimizado pelagnlsfunção no pacote Rnlme, usando a matriz de covariância de variância gerada...

12
Como treino HMM's para classificação?

Portanto, entendo que, quando você treina HMMs para classificação, a abordagem padrão é: Separe seus conjuntos de dados nos conjuntos de dados para cada classe Treine um HMM por classe No conjunto de testes, compare a probabilidade de cada modelo para classificar cada janela Mas como eu treino...

12
Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <-...

12
É possível avaliar o GLM no Python / scikit-learn usando as distribuições Poisson, Gamma ou Tweedie como a família para a distribuição de erros?

Tentando aprender um pouco de Python e Sklearn, mas para o meu trabalho eu preciso executar regressões que usem distribuições de erro das famílias Poisson, Gamma e, especialmente, Tweedie. Não vejo nada na documentação sobre eles, mas eles estão em várias partes da distribuição R, então eu queria...