Perguntas com a marcação «many-categories»

Variáveis ​​categóricas com grande número de níveis e métodos estatísticos para trabalhar com tais variáveis ​​(exemplo: laço fundido).

28
Problemas com gráficos de pizza

Parece haver uma crescente discussão sobre gráficos de pizza. Os principais argumentos contra isso parecem ser: A área é percebida com menos energia que comprimento. Os gráficos de pizza têm uma relação ponto-a-pixel muito baixa No entanto, acho que eles podem ser de alguma forma úteis ao...

15
A precisão da máquina de aumento de gradiente diminui à medida que o número de iterações aumenta

Estou experimentando o algoritmo da máquina de aumento de gradiente através do caretpacote em R. Usando um pequeno conjunto de dados de admissões de faculdade, executei o seguinte código: library(caret) ### Load admissions dataset. ### mydata <-

12
Diferenças entre PROC Mixed e lme / lmer em R - graus de liberdade

Nota: esta pergunta é um repost, pois minha pergunta anterior teve que ser excluída por razões legais. Ao comparar o PROC MIXED do SAS com a função lmedo nlmepacote no R, deparei-me com algumas diferenças bastante confusas. Mais especificamente, os graus de liberdade nos diferentes testes...

10
Pacote R para combinar níveis de fator para datamining?

Querendo saber se alguém já se deparou com um pacote / função em R que combinará níveis de um fator cuja proporção de todos os níveis de um fator seja menor que algum limite? Especificamente, uma das primeiras etapas na preparação de dados que eu conduzo é recolher níveis esparsos de fatores...

8
Codificação de recursos categóricos de alta cardinalidade (várias categorias) quando os recursos diferem bastante na cardinalidade

Estive pesquisando perguntas sobre a codificação de recursos categóricos, mas não encontrei nenhuma que discutisse meu problema. Desculpas se eu perdi. Digamos que temos um conjunto de dados com variáveis binárias e nominais de importância aproximadamente igual cada. A maioria dos...