Perguntas com a marcação «data-visualization»

46
Interpretação do preditor e / ou resposta transformada em log

Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...

45
Como plotar tendências corretamente

Estou criando um gráfico para mostrar tendências nas taxas de mortalidade (por 1000 ppl.) Em diferentes países, e a história que deve vir da trama é que a Alemanha (linha azul clara) é a única cuja tendência está aumentando após 1932. Isso é minha primeira tentativa (básica) Na minha opinião,...

44
Qual é o seu gráfico estatístico favorito?

Este é um dos meus favoritos Este exemplo é bem-humorado (o crédito é de um ex-professor meu, Steven Gortmaker), mas também estou interessado em gráficos que você sente capturar e comunicar lindamente um insight ou método estatístico, juntamente com suas idéias sobre o mesmo. Uma entrada por...

38
Para plotar com R, devo aprender ggplot2 ou ggvis?

Para plotar com R, devo aprender ggplot2 ou ggvis? Não quero necessariamente aprender os dois se um deles for superior em qualquer aspecto. Por que a comunidade R continua criando novos pacotes com funcionalidades sobrepostas? A publicação do blog de introdução não menciona uma palavra por que o...

37
Quando o t-SNE é enganoso?

Citando um dos autores: A Incorporação Estocástica de Vizinhança Distribuída t (SNE) é uma técnica ( premiada ) para redução de dimensionalidade que é particularmente adequada para a visualização de conjuntos de dados de alta dimensão. Parece ótimo, mas esse é o autor falando. Outra citação...

34
Por que existe uma diferença entre calcular manualmente um intervalo de confiança de 95% da regressão logística e usar a função confint () em R?

Caro pessoal, notei algo estranho que não sei explicar, não é? Em resumo: a abordagem manual para calcular um intervalo de confiança em um modelo de regressão logística e a função R confint()fornecem resultados diferentes. Eu tenho passado pela regressão logística aplicada de Hosmer & Lemeshow...