Perguntas com a marcação «data-transformation»

Reexpressão matemática, geralmente não linear, dos valores dos dados. Os dados são frequentemente transformados para atender às premissas de um modelo estatístico ou para tornar os resultados de uma análise mais interpretáveis.

181
Como resumir dados por grupo em R? [fechadas]

Eu tenho R quadro de dados como este: age group 1 23.0883 1 2 25.8344 1 3 29.4648 1 4 32.7858 2 5 33.6372 1 6 34.9350 1 7 35.2115 2 8 35.2115 2 9 35.2115 2 10 36.7803 1 ... Preciso obter o quadro de dados no seguinte formato: group mean sd 1 34.5 5.6 2 32.3 4.2 ... O número do grupo pode...

57
Quando as escalas de log são apropriadas?

Eu li que o uso de escalas de log quando gráficos / gráficos é apropriado em determinadas circunstâncias, como o eixo y em um gráfico de séries temporais. No entanto, não consegui encontrar uma explicação definitiva sobre por que esse é o caso, ou quando mais seria apropriado. Lembre-se de que eu...

46
Interpretação do preditor e / ou resposta transformada em log

Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...

41
Regressão: transformando variáveis

Ao transformar variáveis, você precisa usar a mesma transformação? Por exemplo, posso escolher variáveis ​​transformadas de maneira diferente, como em: Seja idade, duração do emprego, duração da residência e renda.x1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Ou você...

27
O clareamento é sempre bom?

Uma etapa comum de pré-processamento para algoritmos de aprendizado de máquina é o clareamento de dados. Parece que é sempre bom fazer o clareamento, uma vez que correlaciona os dados, facilitando a modelagem. Quando o clareamento não é recomendado? Nota: estou me referindo à desacorrelação dos...