Eu vi a fórmula de normalização min-max, mas que normaliza valores entre 0 e 1. Como normalizaria meus dados entre -1 e 1? Eu tenho valores negativos e positivos na minha matriz de dados.
dataset
normalization
covfefe
fonte
fonte
Respostas:
Com:
Para normalizar em[−1,1] você pode usar:
Em geral, você sempre pode obter uma nova variávelx′′′ em [a,b] :
fonte
Eu testei em dados gerados aleatoriamente e
não preserva a forma da distribuição. Realmente gostaria de ver a derivação apropriada disso usando funções de variáveis aleatórias.
A abordagem que preservou a forma para mim estava usando:
Onde
(Admito que usar 6 é um pouco sujo ) e
e
Cheguei ao resultado desse raciocínio
fonte
set.seed(1); scale(rnorm(1000))*.333
. Eu recebo no máximo1.230871
. Seu método parece ser apenas um ajuste na padronização de dados, em vez de normalizá-los conforme solicitado. Observe que a pergunta não pede um método que preserve a forma da distribuição (o que seria um requisito estranho para normalização).