Estou perdido na normalização, alguém poderia me guiar por favor.
Eu tenho um valor mínimo e máximo, digamos -23.89 e 7.54990767, respectivamente.
Se eu receber um valor de 5,6878, como posso escalar esse valor em uma escala de 0 a 1.
normalization
Angelo
fonte
fonte
Respostas:
Se você deseja normalizar seus dados, faça o que sugere e simplesmente calcule o seguinte:
onde e agora são seus dados normalizados. Como prova de conceito (embora você não tenha solicitado), aqui estão alguns códigos e um gráfico anexo para ilustrar este ponto:x = ( x1, . . . , xn) zEu Eut h
R
fonte
illustrate the point
da sua resposta (correta).A fórmula geral de uma linha para redimensionar linearmente os valores dos dados que observaram min e max em um novo intervalo arbitrário min ' a max' é
fonte
a
- calcular eb
constantes e depois aplicarnewvalue = a * value + b
.a = (max'-min')/(max-min)
eb = max - a * max
b = max' - a * max
Oub = min' - (a * min)
u = -1 + 2.*(u - min(u))./(max(u) - min(u));
.Aqui está minha implementação do PHP para normalização:
Mas enquanto eu estava construindo minhas próprias redes neurais artificiais, precisei transformar a saída normalizada de volta nos dados originais para obter uma boa saída legível para o gráfico.
A desnormalização usa a seguinte fórmula:
fonte
Divisão por zero
Uma coisa a ter em mente é que isso
max - min
pode ser igual a zero. Nesse caso, você não gostaria de executar essa divisão.O caso em que isso aconteceria é quando todos os valores da lista que você está tentando normalizar são iguais. Para normalizar essa lista, cada item seria
1 / length
.Exemplo:
fonte
normalize([12, 20, 10])
saídas[0.2, 1.0, 0.0]
, que é a mesma que você obteria(val - min) / (max - min)
.a resposta está certa, mas tenho uma sugestão, e se seus dados de treinamento enfrentarem algum número fora do intervalo? você pode usar a técnica de esmagamento. será garantido que nunca fique fora de alcance. ao invés disso
eu recomendo usar isso
com esmagamento como este em min e max de alcance
e o tamanho da lacuna esperada fora da faixa é diretamente proporcional ao grau de confiança de que haverá valores fora da faixa.
para obter mais informações, você pode pesquisar no Google: esmagar os números fora da faixa e consultar o livro de preparação de dados de "dorian pyle"
fonte
Tente isso. É consistente com a escala da função
fonte