O que é média zero e variação de unidade em termos de dados de imagem?

Eu sou novo no aprendizado profundo. Eu estou tentando entender alguns conceitos. Sei que "média" é um valor médio e "variância" é um desvio da média. Li alguns artigos de pesquisa, todos dizem que pré-processamos nossos dados primeiro. Mas como esses conceitos estão relacionados ao pré-processamento de imagens? Por que esses conceitos são usados como pré-processamento de dados de imagem?
Na verdade, sou incapaz de entender como essas técnicas contribuem para a classificação. Eu pesquisei no google, mas posso ser pesquisado com palavras-chave menos descritivas.
Leve minha pergunta muito básica,

classification variance mean deep-learning image-processing Rafay Zia Mir
fonte

Na verdade, variação é a média dos quadrados das diferenças em relação à média. Você está perguntando sobre "padronização" ou "redimensionamento" como etapa de pré-processamento? Ele foi projetado para evitar que uma única variável explicativa domine as outras apenas porque possui uma ampla gama de valores numéricos.

Henry

Isso geralmente é chamado de normalização de imagem e você pode encontrar motivos para isso no link.

Alex R.

Excelente resposta para a normalização dos vetores de recursos, da wikipedia: "Como o intervalo de valores dos dados brutos varia muito, em alguns algoritmos de aprendizado de máquina, as funções objetivas não funcionarão corretamente sem a normalização. Por exemplo, a maioria dos classificadores calcula a distância entre dois pontos pela distância euclidiana. Se um dos recursos tiver uma ampla faixa de valores, a distância será governada por esse recurso específico. Portanto, o intervalo de todos os recursos deve ser normalizado para que cada recurso contribua aproximadamente proporcionalmente ao final d . "

Anna Vopureta 22/02/19

Esse comentário seria mais forte se fosse elaborado como o redimensionamento da variação unitária média de 0 está relacionado às imagens.

Sycorax diz Reinstate Monica

As imagens @Sycorax são tratadas como vetores de recursos regulares que são alimentados no modelo. Não há nada de especial em imagens, todas as declarações relacionadas à normalização se aplicam igualmente a imagens e outros vetores de recursos.

Anna Vopureta 22/02/19

Respostas:

Essa é uma pergunta muito boa e você precisa entender isso para obter mais compreensão do aprendizado profundo.

Basicamente, você tem imagens brutas, vamos tirar uma imagem. Esta imagem possui 3 canais e em cada canal os valores de pixel variam de 0 a 255.

Nosso objetivo aqui é compactar o intervalo de valores para todos os pixels nos três canais para um intervalo muito pequeno. É aqui que entra o pré-processamento. Mas não pense que o pré-processamento envolve apenas as técnicas média e padrão de desenvolvimento, existem muitas outras, como PCA, clareamento etc.

1) Usando média: calculando a média, digamos, os primeiros valores de pixel vermelho em todas as imagens de treinamento obterão o valor médio da cor vermelha presente em todas as imagens de treinamento na primeira posição. Da mesma forma, você encontra isso para todos os valores de canal vermelho e verde. Finalmente, você obtém uma imagem média de todas as imagens de treinamento.

Agora, se você subtrair essa imagem média de todas as imagens de treinamento, obviamente você transforma os valores de pixel das imagens, a imagem não é mais interpretável para o olho humano, os valores pixal agora estão no intervalo de positivo a negativo, onde a média está em zero .

2) Agora, se você dividi-los novamente por desvio padrão, você reduz o valor do pixel antes para um pequeno intervalo.

MAS POR QUE TUDO ISSO? Direi da minha experiência que fazer esse pré-processamento nas imagens e depois fornecer essas imagens transformadas ao modelo classificador será executado mais rápido e melhor. É por isso.

Ao aprender profundamente, examine a normalização em lote depois de entender esse conceito de normalização

Sreekar Nimbalkar
fonte

A normalização de lotes está relacionada à mudança interna na distribuição e não tem nada a ver com o que estamos falando.

HelloWorld 24/02

"da minha experiência, o modelo roda mais rápido e melhor", não parece tão convincente.

Anna Vopureta 22/02/19