Costumo ouvir pessoas falando sobre redes neurais como algo como uma caixa preta que você não entende o que ela faz ou o que elas significam. Na verdade, eu não consigo entender o que eles querem dizer com isso! Se você entende como a propagação traseira funciona, como é uma caixa preta?
Eles significam que não entendemos como os pesos calculados ou o quê?
machine-learning
neural-networks
Jack Twain
fonte
fonte
Respostas:
Uma rede neural é uma caixa preta no sentido de que, embora possa se aproximar de qualquer função, o estudo de sua estrutura não fornecerá informações sobre a estrutura da função que está sendo aproximada.
A questão da caixa preta é: A aproximação dada pela rede neural não fornecerá nenhuma visão sobre a forma de f. Não existe um vínculo simples entre os pesos e a função que está sendo aproximada. Mesmo a análise de qual característica de entrada é irrelevante é um problema em aberto (consulte este link ).
Além disso, do ponto de vista das estatísticas tradicionais, uma rede neural é um modelo não identificável: dado um conjunto de dados e uma topologia de rede, pode haver duas redes neurais com pesos diferentes e o mesmo resultado. Isso torna a análise muito difícil.
Como um exemplo de "modelos de caixa não preta" ou "modelos interpretáveis", você tem equações de regressão e árvores de decisão. O primeiro fornece uma aproximação fechada de f, onde a importância de cada elemento é explícita, o segundo é uma descrição gráfica de alguns riscos / odds ratio relativos.
fonte
O Google publicou o Inception-v3 . É uma rede neural (NN) para o algoritmo de classificação de imagens (informando um gato a um cachorro).
No artigo, eles falam sobre o estado atual da classificação de imagens
e é basicamente por isso que chamamos NN de caixas pretas. Se eu treinar um modelo de classificação de imagens - com 10 milhões de parâmetros - e entregá-lo a você. O que você pode fazer com isso?
Você certamente pode executá-lo e classificar imagens. Vai funcionar muito bem! Mas você não pode responder a nenhuma das seguintes perguntas estudando todos os pesos, preconceitos e estrutura de rede.
Talvez você possa responder às perguntas apenas executando o NN e ver o resultado (caixa preta), mas não há nenhuma mudança de entendimento sobre por que ele está se comportando da mesma maneira que nos casos extremos.
fonte