R - Interpretação de plotagem de redes neurais

8

Sei que há uma pergunta semelhante no stats.SE, mas não encontrei uma que atenda ao meu pedido; antes de marcar a pergunta como duplicada, envie-me um ping no comentário.

Eu administro uma rede neural baseada na neuralnetprevisão de séries temporais do índice SP500 e quero entender como posso interpretar o gráfico postado abaixo:

insira a descrição da imagem aqui

Particularmente, estou interessado em entender qual é a interpretação do peso da camada oculta e do peso de entrada; alguém poderia me explicar como interpretar esse número, por favor?

Qualquer dica será apreciada.

Quantopik
fonte
2
Aqui está um artigo interessante relacionado à sua pergunta. labs.eeb.utoronto.ca/jackson/ecol.%20modelling%20ANN.pdf
MrMeritology
Obrigado pelo comentário, @MrMeritology! Achei isso realmente útil!
Quantopik
Embora tenha certeza de que você será capaz de entender essa rede neural (bastante simples), se a interpretabilidade for uma preocupação relativamente grande, provavelmente você não deveria estar usando uma rede neural em primeiro lugar. Existe um motivo específico para você selecionar um sobre outros algoritmos?
David
Sim, @ David! Eu gostaria de aprender usando esse tipo de modelo. Eu nunca os usei no meu trabalho e estou estudando isso apenas por diversão. Você tem alguma idéia sobre a interpretação do enredo?
Quantopik
Preciso de ajuda para interpretar uma análise da RNA. Alguém que possa ajudar?
kalu brilhante

Respostas:

7

Como David afirma nos comentários, se você deseja interpretar um modelo, provavelmente deseja explorar algo além das redes neurais. Dito isto, você deseja entender intuitivamente o gráfico de rede em que é melhor pensar em relação às imagens (algo em que as redes neurais são muito boas).

  1. Os nós mais à esquerda (ou seja, nós de entrada) são suas variáveis ​​de dados brutos.
  2. As setas em preto (e números associados) são os pesos nos quais você pode pensar em quanto essa variável contribui para o próximo nó. As linhas azuis são os pesos tendenciosos. Você pode encontrar o objetivo desses pesos na excelente resposta aqui .
  3. Os nós do meio (ou seja, qualquer coisa entre os nós de entrada e saída) são os nós ocultos. É aqui que a analogia da imagem ajuda. Cada um desses nós constitui um componente que a rede está aprendendo a reconhecer. Por exemplo, nariz, boca ou olho. Isso não é facilmente determinado e é muito mais abstrato quando você está lidando com dados que não são de imagem.
  4. O nó da extrema direita (nó (s) de saída) é a saída final da sua rede neural.

Observe que tudo isso está omitindo a função de ativação que também seria aplicada em cada camada da rede.

cdeterman
fonte
Ótima resposta @cdeterman! muitas coisas parecem estar mais claras agora. última coisa ... de acordo com você, como posso testar novamente a capacidade do modelo de prever a saída com base no valor de entrada. Deixe-me explicar melhor; no caso de eu usar um modelo logístico simples, posso usar o vetor e as variáveis ​​independentes para calcular uma previsão da variável dependente. No modelo de rede neural, como posso fazer isso? β
Quantopik
@ Quantopic Eu acho que você está se referindo à computefunção no neuralnetpacote. A fonte não é terrivelmente complexa se você deseja fazê-lo manualmente. Essencialmente, você está aplicando os pesos e a função de ativação em cada camada ao resultado final.
precisa saber é