Alguém pode sugerir qual é o estágio correto para remover as variáveis correlacionadas antes da engenharia de recursos ou depois da engenharia de
Alguém pode sugerir qual é o estágio correto para remover as variáveis correlacionadas antes da engenharia de recursos ou depois da engenharia de
Eu pensei que o modelo linear generalizado (GLM) seria considerado um modelo estatístico, mas um amigo me disse que alguns artigos o classificam como uma técnica de aprendizado de máquina. Qual deles é verdadeiro (ou mais preciso)? Qualquer explicação seria
Costumo criar um modelo (classificação ou regressão) em que tenho algumas variáveis preditoras que são sequências e tenho tentado encontrar recomendações técnicas para resumi-las da melhor maneira possível para inclusão como preditores no modelo. Como exemplo concreto, digamos que um modelo...
Essas duas operações de convolução são muito comuns no aprendizado profundo no momento. Eu li sobre a camada convolucional dilatada neste artigo: WAVENET: UM MODELO GERATIVO PARA ÁUDIO CRU e desconvolução está neste artigo: Redes totalmente convolucionais para segmentação semântica Ambos...
O t-SNE, como em [1], trabalha reduzindo progressivamente a divergência de Kullback-Leibler (KL), até que uma determinada condição seja atendida. Os criadores do t-SNE sugerem usar a divergência de KL como critério de desempenho para as visualizações: você pode comparar as divergências de...
Estou tentando resolver um conjunto de equações que possui 40 variáveis independentes (x1, ..., x40) e uma variável dependente (y). O número total de equações (número de linhas) é ~ 300, e eu quero resolver o conjunto de 40 coeficientes que minimizam o erro total da soma dos quadrados entre y e o...
Deixe-me mostrar um exemplo de um aplicativo de cluster on-line hipotético: No momento n, os pontos 1,2,3,4 são alocados ao cluster azul A e os pontos b, 5,6,7 são alocados ao cluster vermelho B. No tempo n + 1, é introduzido um novo ponto a que é atribuído ao cluster azul A, mas também faz com...
Eu estou lendo sobre isso SVMe cheguei ao ponto de que os não-kernelizados SVMsnada mais são que separadores lineares. Portanto, a única diferença entre uma SVMregressão logística e uma é o critério para escolher o limite? Aparentemente, SVMescolhe o classificador de margem máxima e a regressão...
Estou olhando o pybrain para receber alarmes do monitor do servidor e determinar a causa raiz de um problema. Fico feliz em treiná-lo usando aprendizado supervisionado e selecionando os conjuntos de dados de treinamento. Os dados estão estruturados mais ou menos assim: Servidor Tipo A # 1 Tipo...
O que acontece quando treinamos uma máquina de vetores de suporte básico (kernel linear e sem margem flexível) em dados não linearmente separáveis? O problema de otimização não é viável, então o que o algoritmo de minimização
Estou criando uma rede neural simples usando o tensorflow, com os dados coletados por mim mesmo, no entanto, não está cooperando: o PI encontrou um erro que não consigo corrigir ou encontrar, e eu adoraria sua ajuda. A mensagem de erro: TypeError: o argumento de busca 2861.6152 de 2861.6152...
Acabei de construir esta rede neural LSTM com Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import...
"Um erro comum que eu cometeria é adicionar uma não linearidade à minha saída de logits." O que o termo "logit" significa aqui ou o que
Eu quero evitar o excesso de ajustes na floresta aleatória. A esse respeito, pretendo usar mtry, nodesize e maxnodes etc. Você poderia me ajudar a escolher valores para esses parâmetros? Eu estou usando R. Além disso, se possível, diga-me como posso usar a validação cruzada k-fold para floresta...
Estou um pouco confuso com a diferença entre os termos "Machine Learning" e "Deep Learning". Eu pesquisei no Google e li muitos artigos, mas ainda não está muito claro para mim. Uma definição conhecida de Machine Learning de Tom Mitchell é: Um programa de computador é dito para aprender com a...
Eu sou totalmente novo no word2vec, então pls aguenta comigo. Eu tenho um conjunto de arquivos de texto, cada um contendo um conjunto de tweets, entre 1000 e 3000. Eu escolhi uma palavra-chave comum ("kw1") e deseja encontrar termos semanticamente relevantes para "kw1" usando o word2vec. Por...
No gráfico abaixo, eixo x => Tamanho do conjunto de dados eixo y => Pontuação da validação cruzada A linha vermelha é para dados de treinamento A linha verde é para testar dados Em um tutorial ao qual estou me referindo, o autor diz que o ponto em que a linha vermelha e a linha...
Alexa da Amazon , Mix da Nuance e Wit.ai do Facebook usam um sistema semelhante para especificar como converter um comando de texto em uma intenção - ou seja, algo que um computador entenderia. Não sei ao certo qual é o nome "oficial" para isso, mas o chamo de "reconhecimento de intenção"....
O que significa "linha de base" no contexto de aprendizado de máquina e ciência de dados? Alguém me escreveu: Dica: Uma linha de base apropriada fornecerá um RMSE de aproximadamente 200. Eu não entendo isso. Ele quer dizer que, se meu modelo preditivo nos dados de treinamento tiver um RMSE...
Que tipo de recurso você tentará extrair da lista de palavras para previsão futura, é uma palavra existente ou apenas uma bagunça de caracteres? Há uma descrição da tarefa que encontrei lá . Você precisa escrever um programa que possa responder se uma determinada palavra é inglês. Isso seria...