Perguntas com a marcação «machine-learning»

11

Algoritmos de incorporação de palavras em termos de desempenho

Estou tentando incorporar cerca de 60 milhões de frases em um espaço vetorial e calcular a semelhança de cosseno entre elas. Eu tenho usado o sklearn's CountVectorizercom uma função de tokenizer personalizada que produz unigramas e bigrams. Acontece que, para obter representações significativas,...

11

Recursos para aprender sobre técnicas de múltiplos alvos?

Estou procurando recursos (livros, anotações de aula etc.) sobre técnicas que podem lidar com dados que têm vários destinos (Ex: três variáveis dependentes: 2 discretas e 1 contínua). Alguém tem algum recurso / conhecimento sobre isso? Eu sei que é possível usar redes neurais para isso....

regression machine-learning predictive-models references

11

Como criar uma matriz de confusão para um classificador multiclasse?

Eu tenho um problema com 6 classes. Portanto, construo um classificador multiclasse, da seguinte maneira: para cada classe, tenho um classificador de Regressão Logística, usando Um vs. Todos, o que significa que tenho 6 classificadores diferentes. Posso relatar uma matriz de confusão para cada um...

machine-learning logistic classification multi-class confusion-matrix

11

Como os filtros e os mapas de ativação estão conectados nas Redes Neurais Convolucionais?

Como os mapas de ativação em uma determinada camada são conectados aos filtros dessa camada? Não estou perguntando sobre como fazer uma operação convolucional entre o filtro e o mapa de ativação, estou perguntando sobre o tipo de conectividade que esses dois possuem. Por exemplo, digamos que você...

machine-learning deep-learning conv-neural-network

11

As interações são úteis apenas no contexto da regressão?

Eu sempre li o termo interação no contexto de regressão. Também devemos considerar interações com diferentes modelos, por exemplo, knn ou svm? Se houver , ou mais recursos e, digamos, observações, qual é a maneira usual de encontrar interações úteis? Tente todas as combinações? Ou use apenas...

machine-learning interaction terminology

11

Pergunta sobre subtração da média no trem / válido / conjunto de testes

Estou fazendo pré-processamento de dados e depois construindo um Convonets nos meus dados. Minha pergunta é: digamos que eu tenho um total de conjuntos de dados com 100 imagens, eu estava calculando a média para cada uma das 100 imagens e subtraí-la de cada uma das imagens, depois divida-a em...

machine-learning cross-validation data-preprocessing

11

Qual a diferença entre a Regressão do vetor de suporte e a SVM?

Eu sei o básico sobre SVM e SVR, mas ainda não entendi como o problema de encontrar um hiperplano que maximize a margem se encaixa no SVR. Segundo, li algo sobre usado como margem de tolerância no SVR. O que isso significa?ϵϵ\epsilon Terceiro, existe alguma diferença entre os parâmetros da função...

regression machine-learning svm

11

O que é política de distribuição no artigo da AlphaGo?

O jornal está aqui . A política de implementação ... é uma política linear softmax baseada em recursos locais rápidos, calculados de forma incremental e baseados em padrões locais ... Não entendo o que é política de distribuição e como ela se relaciona com a rede de políticas de seleção de uma...

machine-learning monte-carlo reinforcement-learning games

11

Diferença entre ElasticNet no scikit-learn Python e Glmnet no R

Alguém tentou verificar se o ajuste de um modelo Elastic Net ElasticNetno scikit-learn no Python e glmnetno R no mesmo conjunto de dados produz resultados aritméticos idênticos? Eu tenho experimentado muitas combinações de parâmetros (já que as duas funções diferem nos valores padrão que passam...

machine-learning scikit-learn glmnet elastic-net

11

O que se entende pela variação de * funções * em * Introdução à aprendizagem estatística *?

Na pág. 34 de Introdução à aprendizagem estatística : \newcommand{\Var}{{\rm Var}} Embora a prova matemática esteja além do escopo deste livro, é possível mostrar que o teste esperado MSE, para um determinado valor x0x0x_0 , sempre pode ser decomposto na soma de três quantidades fundamentais: a...

machine-learning variance

11

As redes residuais estão relacionadas ao aumento de gradiente?

Recentemente, vimos o surgimento da Rede Neural Residual, em que cada camada consiste em um módulo computacional e uma conexão de atalho que preserva a entrada na camada, como mostra a saída da i-ésima camada: A rede permite extrair recursos residuais e permite uma profundidade mais profunda, ao...

machine-learning neural-networks deep-learning gradient-descent residual-networks

11

Qual é uma explicação do exemplo de por que a normalização de lotes deve ser feita com algum cuidado?

Eu estava lendo o documento de normalização em lote [1] e tinha uma seção em que é apresentado um exemplo, tentando mostrar por que a normalização deve ser feita com cuidado. Sinceramente, não consigo entender como o exemplo funciona e estou genuinamente muito curioso para entender que eles são tão...

machine-learning neural-networks conv-neural-network

11

Bons exemplos / livros / recursos para aprender sobre o aprendizado de máquina aplicado (não apenas o próprio ML)

Eu fiz um curso de ML anteriormente, mas agora que estou trabalhando com projetos relacionados ao ML no meu trabalho, estou lutando bastante para realmente aplicá-lo. Tenho certeza de que o que estou fazendo já foi pesquisado / tratado antes, mas não consigo encontrar tópicos específicos. Todos os...

machine-learning references train application

11

técnicas de aprendizado de máquina para dados longitudinais

Fiquei me perguntando se havia alguma técnica de aprendizado de máquina (não supervisionada) para modelar dados longitudinais? Eu sempre usei modelos de efeitos mistos (principalmente não lineares), mas queria saber se existem outras maneiras de fazer isso (usando o aprendizado de máquina). Por...

machine-learning mixed-model

11

Modelando com mais variáveis que pontos de dados

Eu sou bastante novo em Machine Learning / Modeling e gostaria de ter um histórico desse problema. Eu tenho um conjunto de dados em que o número de observações é mas o número de variáveis é . Em primeiro lugar, faz sentido considerar a construção de um modelo em um conjunto de dados como este ou...

regression machine-learning dimensionality-reduction penalized

11

Técnica de Machine Learning para aprender padrões de strings

Eu tenho uma lista de palavras, pertencentes a diferentes categorias auto-definidas. Cada categoria tem seu próprio padrão (por exemplo, um possui um comprimento fixo com caracteres especiais, outro existe de caracteres que ocorrem apenas nessa categoria de "palavra", ...). Por exemplo: "ABC"...

machine-learning classification similarities supervised-learning

11

R / mgcv: Por que os produtos tensores te () e ti () produzem superfícies diferentes?

O mgcvpacote para Rpossui duas funções para ajustar as interações do produto tensorial: te()e ti(). Entendo a divisão básica do trabalho entre os dois (ajustando uma interação não linear versus decompondo essa interação em efeitos principais e uma interação). O que não entendo é o porquê te(x1,...

r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

11

O XGBoost pode lidar com dados ausentes na fase de previsão

Recentemente, analisei o algoritmo XGBoost e notei que esse algoritmo pode manipular dados ausentes (sem exigir imputação) na fase de treinamento. Eu queria saber se o XGboost pode lidar com dados ausentes (sem exigir imputação) quando é usado para prever novas observações ou é necessário...

machine-learning missing-data data-imputation xgboost

11

Por que uma grande variedade de K está diminuindo minha pontuação de validação cruzada?

Brincando com o Boston Housing Dataset e RandomForestRegressor(com parâmetros padrão) no scikit-learn, notei algo estranho: a pontuação média de validação cruzada diminuiu à medida que aumentava o número de dobras além de 10. Minha estratégia de validação cruzada era a seguinte: cv_met =...

machine-learning cross-validation random-forest sample-size scikit-learn

11

Qual é a diferença entre dados, Jaccard e coeficientes de sobreposição? [fechadas]

Fechado . Esta pergunta precisa de detalhes ou clareza . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Adicione detalhes e esclareça o problema editando esta postagem . Fechado há 2 anos . Eu me deparei com três medidas...

machine-learning similarities dice segmentation jaccard-similarity