Ciência de dados - página 51

7

Por que os métodos de gradiente de política são preferidos à aproximação da função de valor em domínios de ação contínua?

Na aproximação função-valor, em particular no aprendizado profundo de Q, entendo que primeiro previmos os valores de Q para cada ação. No entanto, quando existem muitas ações, essa tarefa não é fácil. Mas na iteração de política, também temos que gerar um vetor softmax relacionado a cada ação....

reinforcement-learning

7

Como obter uma pontuação de confiança para as previsões?

Em um problema de regressão, é possível calcular uma pontuação de confiança / confiabilidade para uma determinada previsão, considerando modelos como XGBoost ou Neural Networks?

machine-learning neural-network regression decision-trees xgboost

7

Como você descreveria a troca entre a interpretabilidade do modelo e o poder de previsão do modelo em termos leigos?

Eu sei que depende dos dados e da pergunta, mas imagine um cenário em que, para um determinado conjunto de dados, você poderia optar por um modelo não linear bastante complexo (difícil de interpretar), fornecendo um melhor poder de previsão, talvez porque o modelo pode ver as não linearidades...

machine-learning predictive-modeling model-selection

7

Compreensão de bayes ingênuos: computando as probabilidades condicionais

Para uma tarefa de análise de sentimentos, suponha que tenhamos algumas classes representadas por características .ccciii Podemos representar a probabilidade condicional de cada classe como: que representa cada recurso e é a classe temos. , podemos representar Nossos antecedentes para cada...

machine-learning nlp naive-bayes-classifier sentiment-analysis natural-language-process

7

qual topologia de rede neural aprender correlações entre séries temporais?

Tenho duas (ou mais, em princípio) séries temporais 1xN e gostaria de treinar um NN para prever o próximo valor de ambos. Posso organizá-los como uma matriz 2xN e alimentar uma janela dessa matriz como entrada para o NN, mas não sei como estruturar o próprio NN. Eu fiz um NN com convoluções que...

machine-learning neural-network time-series correlation

7

Posso obter dados numéricos de um mapa de cores?

Na minha turma, muitas vezes preciso trabalhar com imagens de mapa de cores. Eu mostrava a imagem e tentava fazer inferências / observações sobre diferentes assuntos. Muitas vezes, eu realmente preciso quantificar alguns aspectos, mas é sempre muito aproximado e de alguma forma vago, porque as...

image-recognition software-recommendation

7

O Tensorflow suporta um classificador de árvore de decisão?

Estou tentando implementar o classificador de árvore de decisão para classificar meu conjunto de dados. Eu estou usando Python. Agora é fácil implementar no scikit learn, mas como posso implementar isso no

machine-learning python deep-learning tensorflow decision-trees

7

Como corrigir o desequilíbrio de classe na amostra de treinamento?

Recentemente, fui entrevistado em uma entrevista de emprego sobre soluções para corrigir um desequilíbrio de classes no conjunto de dados de treinamento. Vamos nos concentrar em um caso de classificação binária. Ofereci duas soluções: superamostrar a classe minoritária alimentando lotes de dados...

training unbalanced-classes class-imbalance

7

Existe alguma função de ativação que possa tornar a normalização do lote obsoleta?

Enquanto aprendia a normalização de lotes, eu estava pensando por que não podemos resolver o "problema da escala de gradiente" usando uma função de ativação apropriada? Como não podemos atrasar e dimensionar a função de ativação em vez de dimensionar todo o conjunto de dados e garantir que a...

machine-learning

7

O que o deixa confiante em seus resultados? Em que momento você acha que pode apresentar seu trabalho aos superiores analfabetos da tecnologia?

Entendo que os modelos são tão bons quanto os dados que você obtém, e o design incorreto pode gerar dados realmente ruins. Amostras não aleatórias, projetos desequilibrados / incompletos, confusos, podem dificultar a análise dos dados. Em que ponto devemos confiar que eles executaram um modelo...

performance accuracy

7

Os modelos de aprendizado profundo estão acima da capacidade necessária para as entropias estimadas de seus conjuntos de dados?

essa pergunta pode parecer um pouco estranha. Eu estava fazendo alguns auto-estudos sobre teoria da informação e decidi fazer algumas investigações mais formais sobre aprendizado profundo. Por favor, tenha paciência comigo enquanto tento explicar. Tomei um grande subconjunto de "treinamento" do...

neural-network deep-learning information-theory

7

migrando para python do R: perguntas específicas

Eu tenho usado o R e o RStudio para criação de protótipos e modelos e, devido a alguns problemas persistentes (que só seriam aplicáveis ao ambiente em que estou usando), decidimos usar o python. Estou procurando saber: existe um ambiente de desenvolvimento python como "RStudio Server"? Quão...

machine-learning python scikit-learn

7

Pergunta sobre compensação de desvio e desvio e meios de otimização

Por isso, fiquei imaginando como alguém, por exemplo, pode otimizar melhor o modelo que está tentando construir quando confrontado com problemas apresentados por alto viés ou alta variação. Agora, é claro, você pode jogar com o parâmetro de regularização para chegar a um final satisfatório, mas eu...

machine-learning variance bias

7

Como plotar clusters de uma maneira agradável?

Eu tenho um grande conjunto de dados de texto em cluster. Cada cluster é representado por um centróide dos textos vetorizados que pertencem a ele, o número de textos, a data de criação e outros parâmetros. Não consigo plotar os agrupamentos em um espaço n-dimensional. Quais opções eu...

clustering text-mining plotting matplotlib

7

Implementação da descida estocástica de gradiente em Python

Eu estou tentando implementar um algoritmo básico de descida de gradiente estocástico para uma regressão linear 2D em python. Recebi um código padrão para o GD baunilha e tentei convertê-lo para trabalhar para o SGD. Especificamente - estou um pouco inseguro quanto à implementação correta da...

linear-regression gradient-descent

7

Saco de Palavras Visuais

O que estou tentando fazer: Estou tentando classificar algumas imagens usando recursos locais e globais. O que eu fiz até agora: Eu extraí descritores de peneiração para cada imagem e estou usando isso como minha entrada para k-means para criar meu vocabulário a partir de todos os recursos de...

python clustering image-classification k-means

7

Previsão de séries de dados com vários recursos

Estou investigando um problema em que os pontos de dados têm características desiguais. Cada instância representa a progressão de um item em todo o sistema. Alguns deles progrediram até o ponto final, outros ainda estão em estágios intermediários. O número de estágios é conhecido (10 no total)....

machine-learning feature-scaling

7

Pode-se construir modelos lineares em "partes" do conjunto de dados, se não for possível construí-los em todo o conjunto de dados?

Pode-se construir modelos lineares em "blocos" do conjunto de dados, se não for possível construí-los em todo o conjunto de dados? Particularmente, ainda tenho mais de 88 mil variáveis (recursos) restantes e não se pode fazer muito com elas sem grandes quantidades de memória. Mas fazer modelos...

bigdata linear-regression

7

Como desenhar diagramas de redes neurais convolucionais?

Eu tenho que desenhar um diagrama da CNN semelhante a este: Tentei todas as ferramentas mencionadas em https://datascience.stackexchange.com/a/14900 , mas não há uma maneira fácil de fazer isso. Existe alguma maneira automatizada de fazer isso? Ou eu tenho que fazer isso manualmente. Além disso,...

machine-learning neural-network deep-learning

7

Pressupostos da regressão linear

Em termos simples, quais são os pressupostos da regressão linear? Eu só quero saber quando posso aplicar um modelo de regressão linear ao nosso conjunto de

linear-regression