Ciência de dados

11
Parâmetro scikit-learn n_jobs sobre uso e memória da CPU

Na maioria dos estimadores no scikit-learn, há um n_jobsparâmetro em fit/ predictmethods para criar trabalhos paralelos usando joblib. Notei que configurá-lo para -1criar apenas 1 processo Python e maximizar os núcleos, fazendo com que o uso da CPU atinja 2500% no topo. Isso é bem diferente de...

11
Abandono em quais camadas do LSTM?

Usando uma camada múltipla LSTMcom desistência, é recomendável colocar desistência em todas as camadas ocultas e nas camadas densas de saída? No artigo de Hinton (que propôs o Dropout), ele apenas colocou o Dropout nas camadas densas, mas isso ocorreu porque as camadas internas ocultas eram...

11
Existem bons modelos de linguagem prontos para uso em python?

Estou prototipando um aplicativo e preciso de um modelo de linguagem para calcular a perplexidade em algumas frases geradas. Existe algum modelo de linguagem treinado em python que eu possa usar facilmente? Algo simples como model = LanguageModel('en') p1 = model.perplexity('This is a well...

10
Quais são as restrições de memória de R?

Ao revisar a " Modelagem Preditiva Aplicada ", um revisor declara : Uma crítica que tenho da pedagogia do aprendizado estatístico (SL) é a ausência de considerações de desempenho computacional na avaliação de diferentes técnicas de modelagem. Com ênfase no bootstrapping e na validação cruzada...

10
Qualificações para programas de doutorado

Yann LeCun mencionado em sua AMA que considera ter um doutorado muito importante para conseguir um emprego em uma empresa de ponta. Tenho mestrado em estatística e minha graduação era em economia e matemática aplicada, mas agora estou estudando programas de doutorado em ML. A maioria dos programas...