Perguntas com a marcação «statistics»

Estatística é uma abordagem científica para inferência e predição indutiva baseada em modelos probabilísticos dos dados. Por extensão, abrange o projeto de experimentos e pesquisas para coletar dados para esse fim.

40
Ciência de dados em C (ou C ++)

Sou Rprogramador de idiomas. Também faço parte do grupo de pessoas que são consideradas cientistas de dados, mas que vêm de outras disciplinas acadêmicas que não a CS. Isso funciona bem no meu papel de cientista de dados, no entanto, ao iniciar minha carreira Re ter apenas o conhecimento básico de...

29
Por que o xgboost é muito mais rápido que o sklearn GradientBoostingClassifier?

Estou tentando treinar um modelo de aumento de gradiente com mais de 50 mil exemplos com 100 recursos numéricos. XGBClassifierlida com 500 árvores em 43 segundos na minha máquina, enquanto GradientBoostingClassifierlida com apenas 10 árvores (!) em 1 minuto e 2 segundos :( Não me preocupei em...

24
Algum console do Online R?

Estou procurando um console online para o idioma R. Como se eu escrevesse o código e o servidor fosse executado e me fornecesse a saída. Semelhante ao site

14
Quando os valores p enganam?

Quais são as condições de dados que devemos observar, onde os valores de p podem não ser a melhor maneira de decidir a significância estatística? Existem tipos de problemas específicos que se enquadram nessa

13
Conjuntos de dados que compreendem as melhores práticas

Eu sou um estudante de mestrado em mineração de dados. Meu supervisor me disse uma vez que, antes de executar qualquer classificador ou fazer qualquer coisa com um conjunto de dados, preciso entender completamente os dados e garantir que eles estejam limpos e corretos. Minhas perguntas: Quais...

12
Quantas células LSTM devo usar?

Existem regras práticas (ou regras reais) referentes à quantidade mínima, máxima e "razoável" de células LSTM que devo usar? Especificamente, estou relacionado ao BasicLSTMCell da TensorFlow e à num_unitspropriedade. Suponha que eu tenha um problema de classificação definido por: t - number of...

11
Existem bons modelos de linguagem prontos para uso em python?

Estou prototipando um aplicativo e preciso de um modelo de linguagem para calcular a perplexidade em algumas frases geradas. Existe algum modelo de linguagem treinado em python que eu possa usar facilmente? Algo simples como model = LanguageModel('en') p1 = model.perplexity('This is a well...