Perguntas com a marcação «python»

13

Usando o BIC para estimar o número de k em KMEANS

No momento, estou tentando calcular o BIC para o meu conjunto de dados de brinquedos (ofc iris (:). Quero reproduzir os resultados conforme mostrado aqui (Fig. 5). Esse documento também é minha fonte para as fórmulas do BIC. Eu tenho 2 problemas com isso: Notação: ninin_i = número de elementos...

13

Árvores de decisão melhoradas em python? [fechadas]

Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 4 meses . Existe uma boa biblioteca python para o...

python cart boosting

13

Recursos para aprender a implementar métodos de conjunto

Entendo teoricamente (mais ou menos) como eles funcionariam, mas não tenho certeza de como usar um método de conjunto (como votação, misturas ponderadas etc.). Quais são os bons recursos para implementar métodos de ensemble? Existem recursos específicos em relação à implementação em...

machine-learning python ensemble

13

Quando registrar / expandir suas variáveis ao usar modelos aleatórios de floresta?

Estou fazendo regressão usando florestas aleatórias para prever preços com base em vários atributos. O código é escrito em Python usando o Scikit-learn. Como você decide se deve transformar suas variáveis usando exp/ logantes de usá-las para se ajustar ao modelo de regressão? É necessário ao...

regression machine-learning predictive-models python random-forest

13

Ruby como bancada de estatística

Essa também é uma questão que se relaciona muito com o Python como bancada de estatística e o Excel como bancada de estatística . Eu sei que há uma enorme discussão sobre Ruby versus Python, mas este não é o ponto nesta questão. Eu pensei que Ruby ser mais rápido que Python e ter uma sintaxe muito...

r python software ruby

12

Qual linguagem de programação você recomenda para criar um protótipo de um problema de aprendizado de máquina?

Atualmente trabalhando no Octave, mas devido à documentação insuficiente, o progresso é muito lento. Qual idioma é fácil de aprender e usar, e bem documentado para resolver problemas de aprendizado de máquina? Estou procurando um protótipo em um pequeno conjunto de dados (milhares de exemplos),...

r machine-learning matlab software python

12

Pacote GBM vs. Caret usando GBM

Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 como métrica de...

r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

12

Pacotes Python para trabalhar com modelos de mistura gaussianos (GMMs)

Parece haver várias opções disponíveis para trabalhar com GMMs (Gaussian Mixture Models) em Python. À primeira vista, existem pelo menos: PyMix - http://www.pymix.org/pymix/index.php Ferramentas para modelagem de mistura PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, que...

normal-distribution python mixture

12

Como interpretar o gráfico de autocorrelação no MCMC

Estou me familiarizando com as estatísticas bayesianas lendo o livro Doing Bayesian Data Analysis , de John K. Kruschke, também conhecido como "livro de filhotes". No capítulo 9, modelos hierárquicos são introduzidos com este exemplo simples: yj iθjμκ~ B e r n o u l l i ( θj)~ B e t um ( μ κ , ( 1...

bayesian interpretation python mcmc autocorrelation

12

É possível avaliar o GLM no Python / scikit-learn usando as distribuições Poisson, Gamma ou Tweedie como a família para a distribuição de erros?

Tentando aprender um pouco de Python e Sklearn, mas para o meu trabalho eu preciso executar regressões que usem distribuições de erro das famílias Poisson, Gamma e, especialmente, Tweedie. Não vejo nada na documentação sobre eles, mas eles estão em várias partes da distribuição R, então eu queria...

generalized-linear-model python scikit-learn gradient-descent tweedie-distribution

12

Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <-...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

12

Como calcular efetivamente um kernel gaussiano em numpy [closed]

Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 3 anos . Eu tenho uma matriz numpy com m colunas en...

python kernel-trick numpy

12

Por que essa distribuição é uniforme?

Estamos investigando testes estatísticos bayesianos e deparamos com um fenômeno estranho (para mim pelo menos). Considere o seguinte caso: estamos interessados em medir qual população, A ou B, tem uma taxa de conversão mais alta. Para uma verificação de sanidade, definimos pA=pBpA=pBp_A = p_B ,...

hypothesis-testing bayesian binomial python beta-distribution

12

Regressão logística ordinal em Python

Gostaria de executar uma regressão logística ordinal em Python - para uma variável de resposta com três níveis e com alguns fatores explicativos. O statsmodelspacote suporta os modelos binário de logit e multinomial logit (MNLogit), mas não o logit ordenado. Como a matemática subjacente não é tão...

categorical-data python logit ordered-logit statsmodels

12

Como ajustar (sistematicamente) a taxa de aprendizado com o Gradient Descent como o Otimizador?

Um estranho para o campo ML / DL; iniciou o curso Udacity Deep Learning, baseado no Tensorflow; fazendo a tarefa 3, problema 4; tentando ajustar a taxa de aprendizado com a seguinte configuração: Tamanho do lote 128 Número de etapas: o suficiente para preencher duas épocas Tamanhos de camadas...

python machine-learning tensorflow deep-learning

12

Interpretação de saída Scikit predict_proba

Estou trabalhando com a biblioteca scikit-learn em python. No código abaixo, estou prevendo probabilidade, mas não sei ler a saída. Testando dados from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X =

python scikit-learn

12

O que mostra o gráfico de autocorrelação (pandas)?

Sou iniciante e estou tentando entender o que mostra um gráfico de autocorrelação. Li várias explicações de fontes diferentes, como esta página ou a página relacionada da Wikipedia, entre outras que não estou citando aqui. Eu tenho esse código muito simples, onde tenho datas no meu índice por um...

python autocorrelation pandas

12

Como usar um filtro Kalman?

Eu tenho uma trajetória de um objeto em um espaço 2D (uma superfície). A trajetória é dada como uma sequência de (x,y)coordenadas. Sei que minhas medições são barulhentas e às vezes tenho discrepâncias óbvias. Então, eu quero filtrar minhas observações. Tanto quanto eu entendi o filtro Kalman, ele...

python kalman-filter smoothing

12

Como executar o PCA para dados de dimensionalidade muito alta?

Para executar a análise de componentes principais (PCA), é necessário subtrair os dados de cada coluna, calcular a matriz do coeficiente de correlação e, em seguida, localizar os vetores próprios e os valores próprios. Bem, pelo contrário, foi o que fiz para implementá-lo no Python, exceto que...

pca python

11

Modelos ocultos de Markov com o algoritmo Baum-Welch usando python

Estou procurando alguma implementação python (em python puro ou empacotando materiais existentes) do HMM e Baum-Welch. Algumas ideias? Acabei de pesquisar no google e encontrei material muito ruim em relação a outras técnicas de aprendizado de máquina. Por

python hidden-markov-model