Estatísticas e Big Data

143

R vs SAS, por que o SAS é preferido por empresas privadas?

Eu aprendi R, mas parece que as empresas estão muito mais interessadas na experiência do SAS. Quais são as vantagens do SAS sobre o

r sas

141

Como exatamente "se controla para outras variáveis"?

Aqui está o artigo que motivou esta pergunta: A impaciência nos engorda? Gostei deste artigo e demonstra bem o conceito de "controle de outras variáveis" (QI, carreira, renda, idade etc.) para isolar melhor a verdadeira relação entre apenas as 2 variáveis em questão. Você pode me explicar como...

regression causality confounding controlling-for-a-variable statistics-in-media

141

Quais são as vantagens do ReLU sobre a função sigmóide em redes neurais profundas?

O estado da arte da não linearidade é usar unidades lineares retificadas (ReLU) em vez da função sigmóide em redes neurais profundas. Quais são as vantagens? Sei que treinar uma rede quando o ReLU é usado seria mais rápido e com inspiração biológica, quais são as outras vantagens? (Ou seja, alguma...

machine-learning neural-networks deep-learning

140

Treinando com o conjunto de dados completo após a validação cruzada?

É sempre uma boa ideia treinar com o conjunto de dados completo após a validação cruzada ? Dito de outra forma, é correto treinar com todas as amostras no meu conjunto de dados e não poder verificar se esse acessório específico se encaixa demais ? Alguns antecedentes sobre o problema: Digamos...

machine-learning cross-validation model-selection

139

Pergunta para entrevista na Amazon - probabilidade de segunda entrevista

Eu recebi esta pergunta durante uma entrevista com a Amazon: 50% de todas as pessoas que recebem uma primeira entrevista recebem uma segunda entrevista 95% dos seus amigos que receberam uma segunda entrevista acharam que tinham uma boa primeira entrevista 75% dos seus amigos que NÃO fizeram uma...

probability conditional-probability

138

O Facebook está chegando ao fim?

Recentemente, este artigo recebeu muita atenção (por exemplo, do WSJ ). Basicamente, os autores concluem que o Facebook perderá 80% de seus membros até 2017. Eles baseiam suas alegações em uma extrapolação do modelo SIR , um modelo compartimental frequentemente usado em epidemiologia. Seus dados...

hypothesis-testing correlation epidemiology social-network

136

Escolha de K na validação cruzada K-fold

Eu tenho usado o KKK validação cruzada fold algumas vezes agora para avaliar o desempenho de alguns algoritmos de aprendizagem, mas eu sempre fui intrigado a respeito de como eu deveria escolher o valor de KKK . Eu sempre vi e usei um valor de K= 10K=10K = 10 , mas isso parece totalmente...

machine-learning classification cross-validation

134

Qual é a influência de C em SVMs com kernel linear?

Atualmente, estou usando um SVM com um kernel linear para classificar meus dados. Não há erro no conjunto de treinamento. Tentei vários valores para o parâmetro ( 10 - 5 , … , 10 2 ). Isso não alterou o erro no conjunto de teste.CCC10- 5, ... , 10210-5,...,10210^{-5}, \dots, 10^2 Agora eu me...

machine-learning svm libsvm

133

Como determinar qual distribuição se ajusta melhor aos meus dados?

Eu tenho um conjunto de dados e gostaria de descobrir qual distribuição se ajusta melhor aos meus dados. Eu usei a fitdistr()função para estimar os parâmetros necessários para descrever a distribuição assumida (ou seja, Weibull, Cauchy, Normal). Usando esses parâmetros, posso realizar um Teste de...

r distributions goodness-of-fit kolmogorov-smirnov distribution-identification

133

Uma lista de funções de custo usadas em redes neurais, juntamente com aplicativos

Quais são as funções de custo comuns usadas na avaliação do desempenho de redes neurais? Detalhes (fique à vontade para pular o restante desta pergunta, minha intenção aqui é simplesmente fornecer esclarecimentos sobre a notação que as respostas podem usar para ajudá-las a serem mais...

machine-learning neural-networks

133

Qual é a diferença entre análise de componentes principais e escala multidimensional?

Qual a diferença entre PCA e MDS clássico? E quanto ao MDS versus o MDS não métrico? Existe um momento em que você prefere um sobre o outro? Como as interpretações

pca multidimensional-scaling pcoa

132

Por que o método de Newton não é amplamente utilizado no aprendizado de máquina?

Isso é algo que me incomoda há um tempo e eu não consegui encontrar respostas satisfatórias online, então aqui vai: Depois de revisar um conjunto de palestras sobre otimização convexa, o método de Newton parece ser um algoritmo muito superior ao da descida do gradiente para encontrar soluções...

machine-learning optimization gradient-descent hessian

131

Kappa de Cohen em inglês comum

Estou lendo um livro de mineração de dados e ele mencionou a estatística Kappa como um meio de avaliar o desempenho de previsão dos classificadores. No entanto, eu simplesmente não consigo entender isso. Também verifiquei a Wikipedia, mas também não ajudou:

classification data-mining cohens-kappa

129

Os grandes conjuntos de dados são inadequados para o teste de hipóteses?

Em um artigo recente da Amstat News , os autores (Mark van der Laan e Sherri Rose) declararam que "sabemos que, para tamanhos de amostra grandes o suficiente, todos os estudos - incluindo aqueles nos quais a hipótese nula de nenhum efeito é verdadeira - declararão um efeito estatisticamente...

hypothesis-testing sample-size dataset large-data

127

Obtendo conhecimento de uma floresta aleatória

Florestas aleatórias são consideradas caixas pretas, mas recentemente eu estava pensando que conhecimento pode ser obtido de uma floresta aleatória? O mais óbvio é a importância das variáveis, na variante mais simples isso pode ser feito apenas calculando o número de ocorrências de uma variável....

machine-learning data-mining interaction random-forest cart

127

Qual é a diferença entre variância e desvio padrão?

Eu queria saber qual é a diferença entre a variância e o desvio padrão. Se você calcular os dois valores, fica claro que você obtém o desvio padrão da variação, mas o que isso significa em termos da distribuição que você está observando? Além disso, por que você realmente precisa de um desvio...

variance mathematical-statistics standard-deviation

127

Explicação de baixo para cima da distância de Mahalanobis?

Estou estudando reconhecimento de padrões e estatística e quase todos os livros que abro sobre o assunto me deparo com o conceito de distância de Mahalanobis . Os livros dão explicações intuitivas, mas ainda não são boas o suficiente para eu realmente entender o que está acontecendo. Se alguém me...

normal-distribution mathematical-statistics distance pattern-recognition intuition

125

Ajude-me a entender as distribuições Bayesianas anteriores e posteriores

Em um grupo de estudantes, existem 2 de 18 que são canhotos. Encontre a distribuição posterior de estudantes canhotos na população, assumindo não informação prévia. Resuma os resultados. Segundo a literatura, 5-20% das pessoas são canhotos. Leve essas informações em consideração no seu anterior e...

distributions bayesian prior posterior

125

Qual é a diferença entre um estimador consistente e um estimador imparcial?

Estou realmente surpreso que ninguém parece ter perguntado isso já ... Ao discutir estimadores, dois termos freqüentemente usados são "consistentes" e "imparciais". Minha pergunta é simples: qual é a diferença? As definições técnicas precisas desses termos são bastante complicadas e é difícil...

unbiased-estimator estimators consistency

123

Qual é a diferença entre redes neurais convolucionais, máquinas Boltzmann restritas e auto-codificadores?

Recentemente, tenho lido sobre aprendizagem profunda e estou confuso sobre os termos (ou digamos, tecnologias). Qual é a diferença entre Redes neurais convolucionais (CNN), Máquinas Boltzmann restritas (RBM) e Codificadores

neural-networks deep-learning conv-neural-network autoencoders rbm