Eu aprendi R, mas parece que as empresas estão muito mais interessadas na experiência do SAS. Quais são as vantagens do SAS sobre o
Eu aprendi R, mas parece que as empresas estão muito mais interessadas na experiência do SAS. Quais são as vantagens do SAS sobre o
Aqui está o artigo que motivou esta pergunta: A impaciência nos engorda? Gostei deste artigo e demonstra bem o conceito de "controle de outras variáveis" (QI, carreira, renda, idade etc.) para isolar melhor a verdadeira relação entre apenas as 2 variáveis em questão. Você pode me explicar como...
O estado da arte da não linearidade é usar unidades lineares retificadas (ReLU) em vez da função sigmóide em redes neurais profundas. Quais são as vantagens? Sei que treinar uma rede quando o ReLU é usado seria mais rápido e com inspiração biológica, quais são as outras vantagens? (Ou seja, alguma...
É sempre uma boa ideia treinar com o conjunto de dados completo após a validação cruzada ? Dito de outra forma, é correto treinar com todas as amostras no meu conjunto de dados e não poder verificar se esse acessório específico se encaixa demais ? Alguns antecedentes sobre o problema: Digamos...
Eu recebi esta pergunta durante uma entrevista com a Amazon: 50% de todas as pessoas que recebem uma primeira entrevista recebem uma segunda entrevista 95% dos seus amigos que receberam uma segunda entrevista acharam que tinham uma boa primeira entrevista 75% dos seus amigos que NÃO fizeram uma...
Recentemente, este artigo recebeu muita atenção (por exemplo, do WSJ ). Basicamente, os autores concluem que o Facebook perderá 80% de seus membros até 2017. Eles baseiam suas alegações em uma extrapolação do modelo SIR , um modelo compartimental frequentemente usado em epidemiologia. Seus dados...
Eu tenho usado o KKK validação cruzada fold algumas vezes agora para avaliar o desempenho de alguns algoritmos de aprendizagem, mas eu sempre fui intrigado a respeito de como eu deveria escolher o valor de KKK . Eu sempre vi e usei um valor de K= 10K=10K = 10 , mas isso parece totalmente...
Atualmente, estou usando um SVM com um kernel linear para classificar meus dados. Não há erro no conjunto de treinamento. Tentei vários valores para o parâmetro ( 10 - 5 , … , 10 2 ). Isso não alterou o erro no conjunto de teste.CCC10- 5, ... , 10210-5,...,10210^{-5}, \dots, 10^2 Agora eu me...
Eu tenho um conjunto de dados e gostaria de descobrir qual distribuição se ajusta melhor aos meus dados. Eu usei a fitdistr()função para estimar os parâmetros necessários para descrever a distribuição assumida (ou seja, Weibull, Cauchy, Normal). Usando esses parâmetros, posso realizar um Teste de...
Quais são as funções de custo comuns usadas na avaliação do desempenho de redes neurais? Detalhes (fique à vontade para pular o restante desta pergunta, minha intenção aqui é simplesmente fornecer esclarecimentos sobre a notação que as respostas podem usar para ajudá-las a serem mais...
Qual a diferença entre PCA e MDS clássico? E quanto ao MDS versus o MDS não métrico? Existe um momento em que você prefere um sobre o outro? Como as interpretações
Isso é algo que me incomoda há um tempo e eu não consegui encontrar respostas satisfatórias online, então aqui vai: Depois de revisar um conjunto de palestras sobre otimização convexa, o método de Newton parece ser um algoritmo muito superior ao da descida do gradiente para encontrar soluções...
Estou lendo um livro de mineração de dados e ele mencionou a estatística Kappa como um meio de avaliar o desempenho de previsão dos classificadores. No entanto, eu simplesmente não consigo entender isso. Também verifiquei a Wikipedia, mas também não ajudou:
Em um artigo recente da Amstat News , os autores (Mark van der Laan e Sherri Rose) declararam que "sabemos que, para tamanhos de amostra grandes o suficiente, todos os estudos - incluindo aqueles nos quais a hipótese nula de nenhum efeito é verdadeira - declararão um efeito estatisticamente...
Florestas aleatórias são consideradas caixas pretas, mas recentemente eu estava pensando que conhecimento pode ser obtido de uma floresta aleatória? O mais óbvio é a importância das variáveis, na variante mais simples isso pode ser feito apenas calculando o número de ocorrências de uma variável....
Eu queria saber qual é a diferença entre a variância e o desvio padrão. Se você calcular os dois valores, fica claro que você obtém o desvio padrão da variação, mas o que isso significa em termos da distribuição que você está observando? Além disso, por que você realmente precisa de um desvio...
Estou estudando reconhecimento de padrões e estatística e quase todos os livros que abro sobre o assunto me deparo com o conceito de distância de Mahalanobis . Os livros dão explicações intuitivas, mas ainda não são boas o suficiente para eu realmente entender o que está acontecendo. Se alguém me...
Em um grupo de estudantes, existem 2 de 18 que são canhotos. Encontre a distribuição posterior de estudantes canhotos na população, assumindo não informação prévia. Resuma os resultados. Segundo a literatura, 5-20% das pessoas são canhotos. Leve essas informações em consideração no seu anterior e...
Estou realmente surpreso que ninguém parece ter perguntado isso já ... Ao discutir estimadores, dois termos freqüentemente usados são "consistentes" e "imparciais". Minha pergunta é simples: qual é a diferença? As definições técnicas precisas desses termos são bastante complicadas e é difícil...
Recentemente, tenho lido sobre aprendizagem profunda e estou confuso sobre os termos (ou digamos, tecnologias). Qual é a diferença entre Redes neurais convolucionais (CNN), Máquinas Boltzmann restritas (RBM) e Codificadores