Quais são as semelhanças e diferenças entre estes três métodos: Bagagem, Boosting, Empilhamento? Qual é o melhor? E porque? Você pode me dar um exemplo para cada
Quais são as semelhanças e diferenças entre estes três métodos: Bagagem, Boosting, Empilhamento? Qual é o melhor? E porque? Você pode me dar um exemplo para cada
Li que "a distância euclidiana não é uma boa distância em grandes dimensões". Acho que essa afirmação tem algo a ver com a maldição da dimensionalidade, mas o que exatamente? Além disso, o que são 'altas dimensões'? Tenho aplicado clustering hierárquico usando distância euclidiana com 100 recursos....
Talvez o conceito, por que é usado, e um
As páginas de ajuda em R pressupõem que eu sei o que esses números significam, mas não sei. Estou tentando entender intuitivamente todos os números aqui. Vou postar a saída e comentar o que descobri. Pode haver (haverá) erros, pois vou escrever o que presumo. Gostaria principalmente de saber o que...
Eu estava folheando algumas anotações de aula de Cosma Shalizi (em particular, seção 2.1.1 da segunda aula ), e me lembrei de que você pode obter muito baixo, mesmo quando você tem um modelo completamente linear.R2R2R^2 Parafraseando o exemplo de Shalizi: suponha que você tenha um modelo , em que...
A troca de Joris e Srikant aqui me fez pensar (novamente) se minhas explicações internas para a diferença entre intervalos de confiança e intervalos credíveis eram as corretas. Como você explicaria a
Pesquisou alta e baixa e não conseguiu descobrir o que a AUC, como relacionada à previsão, significa ou
Parece que, através de várias questões relacionadas aqui, há consenso de que a parte "95%" do que chamamos de "intervalo de confiança de 95%" refere-se ao fato de que se replicarmos exatamente nossos procedimentos de amostragem e computação de IC muitas vezes , 95% dos ICs assim calculados...
Sou estudante de psicologia e, à medida que estudo mais e mais independentemente em estatística, fico cada vez mais impressionado com a inadequação do meu treinamento formal. Tanto a experiência pessoal quanto a de segunda mão sugerem que a escassez de rigor estatístico na graduação e na...
Ao treinar uma rede neural, que diferença faz para definir: tamanho do lote para e o número de iterações paraumaumaabbb vs. tamanho do lote em número de iterações emcccddd onde ?a b = c dumab=cd ab = cd Em outras palavras, assumindo que treinamos a rede neural com a mesma quantidade de...
O AIC e o BIC são os dois métodos de avaliação do ajuste do modelo penalizados pelo número de parâmetros estimados. Pelo que entendi, o BIC penaliza mais os modelos por parâmetros livres do que o AIC. Além de uma preferência baseada no rigor dos critérios, existem outros motivos para preferir a AIC...
Parece que vários pacotes estatísticos que uso envolvem esses dois conceitos. No entanto, estou me perguntando se existem suposições diferentes ou 'formalidades' de dados que devem ser verdadeiras para usar uma sobre a outra. Um exemplo real seria incrivelmente
Qual é a diferença entre mineração de dados, estatística, aprendizado de máquina e IA? Seria correto dizer que são quatro campos tentando resolver problemas muito semelhantes, mas com abordagens diferentes? O que exatamente eles têm em comum e onde eles diferem? Se existe algum tipo de hierarquia...
Imagine um cenário padrão de aprendizado de máquina: Você é confrontado com um grande conjunto de dados multivariado e tem uma compreensão bastante embaçada dele. O que você precisa fazer é fazer previsões sobre alguma variável com base no que você tem. Como de costume, você limpa os dados,...
... supondo que eu seja capaz de aumentar o conhecimento deles sobre variação de maneira intuitiva ( Entendendo "variação" intuitivamente ) ou dizendo: É a distância média dos valores dos dados da 'média' - e como a variação está no quadrado unidades, pegamos a raiz quadrada para manter as mesmas...
Portanto, temos média aritmética (AM), média geométrica (GM) e média harmônica (HM). Sua formulação matemática também é bem conhecida, juntamente com seus exemplos estereotipados associados (por exemplo, média harmônica e sua aplicação a problemas relacionados à "velocidade"). No entanto, uma...
Eu gostaria de implementar um algoritmo para seleção automática de modelo. Estou pensando em fazer regressão gradual, mas qualquer coisa serve (porém, deve ser baseada em regressões lineares). Meu problema é que não consigo encontrar uma metodologia ou uma implementação de código aberto (estou...
Qual é o melhor livro de introdução às estatísticas bayesianas? Um livro por resposta, por
Se tenho dados positivos altamente distorcidos, geralmente tomo logs. Mas o que devo fazer com dados não negativos altamente distorcidos que incluem zeros? Eu vi duas transformações usadas: registro( x + 1 )log(x+1)\log(x+1) que possui o recurso puro que 0 mapeia para 0. registro( x + c...
Tenho certeza de que muitas pessoas responderão com links para 'deixe-me pesquisar no google por você', então quero dizer que tentei descobrir isso, por favor, perdoe minha falta de compreensão aqui, mas não consigo descobrir como o implementação prática de uma rede neural realmente funciona....