Alguém pode explicar por que precisamos de um grande número de árvores em florestas aleatórias quando o número de preditores é grande? Como podemos determinar o número ideal de
Alguém pode explicar por que precisamos de um grande número de árvores em florestas aleatórias quando o número de preditores é grande? Como podemos determinar o número ideal de
Em deste artigo intitulado "escolhendo entre lineares generalizados modelos aplicados a médico de dados", escrevem os autores: Em um modelo linear generalizado, a média é transformada pela função de link, em vez de transformar a própria resposta. Os dois métodos de transformação podem levar a...
O que é um gráfico apropriado para ilustrar a relação entre duas variáveis ordinais? Algumas opções que posso pensar: Gráfico de dispersão com tremulação aleatória adicionada para impedir que os pontos se ocultem. Aparentemente, um gráfico padrão - o Minitab chama isso de "gráfico de valores...
Estou curioso sobre a natureza de Σ−1Σ−1\Sigma^{-1} . Alguém pode dizer algo intuitivo sobre "O que Σ−1Σ−1\Sigma^{-1} diz sobre dados?" Editar: Obrigado pelas respostas Depois de fazer alguns ótimos cursos, gostaria de acrescentar alguns pontos: É uma medida de informação, ou seja,...
Concluí minha análise de dados e obtive "resultados estatisticamente significativos", o que é consistente com minha hipótese. No entanto, um estudante de estatística me disse que esta é uma conclusão prematura. Por quê? É necessário incluir mais alguma coisa no meu
No artigo "Discussão: os ecologistas devem se tornar bayesianos?" Brian Dennis fornece uma visão surpreendentemente equilibrada e positiva das estatísticas bayesianas quando seu objetivo parece ser alertar as pessoas sobre isso. No entanto, em um parágrafo, sem citações ou justificativas, ele...
A descida do gradiente tem um problema de ficar preso no mínimo local. Precisamos executar tempos exponenciais de descida de gradiente para encontrar mínimos globais. Alguém pode me falar sobre quaisquer alternativas de descida de gradiente aplicadas no aprendizado de redes neurais, juntamente com...
Eu estava lendo este artigo sobre o fator Bayes para um problema completamente não relacionado quando me deparei com essa passagem O teste de hipóteses com fatores de Bayes é mais robusto do que o teste freqüente de hipóteses, uma vez que a forma bayesiana evita o viés de seleção do modelo,...
Nos últimos anos, as Redes Neurais Convolucionais (CNNs) tornaram-se o estado da arte em reconhecimento de objetos em visão computacional. Normalmente, uma CNN consiste em várias camadas convolucionais, seguidas por duas camadas totalmente conectadas. Uma intuição por trás disso é que as camadas...
Em um post recente de Rong Ge, foi dito que: Acredita-se que, para muitos problemas, incluindo a aprendizagem de redes profundas, quase todos os mínimos locais tenham um valor de função muito semelhante ao ideal global e, portanto, encontrar um mínimo local é bom o suficiente. De onde vem...
Eu já vi "resíduos" definidos de várias maneiras como sendo "valores preditos menos reais" ou "valores reais menos preditos". Para fins de ilustração, para mostrar que as duas fórmulas são amplamente usadas, compare as seguintes pesquisas na Web: residual "previsto menos real" residual "menos...
Existem muitas maneiras de medir quão semelhantes são as duas distribuições de probabilidade. Entre os métodos populares (em diferentes círculos) estão: a distância de Kolmogorov: a sup-distância entre as funções de distribuição; a distância Kantorovich-Rubinstein: a diferença máxima entre as...
O que é "desvio", como é calculado e quais são seus usos em diferentes campos nas estatísticas? Em particular, estou pessoalmente interessado em seus usos no CART (e sua implementação no rpart no R). Estou perguntando isso, já que o artigo wiki parece um pouco ausente e suas idéias serão muito...
Existe a possibilidade de usar R em uma interface da web sem a necessidade de instalá-lo? Eu tenho apenas um pequeno script que gosto de executar, mas só quero tentar sem um longo procedimento de
Dada a variável aleatória Y=max(X1,X2,…,Xn)Y=max(X1,X2,…,Xn)Y = \max(X_1, X_2, \ldots, X_n) onde XiXiX_i são variáveis uniformes do IID, como faço para calcular o PDF de YYY
Minha pergunta principal é como interpretar a saída (coeficientes, F, P) ao realizar uma ANOVA tipo I (seqüencial)? Meu problema de pesquisa específico é um pouco mais complexo, então vou dividir meu exemplo em partes. Primeiro, se estou interessado no efeito da densidade da aranha (X1) no...
No campo da economia (eu acho), temos ARIMA e GARCH para séries temporais espaçadas regularmente e Poisson, Hawkes para modelagem de processos pontuais, e quanto a tentativas de modelar séries temporais espaçadas irregularmente (desigualmente) - existem (pelo menos) práticas comuns ? (Se você tem...
Qual é a diferença entre 'Normalização' e 'Escalonamento' de dados? Até agora, pensei que os dois termos se referissem ao mesmo processo, mas agora percebo que há algo mais que não sei / entendo. Além disso, se houver uma diferença entre Normalização e Escalonamento, quando devemos usar a...
Todos conhecemos estudos observacionais que tentam estabelecer um nexo de causalidade entre um preditor não aleatório X e um resultado, incluindo todos os possíveis fatores de confusão imagináveis em um modelo de regressão múltipla. Ao “controlar” todos os fatores de confusão, diz o argumento,...
Sei que estou perdendo algo no meu entendimento da regressão logística e realmente aprecio qualquer ajuda. Pelo que entendi, a regressão logística pressupõe que a probabilidade de um resultado '1' dado os insumos seja uma combinação linear dos insumos passados por uma função de logística...