Estatísticas e Big Data

46

O número ideal de árvores em uma floresta aleatória depende do número de preditores?

Alguém pode explicar por que precisamos de um grande número de árvores em florestas aleatórias quando o número de preditores é grande? Como podemos determinar o número ideal de

machine-learning random-forest

46

Modelo linear com resposta transformada por log vs. modelo linear generalizado com link de log

Em deste artigo intitulado "escolhendo entre lineares generalizados modelos aplicados a médico de dados", escrevem os autores: Em um modelo linear generalizado, a média é transformada pela função de link, em vez de transformar a própria resposta. Os dois métodos de transformação podem levar a...

generalized-linear-model model-selection lognormal

46

Gráfico para relacionamento entre duas variáveis ordinais

O que é um gráfico apropriado para ilustrar a relação entre duas variáveis ordinais? Algumas opções que posso pensar: Gráfico de dispersão com tremulação aleatória adicionada para impedir que os pontos se ocultem. Aparentemente, um gráfico padrão - o Minitab chama isso de "gráfico de valores...

data-visualization categorical-data ordinal-data scatterplot

46

O que a matriz de inversão de covariância diz sobre dados? (Intuitivamente)

Estou curioso sobre a natureza de Σ−1Σ−1\Sigma^{-1} . Alguém pode dizer algo intuitivo sobre "O que Σ−1Σ−1\Sigma^{-1} diz sobre dados?" Editar: Obrigado pelas respostas Depois de fazer alguns ótimos cursos, gostaria de acrescentar alguns pontos: É uma medida de informação, ou seja,...

bayesian maximum-likelihood covariance matrix

46

Por que “estatisticamente significativo” não é suficiente?

Concluí minha análise de dados e obtive "resultados estatisticamente significativos", o que é consistente com minha hipótese. No entanto, um estudante de estatística me disse que esta é uma conclusão prematura. Por quê? É necessário incluir mais alguma coisa no meu

hypothesis-testing statistical-significance spss p-value

46

Por que um bayesiano não pode olhar para os resíduos?

No artigo "Discussão: os ecologistas devem se tornar bayesianos?" Brian Dennis fornece uma visão surpreendentemente equilibrada e positiva das estatísticas bayesianas quando seu objetivo parece ser alertar as pessoas sobre isso. No entanto, em um parágrafo, sem citações ou justificativas, ele...

bayesian residuals frequentist likelihood-principle

46

Quais são as alternativas de Gradient Descent?

A descida do gradiente tem um problema de ficar preso no mínimo local. Precisamos executar tempos exponenciais de descida de gradiente para encontrar mínimos globais. Alguém pode me falar sobre quaisquer alternativas de descida de gradiente aplicadas no aprendizado de redes neurais, juntamente com...

machine-learning svm neural-networks

46

Por que o teste de hipóteses freqüentista se torna tendencioso para rejeitar a hipótese nula com amostras suficientemente grandes?

Eu estava lendo este artigo sobre o fator Bayes para um problema completamente não relacionado quando me deparei com essa passagem O teste de hipóteses com fatores de Bayes é mais robusto do que o teste freqüente de hipóteses, uma vez que a forma bayesiana evita o viés de seleção do modelo,...

hypothesis-testing frequentist

46

Por que as redes neurais convolucionais não usam uma máquina de vetores de suporte para classificar?

Nos últimos anos, as Redes Neurais Convolucionais (CNNs) tornaram-se o estado da arte em reconhecimento de objetos em visão computacional. Normalmente, uma CNN consiste em várias camadas convolucionais, seguidas por duas camadas totalmente conectadas. Uma intuição por trás disso é que as camadas...

machine-learning neural-networks svm deep-learning conv-neural-network

46

Noções básicas sobre “quase todos os locais mínimos têm um valor de função muito semelhante ao ideal global”

Em um post recente de Rong Ge, foi dito que: Acredita-se que, para muitos problemas, incluindo a aprendizagem de redes profundas, quase todos os mínimos locais tenham um valor de função muito semelhante ao ideal global e, portanto, encontrar um mínimo local é bom o suficiente. De onde vem...

machine-learning neural-networks optimization deep-learning

46

Os resíduos são "previstos menos reais" ou "reais menos previstos"

Eu já vi "resíduos" definidos de várias maneiras como sendo "valores preditos menos reais" ou "valores reais menos preditos". Para fins de ilustração, para mostrar que as duas fórmulas são amplamente usadas, compare as seguintes pesquisas na Web: residual "previsto menos real" residual "menos...

residuals terminology error

45

Motivação para a distância Kolmogorov entre distribuições

Existem muitas maneiras de medir quão semelhantes são as duas distribuições de probabilidade. Entre os métodos populares (em diferentes círculos) estão: a distância de Kolmogorov: a sup-distância entre as funções de distribuição; a distância Kantorovich-Rubinstein: a diferença máxima entre as...

distributions probability hypothesis-testing mathematical-statistics

45

O que é Deviance? (especificamente em CART / rpart)

O que é "desvio", como é calculado e quais são seus usos em diferentes campos nas estatísticas? Em particular, estou pessoalmente interessado em seus usos no CART (e sua implementação no rpart no R). Estou perguntando isso, já que o artigo wiki parece um pouco ausente e suas idéias serão muito...

r cart rpart deviance

45

Usando o R online - sem instalá-lo [fechado]

Existe a possibilidade de usar R em uma interface da web sem a necessidade de instalá-lo? Eu tenho apenas um pequeno script que gosto de executar, mas só quero tentar sem um longo procedimento de

r

45

Como você calcula a função de densidade de probabilidade do máximo de uma amostra de variáveis aleatórias uniformes do IID?

Dada a variável aleatória Y=max(X1,X2,…,Xn)Y=max(X1,X2,…,Xn)Y = \max(X_1, X_2, \ldots, X_n) onde XiXiX_i são variáveis uniformes do IID, como faço para calcular o PDF de YYY

pdf maximum

45

Como interpretar ANOVA e MANOVA do tipo I, tipo II e tipo III?

Minha pergunta principal é como interpretar a saída (coeficientes, F, P) ao realizar uma ANOVA tipo I (seqüencial)? Meu problema de pesquisa específico é um pouco mais complexo, então vou dividir meu exemplo em partes. Primeiro, se estou interessado no efeito da densidade da aranha (X1) no...

r hypothesis-testing anova manova sums-of-squares

45

Existe algum padrão ouro para modelar séries temporais com espaçamento irregular?

No campo da economia (eu acho), temos ARIMA e GARCH para séries temporais espaçadas regularmente e Poisson, Hawkes para modelagem de processos pontuais, e quanto a tentativas de modelar séries temporais espaçadas irregularmente (desigualmente) - existem (pelo menos) práticas comuns ? (Se você tem...

time-series garch poisson-process point-process unevenly-spaced-time-series

45

Normalização vs. escala

Qual é a diferença entre 'Normalização' e 'Escalonamento' de dados? Até agora, pensei que os dois termos se referissem ao mesmo processo, mas agora percebo que há algo mais que não sei / entendo. Além disso, se houver uma diferença entre Normalização e Escalonamento, quando devemos usar a...

data-transformation scales normality-assumption normalization

45

Quão bem a regressão múltipla pode realmente “controlar” as covariáveis?

Todos conhecemos estudos observacionais que tentam estabelecer um nexo de causalidade entre um preditor não aleatório X e um resultado, incluindo todos os possíveis fatores de confusão imagináveis em um modelo de regressão múltipla. Ao “controlar” todos os fatores de confusão, diz o argumento,...

multiple-regression ancova observational-study

45

Como simular dados artificiais para regressão logística?

Sei que estou perdendo algo no meu entendimento da regressão logística e realmente aprecio qualquer ajuda. Pelo que entendi, a regressão logística pressupõe que a probabilidade de um resultado '1' dado os insumos seja uma combinação linear dos insumos passados por uma função de logística...

r regression logistic generalized-linear-model simulation