Estatísticas e Big Data

43
Compêndio de técnicas de validação cruzada

Gostaria de saber se alguém conhece um compêndio de técnicas de validação cruzada com uma discussão das diferenças entre eles e um guia sobre quando usar cada um deles. A Wikipedia possui uma lista das técnicas mais comuns, mas estou curioso para saber se existem outras técnicas e se existem...

43
Como comparar estatisticamente duas séries temporais?

Eu tenho duas séries temporais, mostradas na plotagem abaixo: O gráfico mostra os detalhes completos das duas séries temporais, mas posso reduzi-lo facilmente a apenas as observações coincidentes, se necessário. Minha pergunta é: Quais métodos estatísticos posso usar para avaliar as diferenças...

43
Suposições aleatórias da floresta

Eu sou uma espécie de floresta aleatória, então ainda estou lutando com alguns conceitos básicos. Na regressão linear, assumimos observações independentes, variação constante… Quais são as suposições / hipóteses básicas que fazemos quando usamos floresta aleatória? Quais são as principais...

43
Camada Softmax em uma rede neural

Estou tentando adicionar uma camada softmax a uma rede neural treinada com retropropagação, então estou tentando calcular seu gradiente. A saída do softmax é hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}} , ondejjjé o número de neurónios de saída. Se eu der, então eu...

43
Os CDFs são mais fundamentais que os PDFs?

Meu professor de estatística disse basicamente que, se receber um dos três seguintes, você poderá encontrar os outros dois: Função de distribuição cumulativa Função Geradora de Momento Função densidade de probabilidade Mas meu professor de econometria disse que os CDFs são mais fundamentais...