Estatísticas e Big Data

7
Estimativa online de variação com memória limitada

Estou criando um componente que visa calcular a média e a variação de uma métrica associada a eventos que ocorrem durante o tempo, mas com uma memória interna limitada. Imagine que os eventos são visitantes que entram em uma loja e a métrica é a idade deles. Durante o tempo, meu componente recebe...

7
Diferença entre preditivo e prognóstico

Eu ouço muito os termos fatores preditivos e prognósticos (geralmente no contexto da bioestatística) e não tenho muita certeza de qual é a diferença entre eles. Alguém poderia por favor dar uma definição de cada um, um exemplo dos dois e, finalmente, como eles são diferentes um do...

7
Escolha a distribuição de probabilidade para maximizar a função de avaliação (no concurso de previsão de gripe do CDC)

Suponha que você tenha uma variável aleatória discreta com função de massa de probabilidade no suporte . Que função tal que maximiza Para evitar lidar com casos extremos, assuma .XXXp(x)=P(X=x)p(x)=P(X=x)p(x) = P(X=x)0,…,n0,…,n0,\ldots,nq(x)≥0q(x)≥0q(x)\ge 0∑nx=0q(x)=1∑x=0nq(x)=1\sum_{x=0}^n q(x)...

7
Por que essa função não é válida para gerar momentos?

Explique por que não pode haver variável aleatória para a qual , onde M é a função geradora de momento.Mx(t)=t1−tMx(t)=t1−tM_x(t) = \frac{t}{1-t} Tentativa: tentei escrever como a soma de uma série infinita, então de a . Sabemos que a fórmula para um momento que gera a função é . Portanto,...

7
Modelo com complicações

Um modelo de regressão linear regular é , onde são coeficientes desconhecidos e \ varepsilon é ruído gaussiano com média zero e variação constante. Estou construindo um modelo em que o termo de erro \ varepsilon tem duas complicações:y=c′x+εy=c′x+εy = c'x +

7
Esta é uma simulação de Monte Carlo?

Então, vamos comparar duas distribuições normais Do this x times: runs <- 100000 a.samples <- rnorm(runs, mean = 5) b.samples <- rbeta(runs, mean = 0) mc.p.value <- sum(a.samples > b.samples)/runs Os valores mc.p. abaixo de nosso alfa (0,05) dividido por x dariam a taxa de...

7
Regressão para a lei do poder

Este é um post cruzado do Math SE . Eu tenho alguns dados (tempo de execução de um algoritmo) e acho que segue uma lei de energia yr e g= k xumayreg=kxumay_\mathrm{reg} = k x^a Eu quero determinar e . O que fiz até agora é fazer uma regressão linear (mínimos quadrados) através de e determinar e...