Estatísticas e Big Data

8
Regressão de dados que inclui uma data

Eu tenho um conjunto de dados que contém algumas centenas de transações de três fornecedores que operam em mais de 100 países durante um período de três anos. Descobrimos que o país de vendas não é um fator significativo nos preços alcançados (os produtos são mais ou menos commodities globais)....

8
O residual, e, é um estimador do erro,

Esta questão surgiu em outro tópico que eu comecei, então pensei em obter mais opiniões das pessoas sobre isso. Minha pergunta é O residual, e, é um estimador do erro, ?ϵϵ\epsilon A razão pela qual pergunto é a seguinte. No OLS, a variação dos resíduos, , é conhecida como variação da regressão...

8
Ao fazer inferências sobre as médias de grupo, os intervalos credíveis são sensíveis à variação dentro do sujeito, enquanto os intervalos de confiança não são?

Esta é uma derivação desta pergunta: Como comparar dois grupos com várias medidas para cada indivíduo com R? Nas respostas (aprendi corretamente), aprendi que a variação dentro do sujeito não afeta as inferências feitas sobre as médias de grupo e não há problema em simplesmente tomar as médias...

8
Aproximando as quantidades relativas de moedas no Canadá

Seria possível aproximar com precisão as quantidades relativas de Loonies , Twoonies , moedas, moedas de dez centavos, nickles (e talvez o centavo descontinuado) em circulação, simplesmente obtendo uma amostra suficientemente grande de moedas pelo uso diário? No uso diário, refiro-me às moedas que...

8
Por que usar bayesglm?

Minha pergunta geral é: por que usar em bayesglmvez de outros métodos de classificação? Nota: Estou interessado apenas em previsão. Eu tenho uma quantidade decente de dados (~ 100.000 obs). Sinto que o tamanho da amostra é grande o suficiente para que os parâmetros de uma regressão logística...

8
Procurando o 'cotovelo' nos dados

Subitização é a enumeração rápida e precisa de telas de baixa numerosidade, diferenciada da contagem por uma não linearidade acentuada no gráfico dos tempos de resposta. Abaixo está um gráfico representativo, de Watson, DG, Maylor, EA e Bruce, LAM (2007). Observe que o tempo médio de enumeração...