Estatísticas e Big Data

9
Distribuição do desvio padrão

Esta questão abordou a distribuição normal, mas estou me perguntando o que se sabe sobre a distribuição do desvio padrão de uma amostra de tamanho n extraída de uma distribuição arbitrária. Em particular, qual é o desvio padrão do desvio padrão? Para uma distribuição normal, o sd do sd é . Isso é...

9
Boxplot para várias distribuições?

Preciso desenhar 20 distribuições em um único gráfico em R, e isso não me parece bom (confuso) com boxplot regular (20 caixas), mesmo com boxwex = 0,3. Você poderia me sugerir como plotar um tipo de boxplot em R para as 20 distribuições, com pontos para mediana e apenas uma linha em vez de caixa,...

9
Regressão logística ponderada por caso

Estou analisando alguns problemas de regressão logística. ("regular" e "condicional"). Idealmente, eu gostaria de ponderar cada um dos casos de entrada para que o glm se concentre mais em prever os casos de maior peso corretamente, às custas de possivelmente classificar incorretamente os casos de...

9
Conselhos gerais sobre modelagem

Formular um modelo matemático para um problema é um dos aspectos mais subjetivos da estatística, mas também um dos mais importantes. Quais são as melhores referências para lidar com esse tópico crucial, mas muitas vezes negligenciado? E qual famoso estatístico disse algo como "Deixe os dados...

9
Teste Bayesiano AB

Estou executando um Teste AB em uma página que recebe apenas 5 mil visitas por mês. Levaria muito tempo para atingir os níveis de tráfego necessários para medir uma diferença de + -1% entre o teste e o controle. Ouvi dizer que posso usar as estatísticas bayesianas para me dar uma boa chance de...

9
A computação quântica permitirá novas técnicas estatísticas?

Acabei de ler que agora você pode comprar um computador quântico (embora apenas um tenha sido vendido até agora!). A computação quântica terá alguma aplicação em estatística? {edit - para os propósitos da pergunta, vamos supor que eventualmente computadores quânticos (de alguma forma)...

9
Como interpretar valores de p de 0 ou 1?

Fiz uma ANOVA descobrindo, por exemplo, uma interação entre gênero e série do que gostaria de saber em que séries meninos e meninas diferem, mas em muitos casos encontro valores-p (ajustados) de 0 e 1. Como / por que isso é possível? Não parece certo ... as.factor(gender) 1 16 16.2 2.6377 0.104396...