Estatísticas e Big Data

9
Representando dados experimentais

Eu tenho uma discussão com meu orientador sobre a visualização de dados. Ele afirma que, ao representar resultados experimentais, os valores devem ser plotados apenas com " marcadores ", conforme apresentado na imagem abaixo. Enquanto as curvas devem representar apenas um " modelo " Por outro...

9
Entendendo os bigodes de um boxplot

Eu tenho uma pergunta sobre a interpretação dos bigodes de um boxplot. Li o seguinte: "Na parte superior e inferior do retângulo, os" bigodes "mostram o intervalo de 1,5 vezes a distância entre os quantis de 0,25 e 0,75", mas não compreendem completamente o que se entende por "distância". . Não é...

9
Regressão ao quebra-cabeça médio

No capítulo "Regressão à média" de "Pensando, rápido e devagar", de Daniel Kahneman, um exemplo é dado e o leitor é solicitado a prever as vendas de lojas individuais, considerando a previsão geral de vendas e os números de vendas do ano anterior . Por exemplo (o exemplo do livro tem 4 lojas, eu...

9
O que se entende por "nível" de uma série temporal?

Em boa parte da literatura que estou estudando, é um desses termos que ocorre com frequência e ainda sem uma definição rigorosa a ser encontrada. Especificamente, me disseram: Para variáveis ​​aleatórias indexadas no tempo (RVs) , o modelo de decomposição aditiva é dado como{ Xt}{Xt}\{X_t\}...

9
Escolhendo clusters para k-means: o caso de 1 cluster

Alguém conhece um bom método para determinar se o agrupamento usando kmeans é apropriado? Ou seja, e se sua amostra for realmente homogênea? Eu sei que algo como um modelo de mistura (via mclust em R) fornecerá estatísticas de ajuste para o caso de cluster 1: k, mas parece que todas as técnicas...