Estatísticas e Big Data

9
Como testar a mediana de uma população?

Eu tenho uma amostra de 250 unidades. A distribuição é assimétrica. Quero testar uma hipótese de que a mediana da população é diferente de 3,5, por isso acho que um teste de uma amostra seria apropriado. Eu sei que o teste de Wilcoxon não é apropriado porque a distribuição não é simétrica. Um teste...

9
Como reorganizar dados 2D para obter correlação?

Eu tenho o seguinte conjunto de dados simples com duas variáveis ​​contínuas; ou seja: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Preciso reorganizar os dados para que a correlação entre as variáveis ​​seja ~...

9
Calcular quantil da soma das distribuições de quantis específicos

Vamos supor variáveis ​​aleatórias independentes para as quais os quantis em algum nível específico são conhecidos por estimativa a partir dos dados: , ..., . Agora vamos definir a variável aleatória como a soma . Existe uma maneira de calcular o valor do quantil da soma no nível , ou seja, em ?X 1...

9
Monte Carlo == aplica um processo aleatório?

Eu nunca tive um curso formal de estatística, mas devido à minha linha de pesquisa, estou constantemente encontrando artigos que aplicam vários conceitos estatísticos. Muitas vezes, vejo uma descrição de um processo de Monte Carlo aplicado a uma determinada situação e, pelo que consigo reunir 9 em...

9
Selecionando nós para um GAM

Ao selecionar um número apropriado de nós para um GAM, convém levar em consideração o número de dados e incrementos no eixo x. E se tivermos 100 incrementos no eixo x com 1000 pontos de dados em cada incremento. A informação aqui diz: Se eles não forem fornecidos, os nós do spline serão...