Perguntas com a marcação «sampling»

13
Agrupe Big Data em R e a amostragem é relevante?

Eu sou novo na ciência de dados e tenho um problema ao encontrar clusters em um conjunto de dados com 200.000 linhas e 50 colunas em R. Como os dados têm variáveis ​​numéricas e nominais, métodos como o K-significa que usa a medida de distância euclidiana não parece ser uma escolha apropriada....

12
Diferenças entre PROC Mixed e lme / lmer em R - graus de liberdade

Nota: esta pergunta é um repost, pois minha pergunta anterior teve que ser excluída por razões legais. Ao comparar o PROC MIXED do SAS com a função lmedo nlmepacote no R, deparei-me com algumas diferenças bastante confusas. Mais especificamente, os graus de liberdade nos diferentes testes...

12
Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <-...

12
Métodos MCMC - queima de amostras?

Nos métodos MCMC , continuo lendo sobre o burn-intempo ou o número de amostras para "burn". O que é isso exatamente e por que é necessário? Atualizar: Depois que o MCMC se estabiliza, ele permanece estável? Como a noção de burn-intempo está relacionada à noção de tempo de...

11
Amostragem de Gibbs para o modelo Ising

Pergunta de lição de casa: Considere o modelo Ising 1-d. Vamos . x i é -1 ou +1x = ( x1, . . . xd)x=(x1,...xd)x = (x_1,...x_d)xEuxix_i π( X ) α e∑39.i = 1xEuxi + 1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} Crie um algoritmo de amostragem de gibbs para gerar amostras...