Estatísticas e Big Data

9
As transformações de dados em dados não normais são necessárias para uma análise fatorial exploratória ao usar o método de extração do fator principal de eixo?

Estou desenvolvendo um questionário para medir quatro fatores que constituem espiritualidade e gostaria de fazer a seguinte pergunta: As transformações de dados em dados não normais são necessárias para uma análise fatorial exploratória ao usar o método de extração do fator principal de eixo? Eu...

9
Como comparar eventos observados x eventos esperados?

Suponha que eu tenha uma amostra de frequências de 4 eventos possíveis: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e tenho as probabilidades esperadas de meus eventos ocorrerem: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Com a soma das frequências observadas dos meus quatro eventos (18), posso calcular as...

9
Distribuições hiperprior para os parâmetros (matriz de escala e graus de liberdade) de um wishart antes de uma matriz de covariância inversa

Estou estimando várias matrizes de covariância inversa de um conjunto de medidas em diferentes subpopulações usando um wishart anterior em jags / rjags / R. Em vez de especificar uma matriz de escala e graus de liberdade na matriz de covariância inversa anterior (a distribuição wishart), eu...

9
"Como

Pergunta curta: por que isso é verdade? Pergunta longa: Muito simplesmente, estou tentando descobrir o que justifica essa primeira equação. O autor do livro que estou lendo (contexto aqui, se você quiser, mas não é necessário), afirma o seguinte: Devido à suposição de quase gaussianidade,...

9
Como usar R gbm com distribution = “adaboost”?

A documentação afirma que R gbm com distribution = "adaboost" pode ser usado para o problema de classificação 0-1. Considere o seguinte fragmento de código: gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000) gbm_predicted <- predict(gbm_algorithm,...