Estatísticas e Big Data

9
Técnica não ortogonal análoga à PCA

Suponha que eu tenha um conjunto de dados de ponto 2D e queira detectar as direções de todos os máximos locais de variação nos dados, por exemplo: O PCA não ajuda nessa situação, pois é uma decomposição ortogonal e, portanto, não pode detectar ambas as linhas que eu indiquei em azul; sua saída...

9
Residuais em regressão de poisson

O Guia para Iniciantes do Zuur 2013 do GLM e GLMM sugere a validação de uma regressão de Poisson, plotando os resíduos de Pearsons em relação aos valores ajustados. Zuur afirma que não devemos ver os resíduos se espalhando à medida que os valores ajustados aumentam, como o gráfico anexado...

9
Como incluir

Quero incluir o termo xxx e seu quadrado x2x2x^2 (variáveis ​​preditoras) em uma regressão, porque presumo que valores baixos de xxx tenham um efeito positivo na variável dependente e valores altos tenham um efeito negativo. O x2x2x^2 deve capturar o efeito dos valores mais altos. Portanto, espero...

9
Incompreensão da estimativa de Monte Carlo Pi

Estou bastante certo de que entendo como a integração de Monte Carlo funciona, mas não estou entendendo a formulação de como é usada para estimar o Pi. Estou seguindo o procedimento descrito no quinto slide desta apresentação http://homepages.inf.ed.ac.uk/imurray2/teaching/09mlss/slides.pdf Eu...

9
Poder em proteômica?

As bolsas geralmente exigem análise de energia para suportar um tamanho de amostra proposto. Na proteômica (e na maioria das ômicas), existem centenas de milhares de características / variáveis ​​medidas em 10 das amostras (talvez 100, mas improvável). Além disso, sabe-se que algumas dessas...

9
teste anova tipo III para um GLMM

Estou ajustando um glmermodelo no lme4pacote R. Estou procurando uma tabela anova com o valor p mostrado nela, mas não consigo encontrar nenhum pacote que se encaixe nela. É possível fazer isso em R? O modelo que estou ajustando é da forma: model1<-glmer(dmn~period*teethTreated+(1|fullName),...

9
Qual é a relação entre as medidas de confiabilidade da balança (alfa de Cronbach, etc.) e as cargas componente / fator?

Digamos que eu tenha um conjunto de dados com pontuações em vários itens do questionário, que são teoricamente compostos por um número menor de escalas, como na pesquisa em psicologia. Eu sei que uma abordagem comum aqui é verificar a confiabilidade das escalas usando o alfa de Cronbach ou algo...