Estatísticas e Big Data

8
O teste t de Welch fornece pior valor p para diferença mais extrema

Aqui estão quatro conjuntos diferentes de números: A = {95,47, 87,90, 99,00} B = {79,2, 75,3, 66,3} C = {38,4, 40,4, 32,8} D = {1,8, 1,2, 1,1} Usando um teste t de duas amostras sem assumir variações iguais, comparo B, C e D a A e obtenho os seguintes valores de p: Qual o valor de x na...

8
SVD de uma matriz de dados (PCA) após suavização

Digamos que eu tenha uma matriz de dados centrada com SVD .n×mn×mn \times mAAAA=UΣVTA=UΣVTA = U \Sigma V^{T} Por exemplo, colunas (medidas) que são espectros com frequências diferentes. A matriz é centralizada para que as linhas da matriz tenham sua média subtraída. Isso serve para interpretar os...

8
Uso de DNA em processos judiciais

Atualmente, estou estudando o seguinte caso de Neil Owen, com base no seguinte artigo que encontrei em um jornal: "Um estudante de 20 anos foi preso por toda a vida ontem pelo estupro e assassinato brutal de uma estudante, depois de um dos maiores programas de teste de DNA da história criminal...

8
Simulação de um processo gaussiano (Ornstein Uhlenbeck) com uma função de covariância exponencialmente decadente

Eu estou tentando gerar muitos draws (ou seja, realizações) de um processo de Gauss eEu( T )ei(t)e_i(t) , 1 ≤ t ≤ T1≤t≤T1\leq t \leq T com média 0 e função covariância γ( s , t ) = exp( - | t - s | )γ(s,t)=exp⁡(−|t−s|)\gamma(s,t)=\exp(-|t-s|) . Existe uma maneira eficiente de fazer isso que não...

8
Uma abordagem gradual produz o modelo mais alto ?

Ao usar a abordagem passo a passo para selecionar variáveis, é garantido que o modelo final tenha o maior R ^ 2 possível R2R2R^2? Dito de outra maneira, a abordagem por etapas garante um ótimo global ou apenas um ótimo local? Por exemplo, se eu tiver 10 variáveis ​​para selecionar e quiser...

8
Regras fáceis básicas para estatísticas

Em um experimento binomial, se observarmos indivíduo positivo entre indivíduos, a proporção de indivíduos positivos será significativamente menor que com um erro do tipo 1 menor e muito próximo a . Esse fato, às vezes chamado de "regra dos três", é uma conseqüência das desigualdadesx = 0x=0x=0nnn3...