Estatísticas e Big Data

8
Seleção adaptativa do número de replicações de inicialização

Como na maioria dos métodos de Monte Carlo, a regra para inicialização é que, quanto maior o número de repetições, menor o erro de Monte Carlo. Mas há retornos decrescentes, portanto, não faz sentido executar o maior número possível de réplicas. Suponha que você deseje garantir que sua estimativa...

8
Alguma desvantagem da rede elástica sobre o laço?

Quais são as desvantagens do uso de rede elástica em comparação com o laço. Eu sei que a rede elástica é capaz de selecionar grupos de variáveis ​​quando elas são altamente correlacionadas. Não tem o problema de selecionar mais de nnn preditores quando p≫np≫np \gg n. Considerando que o laço...

8
Floresta aleatória em uma configuração de Big Data

Eu tenho um conjunto de dados com 5.818.446 linhas e 51 colunas, onde 50 delas são preditores. Minha resposta é quantitativa, por isso estou interessado em um modelo de regressão. Estou tentando ajustar uma floresta aleatória aos meus dados usando o pacote de intercalação. No entanto, não tenho RAM...

8
Distribuição normal

Infelizmente, há um problema estatístico. Eu não tenho idéia por onde começar (estou estudando por conta própria, para que não haja ninguém que eu possa perguntar, se eu não entender alguma coisa. A questão é N ( um , b 2 ) ; a = 0 ; b 2 = 6 ; v a r ( X 2 + Y 2 ) = ?X, YX,YX,Y YidN( a , b2) ; a =...

8
Intuição (geométrica ou outra) de

Em outra parcela de intuições para identidades em probabilidade, considere a identidade elementar Lei da Variância Total Var(X)=E[Var(X|Y)]+Var(E[X|Y])Var(X)=E[Var(X|Y)]+Var(E[X|Y]) \begin{eqnarray} \rm{Var}(X) &=&\rm{E}[\rm{Var}(X|Y)] + \rm{Var}(E[X|Y]) \end{eqnarray} É uma manipulação...