Estatísticas e Big Data

8
Parada antecipada vs validação cruzada

Atualmente, estou usando a parada antecipada no meu trabalho para evitar o excesso de ajuste. Especificamente, aqueles tomados em forma de parada antecipada, mas quando? . Agora estou querendo comparar com outros algoritmos de classificação, onde parece que a validação cruzada de 10 vezes é...

8
Um intervalo de previsão precisa conter a média?

Estou tendo um grande problema com um problema conceitual que eu criei. Digamos que uma empresa tenha uma distribuição altamente distorcida. Algo semelhante a um exponencial ou lognormal apenas mais extremo. Agora, finja que a distribuição está tão distorcida que a média da distribuição é superior...

8
Qual é o mínimo de

Todas as distribuições em um intervalo limitado [ 0 , 1 ][0,1][0,1] satisfazem: σ2≤ μ ( 1 - μ )σ2≤μ(1−μ)\sigma^2 \le \mu (1-\mu) onde μμ\mu é a média e σ2σ2\sigma^2 a variância. Agora, suponha que a distribuição seja unimodal, no sentido de ter no máximo um máximo local. Qual é o valor mínimo...

8
Altura de uma curva de distribuição normal

Para uma curva em forma de sino de distribuição Normal, seria de se pensar que a altura deveria ter um valor ideal. Conhecer esse valor pode ser um indicador rápido para verificar se os dados são normalmente distribuídos. No entanto, não consegui encontrar seu valor formal. Na maioria dos lugares,...

8
Modelo de aprendizado de máquina "Exportar" da R

Posso criar e implementar modelos clássicos de ML em conjuntos tradicionais de treinamento / teste em R, mas e se um parceiro quiser obter esse modelo para implementar seu próprio (qualquer tipo de) sistema? Salvar e enviar a estrutura do modelo R não ajuda, é claro; e descobrir o mecanismo de...

8
Probabilidade de um par consecutivo de valores

Permite onde e são independentes .X=(x1,x2,...x20)X=(x1,x2,...x20)X=(x_1, x_2,...x_{20})xi∼N(0,1)xi∼N(0,1)x_i\sim N(0,1)xi,xjxi,xjx_i, x_j∀i≠j∀i≠j\forall i\neq j Qual é a probabilidade de obter uma amostra em que existem pelo menos dois valores consecutivos e tais que...

8
A não estacionariedade no logit / probit é importante?

Gostaria de perguntar - estou usando o logit para investigar, se algumas variáveis ​​aumentam o risco de crises cambiais. Eu tenho dados anuais de 1980 para muitos países (painel desequilibrado); a variável dummy é 1 se as crises monetárias começaram (de acordo com minha definição), 0 caso...