Estatísticas e Big Data

41
Como posso calcular

Suponha que e sejam função de densidade e função de distribuição da distribuição normal padrão.ϕ ( ⋅ )ϕ(⋅)\phi(\cdot)Φ ( ⋅ )Φ(⋅)\Phi(\cdot) Como se pode calcular a integral: ∫∞- ∞Φ ( w - umb) ϕ(w)d w∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm...

41
Random Forest - Como lidar com o excesso de ajustes

Tenho formação em ciência da computação, mas estou tentando me ensinar ciência de dados resolvendo problemas na internet. Eu tenho trabalhado nesse problema nas últimas duas semanas (aproximadamente 900 linhas e 10 recursos). Eu estava inicialmente usando regressão logística, mas agora mudei para...

41
Como interpretar medidas de erro?

Estou executando o classify no Weka para um determinado conjunto de dados e notei que, se estou tentando prever um valor nominal, a saída mostra especificamente os valores previstos correta e incorretamente. No entanto, agora estou executando-o para um atributo numérico e a saída é: Correlation...

40
O modelo de regressão logística não converge

Tenho alguns dados sobre voos de companhias aéreas (em um quadro de dados chamado flights) e gostaria de ver se o tempo de voo tem algum efeito na probabilidade de chegada significativamente atrasada (ou seja, 10 ou mais minutos). Imaginei que usaria regressão logística, com o tempo de vôo como...

40
Como interpretar os valores F e p na ANOVA?

Eu sou novo em estatística e atualmente lida com ANOVA. Realizo um teste ANOVA em R usando aov(dependendVar ~ IndependendVar) Eu recebo - entre outros - um valor F e um valor p. Minha hipótese nula ( H0H0H_0 ) é que todas as médias de grupos são iguais. Há muitas informações disponíveis sobre...