Estatísticas e Big Data

49
Bootstrap vs. jackknife

Os métodos bootstrap e jackknife podem ser usados ​​para estimar o viés e o erro padrão de uma estimativa e os mecanismos de ambos os métodos de reamostragem não são muito diferentes: amostragem com substituição vs. deixar de fora uma observação de cada vez. No entanto, o canivete não é tão popular...

49
A "classificação média" da Amazon é enganosa?

Se bem entendi, as classificações de livros em uma escala de 1 a 5 são pontuações do Likert. Ou seja, um 3 para mim pode não ser necessariamente um 3 para outra pessoa. É uma IMO em escala ordinal. Não se deve realmente medir escalas ordinais, mas definitivamente pode-se usar o modo, mediana e...

49
Tempo aleatório de computação na floresta em R

Estou usando o pacote de festa no R com 10.000 linhas e 34 recursos, e alguns recursos de fator têm mais de 300 níveis. O tempo de computação é muito longo. (Demorou 3 horas até agora e ainda não terminou.) Quero saber quais elementos têm um grande efeito no tempo de computação de uma floresta...

48
Qual é a diferença entre NaN e NA?

Gostaria de saber por que algumas línguas como R têm NA e NaN. Quais são as diferenças ou são igualmente iguais? É realmente necessário ter

48
O qui-quadrado é sempre um teste unilateral?

Um artigo publicado ( pdf ) contém estas 2 frases: Além disso, a declaração incorreta pode ser causada pela aplicação de regras incorretas ou pela falta de conhecimento do teste estatístico. Por exemplo, o df total em uma ANOVA pode ser considerado o erro df no relatório de um teste , ou o...