Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

355
Python como um ambiente de trabalho de estatística

Muitas pessoas usam uma ferramenta principal como o Excel ou outra planilha, SPSS, Stata ou R para suas necessidades estatísticas. Eles podem recorrer a algum pacote específico para necessidades muito especiais, mas muitas coisas podem ser feitas com uma planilha simples ou um pacote geral de...

326
Explicando aos leigos por que o bootstrapping funciona

Recentemente, usei o bootstrap para estimar intervalos de confiança para um projeto. Alguém que não conhece muito de estatística recentemente me pediu para explicar por que o bootstrapping funciona, ou seja, por que é que reamostrar a mesma amostra repetidamente para obter bons resultados. Percebi...

266
Como normalizar os dados no intervalo 0-1?

Estou perdido na normalização, alguém poderia me guiar por favor. Eu tenho um valor mínimo e máximo, digamos -23.89 e 7.54990767, respectivamente. Se eu receber um valor de 5,6878, como posso escalar esse valor em uma escala de 0 a