Eu não sou um mago de matemática, por isso, mantenha sua resposta simples o suficiente. Preciso concluir um exame de triagem estatística para um curso de métodos ainda hoje, e estou com um tópico que surgiu durante o teste prático. O conjunto de dados que obtive referia-se ao número de homicídios que ocorreram em várias cidades. O intervalo desses dados é 0-5. Quando estou reunindo intervalos de confiança e calculando até dois desvios-padrão da média, estou obtendo valores baixos negativos. Obviamente, você não pode ter um número negativo de homicídios. Ao calcular os intervalos de confiança com dois desvios-padrão da média, devo apresentar o valor baixo em ZERO ou devo realmente apresentar o número negativo? Por exemplo, se um IC de 95% fizer com que o cálculo seja de -1,5 a 3, eu apresentaria isso ou eu apresentaria 0 a 3? Obrigado.
fonte
Respostas:
Parece-me improvável que a pergunta exija que você calcule dois desvios padrão dos dados a partir da média - especialmente considerando que é improvável que seus dados sejam simétricos, muito menos normalmente distribuídos (uma vez que são discretos). Não vejo nenhuma pergunta interessante que realmente possa ser respondida por esse cálculo.
Parece mais provável que você seja solicitado a fornecer um intervalo de confiança para a média . Isso também envolve o cálculo dos desvios padrão dos dados, mas você calcula o erro padrão da média a partir desse desvio padrão dividindo pelo quadrado do tamanho da amostra e finalmente construindo o intervalo de confiança com base no erro padrão. Portanto, esse intervalo de confiança tem muito menos probabilidade de ficar abaixo de zero (e, se ocorrer, você deve realmente truncar em zero). Observe que a distribuição amostral da média será normalmente distribuída à medida que o tamanho da amostra aumenta, e é por isso que esse intervalo realmente responde a uma pergunta interessante, a saber, onde esperamos que a média real esteja.
fonte