Eu tenho medições diárias de dióxido de nitrogênio por um ano (365 dias) e o interquartil (IQR) é de 24 microgramas por metro cúbico. O que "24" significa nesse contexto, além da definição de IQR, que é a diferença entre os percentis 25 e 75 ? Como você explicaria essa figura a um jornalista, por exemplo?
obrigado
descriptive-statistics
user2742
fonte
fonte
Respostas:
Por definição, isso define o intervalo que mantém 75-25 = 50% de todos os valores medidos.
: (mediana-24/2, mediana + 24/2). A mediana deve ser escrita em algum lugar próximo a este IQR.O exposto acima era falso, é claro, parece que eu ainda estava dormindo ao escrever isso; Desculpe pela confusão. É verdade que o IQR é a largura de um intervalo que contém 50% dos dados, mas não está centrado na mediana - é necessário conhecer o Q1 e o Q3 para localizar esse intervalo.
Em geral, o IQR pode ser visto como um parâmetro não paramétrico (= quando não assumimos que a distribuição seja gaussiana) equivalente ao desvio padrão - ambos medem a dispersão dos dados. (Equivalente não igual, para SD, (média- , média + ) detém 68,2% dos dados perfeitamente distribuídos normalmente).σσ σ
EDIT: como por exemplo, é assim que parece em dados normais; as linhas vermelhas mostram , o intervalo mostrado pela caixa no gráfico da caixa mostra IQR, o histograma mostra os dados em si: você pode ver os dois se espalharem muito bem; range detém 68,3% dos dados (conforme o esperado). Agora, para dados não normais, o spread SD é ampliado devido à cauda longa e assimétrica e detém 90,5% dos dados! (IQR detém 50% em ambos os casos, por definição)± 1 σ ± 1 σ± 1 σ
± 1 σ
± 1 σ
fonte
Esta é uma pergunta simples, pedindo uma resposta simples. Aqui está uma lista de declarações, começando pelas mais básicas e prosseguindo com qualificações mais precisas.
fonte
O intervalo interquartil é um intervalo , não um escalar. Você deve sempre relatar os dois números, não apenas a diferença entre eles. Você pode então explicar dizendo que metade das leituras da amostra estava entre esses dois valores, um quarto era menor que o quartil inferior e um quarto mais alto que o quartil superior.
fonte
Grosso modo, eu diria a um jornalista que eu poderia declarar o nível diário de dióxido de nitrogênio tendo certeza, depois de descartar os valores mais altos e os mais baixos, que em cada metade dos dias daquele ano o valor observado é a uma distância de IQR / 2 do nível declarado.
Por exemplo, se seu primeiro quartil e terceiro quartil são 100 e 124, você poderia dizer que o nível diário é 112 (média de 100 e 124) e garantir ao seu interlocutor que, na metade dos dias, o erro que você comete não é maior que 12 .
fonte