Meu entendimento era que a estatística descritiva descrevia quantitativamente características de uma amostra de dados, enquanto a estatística inferencial fazia inferências sobre as populações das quais as amostras foram coletadas.
No entanto, a página da Wikipedia para inferência estatística afirma:
Na maioria das vezes, a inferência estatística faz proposições sobre populações, usando dados extraídos da população de interesse por meio de alguma forma de amostragem aleatória.
O "na maior parte" me fez pensar que talvez eu não entenda corretamente esses conceitos. Existem exemplos de estatísticas inferenciais que não fazem proposições sobre populações?
terminology
descriptive-statistics
inference
user1205901 - Restabelecer Monica
fonte
fonte
Respostas:
Vindo de uma experiência em ciências comportamentais, associo essa terminologia particularmente a livros introdutórios de estatística. Nesse contexto, a distinção é que:
O ponto importante é que qualquer estatística, inferencial ou descritiva, é uma função dos dados da amostra. Um parâmetro é uma função da população, em que o termo população é o mesmo que dizer o processo de geração de dados subjacente.
Nessa perspectiva, o status de uma determinada função dos dados como uma estatística descritiva ou inferencial depende da finalidade para a qual você está usando.
Dito isto, algumas estatísticas são claramente mais úteis na descrição de recursos relevantes dos dados, e algumas são adequadas para ajudar na inferência.
Portanto, dessa perspectiva, as coisas importantes a entender são:
Assim, você pode definir a distinção entre descritivo e inferencial com base na intenção do pesquisador que usa a estatística, ou definir uma estatística com base em como ela é normalmente usada.
fonte
Uma forma de inferência é baseada na atribuição aleatória de tratamentos experimentais, e não na amostragem aleatória de uma população (mesmo hipoteticamente). Oscar Kempthorne foi um defensor.
O primeiro exemplo de Edgington (1995), Randomization Tests, ilustra bem a abordagem. Um pesquisador obtém dez sujeitos, os divide em dois grupos aleatoriamente, aloca o tratamento para um grupo e para o outro, mede suas respostas e calcula a estatística t de Student para a diferença na média de grupos. Em vez de usar a teoria da amostragem normal para avaliar a significância, ele calcula para todas as formas possíveis de os tratamentos terem sido atribuídos (existem 252); então, observando que cada permutação é igualmente provável sob a hipótese nula de nenhum efeito de tratamento, ele vê que nove fornecem um valor mais alto de do que o observado e calcula um valor de p deUMA B t t 10 / 252 = 0,04 . "Obtém" aqui, com muita freqüência, poderia significar qualquer coisa - talvez os dez primeiros alunos de graduação em sua palestra a escolherem suas mãos foram escolhidos - mas com essa análise, não há necessidade de manter a pretensão de que os sujeitos foram amostrados aleatoriamente. a população de interesse (a desvantagem é que qualquer generalização além desses dez é extraestatística).
Previsão é outra área em que você não está necessariamente formulando proposições sobre populações. (Não sei se todos gostariam de chamar previsão de "inferência", mas há Geisser (1993), Predictive Inference: An Introduction ). Muitas vezes, a previsão segue um modelo populacional adequado, mas nem sempre; por exemplo, exemplo de classificação de @ Matt, média de modelo (bayesiana ou baseada em pesos de Akaike) ou algoritmos de previsão como suavização exponencial.
NB: Penso que "estatística inferencial x descritiva" se refere mais frequentemente à disciplina Estatística do que a quantidades calculadas a partir de amostras. Não há diferença essencial entre uma estatística inferencial e uma descritiva; como @Jeremy apontou, é uma questão de qual uso você está colocando.
fonte
Não tenho certeza de que a classificação faça necessariamente uma declaração sobre a (s) população (s) a partir da qual os pontos de dados são extraídos. A classificação, como você provavelmente sabe, usa dados de treinamento que consistem em alguns vetores de "recursos", cada um rotulado com uma classe específica, para prever os rótulos de classe pertencentes a outros vetores de recursos não rotulados. Por exemplo, podemos usar os sinais vitais do paciente e o diagnóstico médico para prever se outros pacientes estão saudáveis ou doentes.
No entanto, outros classificadores procuram diferenças entre as classes sem modelar as próprias classes; estes são chamados de classificadores discriminativos. Um exemplo clássico é o classificador de vizinho mais próximo, que atribui um exemplo não rotulado à classe de seu vizinho mais próximo (onde close é definido de alguma maneira sensata para o problema). Parece que não contém muitas informações, se houver alguma, sobre as populações das quais os pontos de dados foram extraídos.
fonte
Em uma linha, dados os dados, as estatísticas descritivas tentam resumir o conteúdo dos seus dados com perda mínima de informações (dependendo de qual medida você usa). Você pode ver a geografia dos dados (algo como ver o gráfico de desempenho da classe e dizer quem está no topo, na parte inferior e assim por diante).
Em uma linha, dados os dados, você tenta estimar e inferir as propriedades da população hipotética da qual os dados provêm. (Algo como entender os alunos da 7ª série através da boa amostra da turma, supondo que a população subjacente seja grande o suficiente para que você não possa levá-los em consideração na totalidade)
fonte
Em resumo
Estatística descritiva é a análise de dados que descrevem, mostram ou resumem dados de maneira significativa; é simplesmente uma maneira de descrever nossos dados / falar sobre toda a população. alguns deles são medidas de tendência central e medidas de dispersão
A estatística inferencial é uma técnica que nos permite usar amostras para fazer generalizações sobre as populações das quais as amostras foram coletadas.
fonte
estatística descritiva é a análise de dados que descrevem, mostram ou resumem dados de maneira significativa; é simplesmente uma maneira de descrever nossos dados / falar sobre toda a população. alguns deles são medidas de tendência central e medidas de dispersão
A estatística inferencial é uma técnica que nos permite usar amostras para fazer generalizações sobre as populações das quais as amostras foram extraídas. Exemplo de teste de hipótese e compartilhar
fonte