Esta é a definição de estatística na wikipedia
Mais formalmente, a teoria estatística define uma estatística como uma função de uma amostra em que a função em si é independente da distribuição da amostra; isto é, a função pode ser declarada antes da realização dos dados. O termo estatística é usado para a função e para o valor da função em uma determinada amostra.
Acho que entendo a maior parte dessa definição, no entanto, a parte - onde a função é independente da distribuição da amostra, não fui capaz de resolver.
Minha compreensão da estatística até agora
Uma amostra é um conjunto de realizações de algum número de variáveis aleatórias independentes, distribuídas de forma idêntica (iid), com a distribuição F (10 realizações de um lançamento de um dado justo de 20 lados, 100 realizações de 5 lançamentos de um dado justo de 6 lados, atrair aleatoriamente 100 pessoas de uma população).
Uma função, cujo domínio é esse conjunto, e cujo intervalo são os números reais (ou talvez possa produzir outras coisas, como um vetor ou outro objeto matemático ...), seria considerada uma estatística .
Quando penso em exemplos, média, mediana, variância fazem sentido nesse contexto. Eles são uma função no conjunto de realizações (medições da pressão arterial de uma amostra aleatória). Também posso ver como um modelo de regressão linear pode ser considerado uma estatística - isso não é apenas uma função em um conjunto de realizações?
Onde estou confuso
Supondo que meu entendimento de cima esteja correto, não consegui entender onde uma função pode não ser independente da distribuição da amostra. Eu tenho tentado pensar em um exemplo para fazer sentido, mas sem sorte. Qualquer visão seria muito apreciada!
fonte
Eu interpreto isso como dizendo que você deve decidir antes de ver os dados que estatística você irá calcular. Assim, por exemplo, se você deseja extrair discrepantes, deve decidir antes de ver os dados o que constitui um "discrepante". Se você decidir depois de ver os dados, sua função dependerá dos dados.
fonte