Aprendi que uma estatística é um atributo que você pode obter de amostras. Pegando muitas amostras do mesmo tamanho, calculando esse atributo para todas elas e plotando o pdf, obtemos a distribuição do atributo correspondente ou a distribuição das estatísticas correspondentes.
Também ouvi dizer que as estatísticas são feitas para serem estimadores. Como esses dois conceitos diferem?
terminology
estimators
definition
gutto
fonte
fonte
Respostas:
Definição
Da Wikipedia:
E
A diferença importante é:
(Para o que "Quantidade" significa, consulte a seção abaixo.)
Uma estatística não é um estimador
Um estimador é uma estatística com algo adicionado. Para transformar uma estatística em um estimador, basta especificar qual a quantidade alvo que deseja estimar. Isso é confuso, porque você não adiciona nada "real" à estatística, mas apenas alguns pretendem.
Para ver que a diferença é importante, você tem que perceber que você não pode calcular as propriedades de um estimador (eg preconceito , variância , etc.) para uma mera estatística. Para calcular o viés , você precisa encontrar a diferença entre o valor que sua estatística fornece e o valor verdadeiro. Somente um estimador vem com um "valor verdadeiro" que permite calcular um viés. Uma estatística é meramente uma função dos dados e não é certa nem errada.
Estimadores diferentes com base na mesma estatística
Você pode especificar quantidades-alvo diferentes para a mesma estatística, resultando em estimadores diferentes. Cada um desses estimadores tem seu próprio viés, embora todos sejam (com base no) mesmo valor, a mesma estatística.
Dizer "média da amostra é imparcial" não faz sentido. A média da amostra é imparcial quando você a usa para estimar a média da distribuição. Mas, ao mesmo tempo, é enviesado ao usá-lo para estimar a variação da distribuição.
Quantidades de distribuições e quantidades de amostras
Aqui, quantidade refere-se a alguma propriedade da distribuição, que geralmente é desconhecida e, portanto, precisa ser estimada. Isso contrasta com uma estatística , que é propriedade de uma amostra, por exemplo, a média da distribuição é uma quantidade da sua distribuição, enquanto a média da amostra é uma estatística (uma quantidade da sua amostra).
fonte
Esse tópico é um pouco antigo, mas parece que a Wikipedia pode ter alterado sua definição e, se for precisa, explica mais claramente para mim:
Portanto, uma estatística se refere aos dados em si e um cálculo com esses dados. Enquanto um estimador se refere a um parâmetro em um modelo.
Se eu entendi direito, a média é uma estatística e também pode ser um estimador. A média de uma amostra é uma estatística (soma da amostra dividida pelo tamanho da amostra). A média de uma amostra também é um estimador da média da população, assumindo que ela esteja normalmente distribuída.
Gostaria de perguntar ao @whuber e a outros que realmente conhecem esse material se a (nova?) Citação da Wikipedia é precisa.
fonte
Como outras respostas dizendo que são iguais não dão nenhuma referência autorizada, deixe-me fazer duas citações do manual de inferência estatística de Casella e Berger:
e
Estou não dizendo aqui que esta é a resposta definitiva para a questão, já que parecem concordar com as duas respostas mais upvoted que sugerem que há uma diferença, apenas dando uma referência que diz o contrário destacar que este não é um caso nítido.
fonte
"6" é um exemplo de um estimador. Diga que sua pergunta foi: "qual é a inclinação da melhor função linear que mapeia x para y?" Sua resposta pode ser "6". Ou pode ser . Ambos são estimadores. Qual é o melhor é deixado para você decidir.( X′X)- 1X′Y
Um TA realmente bom uma vez me explicou o conceito de estimador dessa maneira.
Basicamente, um estimador é algo que você aplica aos dados para obter uma quantidade que você não conhece o valor. Você conhece o valor de uma estatística - é uma função dos dados sem "melhor" ou "ideal". Não existe o "melhor" meio. Existe apenas uma média.
Digamos que você tenha um conjunto de dados sobre o número de cabras pertencentes por pessoa e a felicidade de cada pessoa. Você está interessado em saber como a felicidade das pessoas muda com o número de cabras que elas possuem. Um estimador pode ajudá-lo a estimar esse relacionamento a partir de seus dados. Estatísticas são apenas funções dos dados que você possui. Por exemplo, a variação da propriedade da cabra pode ser igual a 7. A fórmula para calcular a variação seria idêntica entre cabras e torradeiras, ou se você está interessado em felicidade ou propensão a contrair câncer. Nesse sentido, todos os estimadores sensíveis são estatísticas.
fonte
Pergunta interessante. Estimadores e estatísticas não precisam ser coisas diferentes. São conceitos diferentes.
Uma estatística é uma função (em termos gerais) na qual a entrada é dados (estatísticos). O efeito é que você obtém um resultado, geralmente um número, dessa estatística. Em um termo mais abstrato, uma estatística pode render mais de um número. A estatística depende dos dados, mas o procedimento é determinístico. Portanto, a estatística pode ser: "Soma todos os números e divida pela contagem" ou, no sentido mais amplo, "pegue os dados do PIB e prepare um relatório sobre ele".
No sentido estatístico, obviamente, estamos falando de uma função matemática como estatística.
O significado disso é que, se você conhece as propriedades dos dados inseridos (por exemplo, sendo uma variável aleatória), pode calcular as propriedades da sua estatística, sem realmente inserir dados empíricos.
Estimadores são estimadores por causa de sua intenção: estimar uma propriedade. Como se vê, algumas estatísticas são boas estimadoras.
Por exemplo, se você extrair pontos de dados de um conjunto de variáveis iid, a média aritmética - uma estatística baseada nos dados que você extrai, provavelmente será um bom estimador para o valor esperado dessa distribuição. Mas, novamente, qualquer coisa que produza uma estimativa é um estimador.
Na prática, os estimadores que você usa serão estatísticas, mas há estatísticas que não são estimadores. Por exemplo, estatísticas de teste - embora se possa argumentar sobre a semântica dessa declaração e para piorar as coisas, uma estatística de teste pode não apenas ser, mas também incluir estimadores. Embora conceitualmente isso não tenha que ser o caso.
E, é claro, você pode ter estimadores que não são estatísticos, embora provavelmente não sejam muito bons em estimar.
fonte
Eu acho que uma melhor compreensão sobre o que é uma amostra ajuda.
[Atualizado: Amostra é um conceito muito amplo, eu estava falando sobre "a amostra aleatória". Não sei se um estimador faz sentido ou não quando a amostra não é aleatória .]
da wikipedia :
Substituímos a amostra no estimador pelo valor da amostra. Nós obtemos um valor do estimador, esta é uma medida específica. E essa medida específica é uma estatística.
(Verifique este link para a definição de um estimador, a última frase revela por que estamos sempre confusos.)
fonte
O objetivo deste artigo:
O que eu quero fazer aqui é fornecer as semelhanças e diferenças entre os dois conceitos intimamente relacionados, chamados "estatística" e "estimador". No entanto, não quero passar pelas diferenças entre um parâmetro e uma estatística, o que suponho que seja claro o suficiente para todos que estão lutando com as diferenças entre uma estatística e um estimador. Se não for o seu caso, primeiro você deve estudar as postagens anteriores e depois começar a estudá-las.
Relação:
Basicamente, qualquer função com valor real de variáveis aleatórias observáveis em uma amostra é chamada de estatística. Existem algumas estatísticas que, se forem bem projetadas e tiverem boas propriedades (por exemplo, consistência, ...), poderão ser usadas para estimar os parâmetros da distribuição subjacente da população. Portanto, as estatísticas são um conjunto grande e os estimadores são um subconjunto dentro do conjunto de estatísticas. Portanto, todo estimador é uma estatística, mas nem toda estatística é um estimador.
Semelhanças:
Falando das semelhanças, como mencionado anteriormente, ambas são funções de variáveis aleatórias. Além disso, ambos têm distribuições chamadas "distribuições de amostragem".
Diferenças:
Falando das diferenças, elas são diferentes em termos de objetivos e tarefas. Os objetivos e as tarefas de uma estatística podem resumir as informações em uma amostra (usando estatísticas suficientes) e, algumas vezes, fazer testes de hipóteses etc. os parâmetros da população estudada. É importante mencionar que existe uma grande variedade de estimadores, cada um com sua própria lógica computacional, como MOMEs, MLEs, estimadores OLS e assim por diante. Outra diferença entre esses dois conceitos tem a ver com as propriedades desejadas. Enquanto uma das propriedades mais desejadas de uma estatística é "suficiência", as propriedades desejadas de um estimador são coisas como "consistência", "imparcialidade", "precisão" etc.
Cuidado:
Portanto, você precisa ter cuidado ao usar a terminologia corretamente ao lidar com estatísticas e estimadores. Por exemplo, não faz muito sentido falar sobre a parcialidade de uma mera estatística, o que não é de forma alguma um estimador, porque não há parâmetro envolvido nesse contexto para que possamos calcular o viés, e fale sobre isso. Portanto, você precisa ter cuidado com a terminologia!
A linha inferior:
Em resumo, qualquer função de variáveis aleatórias observáveis em uma amostra é uma estatística. Se uma estatística tem capacidade para estimar um parâmetro de uma população, então a chamamos de estimador (do parâmetro de interesse). No entanto, existem algumas estatísticas que não são projetadas para estimar parâmetros, portanto, essas estatísticas não são estimadoras, e aqui as chamamos de "meras estatísticas".
O que eu ofereci acima é a maneira como encaro e penso esses dois conceitos e tentei o meu melhor para colocá-lo em palavras simples. Espero que ajude!
fonte
Nova resposta para um Q antigo:
Definição 1. Uma estatística é uma função que mapeia cada amostra para um número real.
Todo estimador é uma estatística.
Mas tendemos a chamar apenas as estatísticas que são usadas para gerar estimativas ("suposições") algum parâmetro como estimador.
Assim, por exemplo, a estatística t e a média da amostra são AMBAS as estatísticas. A média da amostra também é um estimador (porque geralmente a usamos para estimar a verdadeira média da população).
Por outro lado, raramente / nunca chamamos a estatística t de estimador, porque raramente / nunca a usamos para estimar qualquer parâmetro.
fonte
No teste de hipóteses :
Uma estatística de teste trata do teste de hipóteses. Uma estatística de teste é uma variável aleatória dada / sob a hipótese nula. Agora, alguns podem chamar uma estatística de valor / medida da estatística de teste, dada a amostra.
Com esses dois, você pode obter o valor-p, que é uma medida que ajuda a rejeitar ou não a hipótese nula. Em suma, uma estatística é uma estimativa de quão longe / próximo de sua hipótese.
Este link pode ser útil.
fonte