O que podemos dizer sobre a média da população a partir de um tamanho de amostra 1?

43

Estou imaginando o que podemos dizer, se é que alguma coisa, sobre a população significa, quando tudo o que tenho é uma medida, (tamanho da amostra 1). Obviamente, adoraríamos ter mais medidas, mas não podemos obtê-las.y 1μy1

Parece-me que, como a média da amostra, , é trivialmente igual a , então . No entanto, com um tamanho de amostra igual a 1, a variação da amostra é indefinida e, portanto, nossa confiança no uso de como estimador de também é indefinida, correto? Haveria alguma maneira de restringir nossa estimativa de ? y1E[ ˉ y ]=E[Y1]=u ˉ y uuy¯y1E[y¯]=E[y1]=μy¯μμ

thedu
fonte
Sim, um intervalo de confiança em pode ser construído sob certas suposições. Se ninguém postar, eu irei rastrear. μ
soakley
5
Consulte stats.stackexchange.com/questions/1807 para obter outra versão da mesma pergunta (a média de uma amostra está disponível, mas não o tamanho da amostra; portanto, a média é uma observação única da distribuição de amostragem desconhecida) e stats.stackexchange .com / questions / 20300 para uma discussão relacionada.
whuber
um artigo recente discutindo otimização destes estimadores no caso normal: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Respostas:

8

Aqui está um novo artigo sobre esta questão para o caso Poisson, adotando uma boa abordagem pedagógica:

Andersson. Por Gösta (2015). Uma abordagem em sala de aula para a construção de um intervalo de confiança aproximado de uma média de Poisson usando uma observação. The American Statistician , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .

S. Kolassa - Restabelecer Monica
fonte
... infelizmente atrás de um paywall.
Tim
@ Tim: é isso mesmo. Por outro lado, uma afiliação à ASA não é muito cara e você tem acesso ao The American Statistician , JASA e a muitas outras revistas por um preço bastante razoável, que eu pessoalmente pago com muito prazer do meu próprio bolso. Eu realmente acho que você ganha o seu dinheiro aqui. YMMV, é claro.
S. Kolassa - Restabelece Monica
4
+1, mas o caso Poisson é radicalmente diferente do caso normal porque a variação tem que ser igual à média. O resultado de Poisson é bem direto, enquantoO resultado para o caso normal é contra-intuitivo e misterioso. x±9.68|x|
Ameba diz Reinstate Monica
@amoeba: bastante correto, mas o OP não especificou nenhuma restrição à distribuição.
S. Kolassa - Reinstala Monica
Isso é tão breve que serviria melhor como comentário. Mas como é a resposta aceita, você provavelmente não desejará convertê-lo em um comentário. Você poderia então resumir os pontos principais do artigo?
Richard Hardy
42

Se se sabe que a população é normal, um intervalo de confiança de 95% com base em uma única observação é dado porx ± 9,68 | x |x

x±9.68|x|

Isso é discutido no artigo "Um intervalo de confiança eficaz para a média com amostras de tamanho um e dois", de Wall, Boen e Tweedie, The American Statistician , maio de 2001, vol. 55, no.2 . ( pdf )

Soakley
fonte
5
Eu odeio parecer estúpido, mas .... certamente não. Isso depende de unidades e não se comporta corretamente em todos (por adequadamente I multiplicação média escalar ....)
Alec Teal
8
@Alec Só porque um procedimento depende de unidades de medida (ou seja, não é invariável) não significa que ele é automaticamente inválido ou mesmo inválido. Este é válido: leia o artigo e faça as contas. Muitos admitirão que é um pouco perturbador , no entanto. Ainda mais surpreendentemente, você nem precisa assumir que a distribuição subjacente é Normal: um resultado semelhante é válido para qualquer distribuição unimodal (mas 9,68 deve ser aumentado para cerca de 19): veja os links que forneci em um comentário a este Pergunta, questão.
whuber
4
Uma edição posterior da revista tinha três cartas ao editor, uma das quais mencionava o argumento de Alec Teal sobre as unidades. A resposta de Wall diz o seguinte: "O intervalo de confiança não é equivalente (ou seja, sua probabilidade de cobertura depende da razão de ...)". diz "O intervalo de confiança não se baseia em uma quantidade essencial ..." É uma abordagem e resultado incomuns, sem dúvida! |μ|σ
soakley
5
Só para economizar um pouco de trabalho: as cartas ao editor e as respostas às notas de @soakley apareceram em The American Statistician , vol. 56, n. 1 (2002) .
S. Kolassa - Restabelece Monica
3
Isso parece fornecer intervalos de confiança que cobrem a média com probabilidade de cerca de quando mas com probabilidades muito maiores caso contrário. Se então claramente a probabilidade é pois os intervalos de confiança sempre contêm . σ | u | > 0 μ = 0 100 % 095%σ|μ|>0μ=0100%0
Henry
28

Claro que existe. Use um paradigma bayesiano . Provavelmente, você tem pelo menos alguma idéia do que poderia ser - por exemplo, que fisicamente não pode ser negativo, ou que, obviamente, não pode ser maior que 100 (talvez você está medindo a altura de seus membros da equipa de futebol do ensino médio em pés). Coloque um antes disso, atualize-o com sua observação solitária e você terá um maravilhoso posterior.μ

S. Kolassa - Restabelecer Monica
fonte
18
(+1) Uma observação será sobrecarregada pelo prior, de modo que parece que o que você obtém do posterior não será muito mais do que o que você coloca no prior.
whuber
E se combinássemos esse prioritário com o tipo de probabilidade implícita naquele? x±9.68|x|
Simon Kuang
@SimonKuang: um problema conceitual é que só podemos usarintervalo depois de observarmos , então não é possível inserir o anterior . xx±9.68|x|x
S. Kolassa - Restabelece Monica
@StephanKolassa Não, esse intervalo (e a distribuição associada) forma a probabilidade. Nosso prior é separado.
Simon Kuang
@ SimonKuang: sim, você está certo, meu erro. Infelizmente, não tenho tempo para fazer isso no momento, mas se você fizer isso, poste o que encontrou!
S. Kolassa - Restabelece Monica
14

Um pequeno exercício de simulação para ilustrar se a resposta de @soakley funciona:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

Fora de um milhão de tentativas aleatórias, o intervalo de confiança inclui a média verdadeira um milhão de vezes, ou seja, sempre . Isso não deve acontecer caso o intervalo de confiança seja de 95% .

Portanto, a fórmula parece não funcionar ... Ou cometi um erro de codificação?

Edit: o mesmo resultado empírico é válido quando se usa ; no entanto, é para - portanto, bem próximo do intervalo de confiança de 95%.0,950097 0,95 ( μ , σ ) = ( 1000 , 1000 )(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)

Richard Hardy
fonte
2
μμ=0
2
α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
2
μμμsim(0.1)μ
2
P(Xζ|X|μX+ζ|X|)1αμ
2
μμ=0
0

Ver Edelman, D (1990) 'Um intervalo de confiança para o centro de uma distribuição unimodal desconhecida, com base em um tamanho de amostra um' The American Statistician, Vol. 44, n. 4. O artigo cobre os casos Normal e Não Paramétrico.

David Edelman
fonte
3
Bem-vindo ao Stats.SE. Você pode editar a resposta para expandi-la, a fim de incluir os principais pontos do livro que você cita? Será mais útil tanto para o pôster original quanto para outras pessoas pesquisando neste site. A propósito, aproveite a oportunidade para fazer o Tour , se você ainda não o fez. Veja também algumas dicas sobre Como responder , sobre formatação de ajuda e sobre como escrever equações usando o LaTeX / MathJax .
Ertxiem - reinstala Monica
Bem-vindo ao nosso site, David. Sua contribuição, como autor desse artigo (que acredito ter sido citado em vários tópicos aqui), é muito apreciada; portanto, qualquer perspectiva ou comentário que você possa fornecer nesta resposta será bem-vinda.
whuber