Intervalo de previsão para

3

Vamos supor que temos regressão linear com a variável dependente . Como encontrar um intervalo de previsão para E ( y | X 0 ) ?ln(y)E(y|X0)

Se tivermos , há uma maneira para atingir P I ( E ( y | X 0 ) ) ?PI(E(ln(y)|X0))PI(E(y|X0))

Qualquer ajuda seria apreciada.

Um velho no mar.
fonte
Isso deveria ter sido publicado no Cross Validated, porque não há nada econômico específico, é uma questão puramente estatística.
Richard Hardy
@RichardHardy Eu discordo. Muitos modelos lineares são escritos com ln (y) porque estamos interessados ​​em elasticidades, e também estamos interessados ​​em encontrar IC ou PI para o y, não o ln (y) ...
Um homem velho no mar.
Tudo bem, nesse sentido, está relacionado à economia. Mas, ainda assim, é uma pergunta perfeitamente estatística, na medida em que me surpreende vê-lo em qualquer outro site do Stack Exchange que não seja o Validado pela Cruz. Não que eu tenha interesse particular em um site ou em outro (eu mantenho o controle de ambos), mas acho que mais consistência seria legal.
Richard Hardy
@ Richardhardard Se você sabe como, pode sugerir que você mova essa pergunta. Vou deixar de ver a importância de um IC ou PI para ay quando o modelo está em ln (y), em um cenário estatístico. Mas para mim, de qualquer maneira, está bem. Além disso, esta questão está vinculada à minha anterior. Eles são bastante relacionados.
Um velho no mar.
Suponho que o outro se encaixaria melhor no Cross Validated do que no Economics Stack Exchange. Mas como você recebeu e aceitou respostas para os dois, provavelmente é tarde demais para movê-los.
Richard Hardy

Respostas:

2

Eu peguei esse link no Journal of Statistics Education

XlogN(μ,σ2)Y=log(X)N(μ,σ2)

E(X)=E(eY)=eμ+σ2/2log(E(X))

Y¯+SY22
Var(log^(E(X)))=σ2n+σ42(n1)
V^ar(log^(E(X)))=SY2n+SY42(n1)

log^E(X)logE(X)V^ar(log^(E(X)))aN(0,1)

CI(E(X))=]eY¯+SY22±z1αSY2n+SY42(n1)[
t(n)

Se olharmos para a tabela 5 do link, podemos ver que o melhor método é o Cox modificado, pois para amostras pequenas e grandes, a probabilidade de cobertura é a mais próxima do nível nominal.

CI(E(X))=]eY¯+12SX2(X¯)2±t1αSY2n[

Simulei sua resposta com o seguinte código no Mathematica:

sim[n_] := Module[{},
  ct = 1;
  res = 0;
  While[ct <= 10000,
   data = RandomVariate[LogNormalDistribution[5, 1], n];
   y = Log[data];
   my = Mean[y];
   s2y = Variance[y];
   mx = Mean[data];
   s2x = Variance[data];
   qt = Quantile[StudentTDistribution[n], 0.975];
   If[E^(my + 0.5*s2x/mx^2 - qt*Sqrt[s2y/n]) < E^(5 + 0.5) < 
     E^(my + 0.5*s2x/mx^2 + qt*Sqrt[s2y/n]),
    res++];
   ct++;
   ];
  res = res/10000.
  ]

A única diferença é que eu fiz 10000 replicações, enquanto o link faz apenas 1000.

0.8954,0.8464,0.7682,0.7153,0.6454,0.4832,0.3045,0.073,0.0068

Como podemos ver, a correção aumenta as probabilidades de cobertura quando comparada ao método ingênuo, mas ainda sofre do mesmo problema, ou seja, o prob. tendem a zero à medida que o tamanho da amostra aumenta.

Em suma, o melhor curso de ação é usar a abordagem de Cox modificada.

Um velho no mar.
fonte
Entendo que essa abordagem aprimora as coisas especificamente para a distribuição log-normal. Minha resposta fornece um termo de correção geral e, portanto, não é surpreendente que ele dê resultados inferiores.
Alecos Papadopoulos
1

Devido à desigualdade de Jensen, temos

E(lny)lnE(y)exp{E(lny)}E(y)

exp{E(lny)}E(y)

E(lny)E(y)

E(lny)E[lnE(y)+yE(y)E(y)12[yE(y)]2[E(y)]2]

E(lny)lnE(y)12σy2μy2

lnE(y)E(lny)+12σy2μy2

a correção é metade do coeficiente de variação ao quadrado .

y

Alecos Papadopoulos
fonte
Alecos, obrigado pela resposta. Eu ainda tenho algumas dúvidas. Por que o IC é alterado apenas e não compactado nem distendido?
Um velho no mar.
@Anoldmaninthesea. Eu adicionei o esclarecimento sobre o assunto.
Alecos Papadopoulos
Vou ler sua resposta durante este fim de semana. Obrigado. Provavelmente, também examinarei a distribuição lognormal para tentar encontrar um IC exato. ;)
Um velho no mar.
Alecos, li sua resposta e escrevi outra com uma avaliação sua. Poderia me dar algum feedback? eu apreciaria muito isso. ;)
Um velho no mar.