Intervalos de confiança transformados de volta

11

Depois de me deparar com essa discussão , estou levantando a questão sobre as convenções dos intervalos de confiança transformados de volta.

De acordo com este artigo, o IC da transformação nominal de cobertura nominal para a média de uma variável aleatória log-normal é:

LCL(X)=exp(Y+var(Y) vocêCeu(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n-1 1))  euCeu(X)=exp(Y+var(Y)2-zvar(Y)n+var(Y)22(n-1 1))

/ e não os ingênuos /exp((Y)+zvar(Y))

Agora, quais são esses ICs para as seguintes transformações:

  1. x e x1 1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

E o intervalo de tolerância para a variável aleatória em si (refiro-me a um único valor amostral retirado aleatoriamente da população)? Existe o mesmo problema com os intervalos transformados de volta ou eles terão a cobertura nominal?

Germaniawerks
fonte
11
Veja expansão Taylor para momentos de funções de rvs e o método Delta . Mas é preciso cuidado. Veja, por exemplo, discussões aqui e [aqui] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). Pesquisando em séries de Taylor apresentará vários exemplos e discussões úteis.
Glen_b -Reinstar Monica
Fiz edições substanciais em suas fórmulas. Verifique se não entendi errado nenhum deles. No meu comentário anterior (desculpe pelo link incorretamente formatado lá) - veja também o comentário de precaução sob a resposta aqui
Glen_b -Reinstate Monica
Obrigado. Embora eu mal possa postar uma coisa sem ser editado com essas expressões sofisticadas.
Germaniawerks

Respostas:

6

Por que você está fazendo transformações de volta? Isso é fundamental para responder à sua pergunta, porque em alguns casos a transformação ingênua é a resposta certa. Na verdade, acho que vou argumentar que, se a ingênua transformação das costas não for a resposta certa, você não deve voltar a transformar.

Acho a questão geral da transformação das costas altamente problemática e frequentemente cheia de pensamentos confusos. Olhando para o artigo que você citou, o que os leva a pensar que é uma pergunta razoável que o IC transformado de volta não capture a média original? É uma interpretação equivocada de valores transformados de volta. Eles acham que a cobertura deve ser para análise direta no espaço transformado de volta. E então eles criam uma transformação traseira para corrigir esse erro, em vez de sua interpretação.

Se você fizer suas análises sobre os valores do log, suas estimativas e inferências se aplicarão a esses valores. Contanto que você considere transformar de volta uma representação de como essa análise de log se parece no espaço exponencial, e somente assim, você estará bem com a abordagem ingênua. De fato, é preciso. Isso é verdade para qualquer transformação.

Fazer o que eles estão fazendo resolve o problema de tentar transformar o IC em algo que não é, um IC dos valores transformados. Isso está cheio de problemas. Considere o vínculo em que você está agora, os dois ICs possíveis, um no espaço transformado onde você faz suas análises e um transformado de volta, fazem afirmações muito diferentes sobre onde o provável mu está no outro espaço. A transformação traseira recomendada cria mais problemas do que resolve.

O melhor a ser retirado desse artigo é que, quando você decide transformar os dados, eles têm impactos mais profundos do que o esperado sobre o significado de suas estimativas e inferências.

John
fonte
Você poderia explicar isso mais? Parece-me que a questão de ser o CI ingênuo fornece a média geométrica, e não a aritmética. O que implicaria que fosse estritamente menor, como se costuma dizer, e, portanto, a inconsistência e a baixa cobertura.
Germaniawerks
Inconsistência com o quê? Se você estiver analisando sua distribuição exponencial diretamente e quiser saber a média aritmética, então sim, é uma baixa cobertura para isso. Mas se você quisesse fazer isso, deveria ter feito isso. Se você pretende transformar sua distribuição e analisar os expoentes, é exatamente a cobertura certa para isso.
John John
Não vejo por que você se opõe ao método do artigo. As simulações mostram um bom desempenho, enquanto o método ingênuo está pior do que a "abordagem do limite central".
Germaniawerks
11
Eles mostram que está fazendo melhor pelo que eles querem que seja. O método ingênuo funciona muito bem para o que é. Veja a simulação na seção 5. Eles configuraram uma média de distribuição normal 5, que tem um expoente de 148,4. Então eles discutem a cobertura da média de 244,6 !! Isso só seria importante se você for modelar a média da distribuição original, NÃO os logs. Eles estão tentando fazer algo que não é. O cálculo ingênuo tem uma cobertura perfeitamente fina sobre a média do log, 5. Nenhum dos outros ICs é IC95% desse valor e é esse que você está analisando.
John John