Depois de me deparar com essa discussão , estou levantando a questão sobre as convenções dos intervalos de confiança transformados de volta.
De acordo com este artigo, o IC da transformação nominal de cobertura nominal para a média de uma variável aleatória log-normal é:
LCL(X)=exp(Y+var(Y)
/ e não os ingênuos /
Agora, quais são esses ICs para as seguintes transformações:
- e
E o intervalo de tolerância para a variável aleatória em si (refiro-me a um único valor amostral retirado aleatoriamente da população)? Existe o mesmo problema com os intervalos transformados de volta ou eles terão a cobertura nominal?
confidence-interval
data-transformation
back-transformation
Germaniawerks
fonte
fonte
Respostas:
Por que você está fazendo transformações de volta? Isso é fundamental para responder à sua pergunta, porque em alguns casos a transformação ingênua é a resposta certa. Na verdade, acho que vou argumentar que, se a ingênua transformação das costas não for a resposta certa, você não deve voltar a transformar.
Acho a questão geral da transformação das costas altamente problemática e frequentemente cheia de pensamentos confusos. Olhando para o artigo que você citou, o que os leva a pensar que é uma pergunta razoável que o IC transformado de volta não capture a média original? É uma interpretação equivocada de valores transformados de volta. Eles acham que a cobertura deve ser para análise direta no espaço transformado de volta. E então eles criam uma transformação traseira para corrigir esse erro, em vez de sua interpretação.
Se você fizer suas análises sobre os valores do log, suas estimativas e inferências se aplicarão a esses valores. Contanto que você considere transformar de volta uma representação de como essa análise de log se parece no espaço exponencial, e somente assim, você estará bem com a abordagem ingênua. De fato, é preciso. Isso é verdade para qualquer transformação.
Fazer o que eles estão fazendo resolve o problema de tentar transformar o IC em algo que não é, um IC dos valores transformados. Isso está cheio de problemas. Considere o vínculo em que você está agora, os dois ICs possíveis, um no espaço transformado onde você faz suas análises e um transformado de volta, fazem afirmações muito diferentes sobre onde o provável mu está no outro espaço. A transformação traseira recomendada cria mais problemas do que resolve.
O melhor a ser retirado desse artigo é que, quando você decide transformar os dados, eles têm impactos mais profundos do que o esperado sobre o significado de suas estimativas e inferências.
fonte