Um instrumento usado para medir os níveis de glicose no sangue de uma pessoa é monitorado em uma amostra aleatória de 10 pessoas. Os níveis também são medidos usando um procedimento laboratorial muito preciso. A medida do instrumento é denotada por x. A medida do procedimento de laboratório é denotada por y.
Pessoalmente, acho que y em x é mais correto, porque a intenção é usar as leituras do instrumento para prever as leituras do laboratório. E y em x minimiza os erros de tais previsões.
Mas a resposta fornecida foi x em y.
[self-study]
tag.Respostas:
Muitos trabalhos de laboratório, especialmente as experiências de teste por instrumentos, aplicam tal regressão x em y.
Eles argumentam que, a partir da coleta de dados no experimento, as condições y são controladas e obtêm x da leitura do instrumento (introduzindo algum erro). Este é o modelo físico original do experimento, portanto o erro x ~ y + é mais adequado.
Para minimizar o erro do experimento, às vezes, y sendo controlado na mesma condição, x é medido por várias vezes (ou experimento repetido). Este procedimento pode ajudá-lo a entender a lógica por trás deles e a encontrar o erro x ~ y + mais claramente.
fonte
fonte
Previsão e previsão
Sim, você está correto. Quando você vê isso como um problema de previsão, uma regressão Y-X fornece um modelo tal que, dada uma medida do instrumento, você pode fazer uma estimativa imparcial da medida exata do laboratório, sem executar o procedimento de laboratório. .
Isso pode parecer contra-intuitivo, porque a estrutura de erro não é a "real". Supondo que o método de laboratório seja um método padrão livre de erros, então "sabemos" que o verdadeiro modelo de geração de dados é
Explicitamente, sem perda de generalidade, podemos deixar
Análise de Instrumentos
A pessoa que fez essa pergunta claramente não queria a resposta acima, pois diz que o X-Y-Y é o método correto, então por que eles queriam isso? Provavelmente eles estavam considerando a tarefa de entender o instrumento. Conforme discutido na resposta de Vincent, se você quiser saber sobre o comportamento do instrumento, o X-on-Y é o caminho a seguir.
Voltando à primeira equação acima:
Encolhimento
Exemplo em R Uma maneira de entender o que está acontecendo aqui é fazer alguns dados e experimentar os métodos. O código abaixo compara X-Y com Y-X sobre previsão e calibração e você pode ver rapidamente que X-Y não é bom para o modelo de previsão, mas é o procedimento correto para calibração.
As duas linhas de regressão são plotadas sobre os dados
E o erro da soma dos quadrados para Y é medido para os dois ajustes em uma nova amostra.
Alternativamente, uma amostra pode ser gerada em um Y fixo (neste caso 4) e, em seguida, na média das estimativas feitas. Agora você pode ver que o preditor Y-on-X não está bem calibrado com um valor esperado muito menor que Y. O preditor X-Y-Y está bem calibrado com um valor esperado próximo a Y.
A distribuição das duas previsões pode ser vista em um gráfico de densidade.
fonte
Depende de suas suposições sobre a variação de X e a variação de Y para os Mínimos Quadrados Ordinários. Se Y tem a única fonte de variação e X tem variação zero, use X para estimar Y. Se as premissas são inversas (X tem a única variação e Y tem variação zero), use Y para estimar X.
Se presumir que X e Y têm variação, pode ser necessário considerar o total de mínimos quadrados .
Uma boa descrição do TLS foi escrita neste link . O documento é voltado para o comércio, mas a seção 3 faz um bom trabalho ao descrever o TLS.
Edit 1 (09/10/2013) =========================================== ======
Originalmente, assumi que isso era algum tipo de problema de lição de casa, então não fui muito específico sobre "a resposta" à pergunta do OP. Mas, depois de ler outras respostas, parece que tudo bem ficar um pouco mais detalhado.
Citando parte da pergunta do PO:
".... Os níveis também são medidos usando um procedimento laboratorial muito preciso ...."
A declaração acima diz que existem duas medições, uma do instrumento e outra do procedimento de laboratório. A declaração também implica que a variação para o procedimento de laboratório é baixa em comparação com a variação para o instrumento.
Outra citação da pergunta do OP é:
".... A medida do procedimento laboratorial é indicada por y ....."
Portanto, pelas duas afirmações acima, Y tem a menor variação. Portanto, a técnica menos propensa a erros é usar Y para estimar X. A "resposta fornecida" estava correta.
fonte