Estou fazendo uma apresentação sobre linhas de montagem. Eu tenho uma função linear simples, . Estou tentando obter pontos de dados dispersos que posso colocar em um gráfico de dispersão que manterá minha linha de melhor ajuste na mesma equação.
Eu adoraria aprender essa técnica no R ou no Excel - o que for mais fácil.
r
regression
least-squares
excel
Ryan Chase
fonte
fonte
Respostas:
Escolha qualquer(xi) desde que pelo menos dois deles sejam diferentes. Defina uma interceptação β0 e a inclinação β1 e defina
Este ajuste é perfeito. Sem alterar o ajuste, você pode modificary0 para y=y0+ε adicionando qualquer vetor de erro ε=(εi) a ele, desde que ortogonal ao vetor x=(xi) e ao vetor constante (1,1,…,1) . Uma maneira fácil de obter esse erro é escolher qualquer vetor e e ser ε os resíduos após a regressão de e contra x . No código abaixo, e é gerado como um conjunto de valores normais aleatórios independentes com média 0 e desvio padrão comum.
Além disso, você pode até mesmo pré-selecionar a quantidade de dispersão, talvez, estipulando queR2 deve ser. Deixando τ2=var(yi)=β21var(xi) , redimensione novamente os resíduos para ter uma variação de
Este método é totalmente geral: todos os exemplos possíveis (para um determinado conjunto dexi ) podem ser criados dessa maneira.
Exemplos
Quarteto de Anscombe
Podemos facilmente reproduzir o Quarteto de Anscombe de quatro conjuntos de dados bivariados qualitativamente distintos com as mesmas estatísticas descritivas (até segunda ordem).
O código é notavelmente simples e flexível.
A saída fornece estatísticas descritivas de segunda ordem para os dados(x,y) de cada conjunto de dados. Todas as quatro linhas são idênticas. Você pode criar facilmente mais exemplos alterando
x
(as coordenadas x) ee
(os padrões de erro) desde o início.Simulações
R
(Não seria difícil portar isso para o Excel - mas é um pouco doloroso.)
summary(fit)
fonte