Estou avaliando dois (2) refrigerantes (gases) que foram usados no mesmo sistema de refrigeração. Eu tenho dados de temperatura de sucção saturada ( ), temperatura de condensação ( D ) e amperagem ( Y ) para a avaliação. Existem dois (2) conjuntos de dados; 1º refrigerante ( R 1 ) e 2º refrigerante ( R 2 ). Estou usando um modelo polinomial linear, multivariado ( S & D ) de 3ª ordem para as análises de regressão. Gostaria de determinar quanto menos / mais amperagem (ou, alguma métrica semelhante à comparação de desempenho), em média, como porcentagem, está sendo consumida pelo segundo refrigerante.
Meu primeiro pensamento foi:
- Determine o modelo a ser usado:
- Derivar coeficientes ( ) a partir dos dados da linha de base ( R 1 ).
- Usando esses coeficientes, para cada & D na R 2 conjunto de dados, calcular cada sorteio esperado amplificador ( Y ) e em seguida a média.
- Comparar o Y média para o sorteio amp média real ( Y 2 ) dos R 2 dados.
No entanto, como o segundo refrigerante possui propriedades térmicas ligeiramente diferentes e pequenas alterações foram feitas no sistema de refrigeração (ajustes de TXV e superaquecimento), não acredito que esse 'método de comparação de linha de base' seja preciso.
Meu próximo pensamento foi fazer duas (2) análises de regressão separadas:
e, em seguida, para a temperatura de sucção saturada ( ), compare os coeficientes ( a 1 vs b 1 ) da seguinte forma: % change = b 1 - a 1
No entanto, novamente, esses coeficientes devem ser ponderados de maneira diferente. Portanto, os resultados seriam distorcidos.
Acredito que eu poderia usar um teste z para determinar quão diferentes são os coeficientes, mas não sei se entendi completamente o significado da saída: . Mas isso ainda não me daria uma métrica de desempenho, que é o objetivo geral.
fonte
Respostas:
Para verificar que tipo de modelo usar, tente um e verifique se os resíduos são homoscedásticos. Se não estiverem, então você tem um modelo tendencioso , faça outra coisa como modelar os logaritmos, como acima, um ou mais recíprocos de dados x ou y, raízes quadradas, quadratura, exponenciação e assim por diante até que os resíduos sejam homocedásticos. Se o modelo não puder produzir resíduos homoscedásticos, use regressão linear múltipla de Theil, com censura, se necessário.
Como normalmente os dados são distribuídos no eixo y não é necessário, mas os outliers podem distorcer e costuma distorcer os resultados dos parâmetros de regressão acentuadamente. Se a homoscedasticidade não puder ser encontrada, os mínimos quadrados comuns não devem ser usados e algum outro tipo de regressão precisa ser realizado, por exemplo, regressão ponderada, regressão de Theil, mínimos quadrados em x, regressão de Deming e assim por diante. Além disso, os erros não devem ser correlacionados em série.
fonte