Sem querer assumir o crédito pela resposta @ttnphns, eu queria tirar a resposta dos comentários (especialmente considerando que o link para o artigo havia morrido). A resposta de Matt Krause fornece uma discussão útil da distinção entre e R 2 um d j mas não discute a decisão de que R 2 um d j fórmula para usar em qualquer caso dado.R2R2adjR2adj
Como eu discuto em esta resposta , Yin e Fan (2001) fornecem uma boa visão geral das muitas fórmulas diferentes para estimar a variância da população explicou , os quais poderiam ser rotulado como um tipo de ajustado R 2 .ρ2R2
Eles realizam uma simulação para avaliar qual de uma ampla variedade de fórmulas quadradas r ajustadas fornece a melhor estimativa imparcial para diferentes tamanhos de amostra, e intercorrelações preditivas. Eles sugerem que a fórmula de Pratt pode ser uma boa opção, mas não acho que o estudo tenha sido definitivo sobre o assunto.ρ2
Update: Raju et ai (1997) nota que é ajustada fórmulas diferentes com base em se eles se destinam a estimativa ajustada R 2 assumindo-x fixo ou aleatório-x predcitors. Especificamente, a fórmula de Ezekial é projetada para estimar ρ 2 no contexto x fixo, e as fórmulas de Olkin-Pratt e Pratt são projetadas para estimar ρ 2 no contexto x aleatório. Não há muita diferença entre as fórmulas de Olkin-Pratt e Pratt. As premissas de x fixo se alinham às experiências planejadas, as de x aleatórias se alinham quando você assume que os valores das variáveis preditivas são uma amostra dos valores possíveis, como normalmente ocorre nos estudos observacionais. VejoR2R2ρ2ρ2esta resposta para uma discussão mais aprofundada . Também não há muita diferença entre os dois tipos de fórmulas, pois o tamanho da amostra fica moderadamente grande (veja aqui uma discussão sobre o tamanho da diferença ).
Resumo das regras de ouro
- Se você presumir que suas observações para variáveis preditivas são uma amostra aleatória de uma população e deseja estimar para a população completa de preditores e critérios (ou seja, suposição aleatória x), use a fórmula de Olkin-Pratt (ou a fórmula de Pratt).ρ2
- Se você assumir que suas observações são fixas ou não deseja generalizar além dos níveis observados do preditor, faça uma estimativa de com a fórmula de Ezekiel.ρ2
- Se você quiser saber sobre a previsão fora da amostra usando a equação de regressão da amostra, deverá procurar alguma forma de procedimento de validação cruzada.
Referências
- Raju, NS, Bilgic, R., Edwards, JE, & Fleer, PF (1997). Revisão da metodologia: Estimativa da validade e validade cruzada da população e o uso de pesos iguais na previsão. Medida Psicológica Aplicada, 21 (4), 291-305.
- Yin, P., & Fan, X. (2001). Estimando encolhimento em regressão múltipla: A comparação de diferentes métodos analíticos. The Journal of Experimental Education, 69 (2), 203-224. PDFR2