A seguir, um nomograma criado a partir do conjunto de dados mtcars com o pacote rms para a fórmula:
mpg ~ wt + am + qsec
O modelo em si parece bom com R2 de 0,85 e P <0,00001
> mod
Linear Regression Model
ols(formula = mpg ~ wt + am + qsec, data = mtcars)
Model Likelihood Discrimination
Ratio Test Indexes
Obs 32 LR chi2 60.64 R2 0.850
sigma 2.4588 d.f. 3 R2 adj 0.834
d.f. 28 Pr(> chi2) 0.0000 g 6.456
Residuals
Min 1Q Median 3Q Max
-3.4811 -1.5555 -0.7257 1.4110 4.6610
Coef S.E. t Pr(>|t|)
Intercept 9.6178 6.9596 1.38 0.1779
wt -3.9165 0.7112 -5.51 <0.0001
am 2.9358 1.4109 2.08 0.0467
qsec 1.2259 0.2887 4.25 0.0002
Não estou claro o que são esses 'Pontos', 'Total de Pontos' e 'Linear Predictor'. Qual destes representa mpg, a variável de resultado? Eu aprecio qualquer explicação.
Edit: considerando excelentes sugestões de @Glen_b para facilitar a leitura de pontos etc., a seguir pode ser um nomograma alternativo:
Como a variável resultado ou resposta está disponível, ela pode ser usada no lugar do termo 'Preditor Linear'. Também se torna auto-explicativo sobre como o nomograma precisa ser lido.
regression
multiple-regression
data-visualization
predictive-models
regression-strategies
rnso
fonte
fonte
Respostas:
Bem, como seu modelo é linear, com o mpg esperado igual ao preditor linear, você pode ler o mpg diretamente da escala do preditor linear.
Para cada variável, você encontra seu valor na escala relevante. Por exemplo, imagine que queríamos encontrar um mpg previsto para um carro com
wt=4, am=1, qsec=18
:que fornece um mpg previsto de cerca de 18,94. Substituindo na equação, obtém-se 18,95, então isso é bem próximo. (Na prática, você provavelmente trabalharia apenas até o ponto mais próximo - e, portanto, obteria a precisão de 2 dígitos - "19 mpg" -, em vez de 3-4 como aqui.)
Para mim, um dos principais benefícios desse diagrama é que você vê instantaneamente o efeito relativo das alterações nas diferentes variáveis preditivas (IV) na resposta (DV). Mesmo quando você não precisa do diagrama para qualquer cálculo, ele pode ter um grande valor em termos de simplesmente exibir os efeitos relativos das variáveis.
Pergunta de acompanhamento dos comentários:
onde:
É possível que essas funções tenham vários pontos de viragem, nas quais as escalas quebrariam e girariam várias vezes - mas a linha do eixo tem apenas dois lados.
Nos nomogramas do tipo pontos, isso não apresenta dificuldade, pois é possível mover seções adicionais da escala para cima ou para baixo (ou mais geralmente, ortogonalmente à direção do eixo) um pouco até que não ocorra sobreposição.
(Mais de um ponto de inflexão pode ser um problema para nomogramas do tipo alinhamento; uma solução mostrada no livro de Harrell é compensar todas as escalas levemente de uma linha de referência, na qual a posição do valor é realmente assumida.)
Exemplos de todas essas situações podem ser encontrados nas estratégias de modelagem de regressão de Harrell .
Apenas algumas notas laterais
Eu preferiria ver duas escalas de pontos, na parte superior e inferior da seção relevante; caso contrário, é difícil "alinhar" com precisão, porque você precisa adivinhar o que é "vertical". Algo assim:
No entanto, como observo nos comentários, para a última seção do diagrama (total de pontos e preditor linear) talvez uma alternativa melhor para uma segunda escala de pontos seria simplesmente ter um par de escalas consecutivas (total de pontos em uma lado, preditor linear por outro), assim:
com isso evitamos a necessidade de saber o que é "vertical".
Com apenas dois preditores contínuos e um único fator binário, podemos facilmente construir um nomograma de alinhamento mais tradicional :
Nesse caso, você simplesmente encontra os valores
wt
eqsec
em suas escalas e junta-os a uma linha; onde eles cruzam ompg
eixo, lemos o valor (enquanto aam
variável determina qual lado dompg
eixo você lê). Em um caso simples como esse, esses tipos de nomogramas são mais rápidos e simples de usar, mas podem ser menos fáceis de generalizar para muitos preditores, onde podem se tornar difíceis de manejar. O nomograma de estilo de pontos em sua pergunta (conforme implementado em Estratégias de modelagem de regressão e norms
pacote em R) pode adicionar mais variáveis perfeitamente. Isso pode ser uma grande vantagem ao lidar com interações.fonte
nomogram
da funçãoplot
para adicionar aPoints
escala extra por padrão. Ótima sugestão !!