Eu tenho que criar gráficos (semelhantes aos gráficos de crescimento) para crianças de 5 a 15 anos (apenas 5,6,7 etc; não existem valores fracionários como 2,6 anos) para uma variável de saúde que não seja negativa, contínua e o intervalo de 50 a 150 (com apenas alguns valores fora desse intervalo). Eu tenho que criar curvas de percentil 90, 95 e 99 e também criar tabelas para esses percentis. O tamanho da amostra é de cerca de 8000.
Eu verifiquei e encontrei as seguintes maneiras possíveis:
Encontre quantis e use o método loess para obter uma curva suave desses quantis. O grau de suavidade pode ser ajustado pelo parâmetro 'span'.
Use o método LMS (Lambda-Mu-Sigma) (por exemplo, usando pacotes gamlss ou VGAM em R).
Use regressão quantílica.
Use a média e o DP de cada faixa etária para estimar o percentil para essa idade e criar curvas de percentil.
Qual é a melhor maneira de fazer isso? Por "melhor", quero dizer o método ideal que é o método padrão para a criação de tais curvas de crescimento e seria aceitável para todos. Ou um método mais fácil e mais simples de implementar, que pode ter algumas limitações, mas é um método aceitável e mais rápido. (Por exemplo, usar loess em valores de percentil é muito mais rápido que usar o LMS do pacote gamlss).
Além disso, qual será o código R básico para esse método.
Obrigado pela ajuda.
Respostas:
Existe uma grande literatura sobre curvas de crescimento. Na minha opinião, existem três abordagens "principais". Nos três, o tempo é modelado como um spline cúbico restrito com um número suficiente de nós (por exemplo, 6). Este é um paramétrico mais suave, com excelente desempenho e fácil interpretação.
fonte
Regressão do processo gaussiano . Comece com o kernel exponencial ao quadrado e tente ajustar os parâmetros a olho nu. Mais tarde, se você quiser fazer as coisas corretamente, experimente diferentes kernels e use a probabilidade marginal para otimizar os parâmetros.
Se você quiser mais detalhes do que o tutorial vinculado acima fornece, este livro é ótimo .
fonte