Eu tenho um modelo não linear , onde é o cdf da distribuição normal padrão ef é não-linear (veja abaixo). Quero testar a qualidade do ajuste desse modelo com o parâmetro para meus dados , depois de usar a estimativa de probabilidade máxima para encontrar . O que seria um teste apropriado? Eu gostaria de usar este teste para rotular um ajuste inadequado como ruim e determinar se mais dados devem ser coletados.Φ a ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n ) a
Eu examinei o uso de desvio, que compara esse modelo com o modelo saturado, com seu teste correspondente de qualidade de ajuste usando a . Isso seria apropriado? A maior parte do que li sobre desvio aplica-o aos GLMs, o que não é o que tenho. Se o teste de desvio é apropriado, que suposições precisam ser mantidas para validar o teste?
Atualização: para , caso isso ajude. x>1,a>0
fonte
Respostas:
Use o pacote "npcmstest" na biblioteca "NP" se você estiver usando a plataforma R. Aviso: A função pode levar alguns minutos para avaliar seu modelo.
Você também pode considerar uma comparação teórica da informação da distribuição de resposta e da distribuição preditiva (isto é, divergência de KL, entropia cruzada etc.)
fonte
lm
ou de outroglm
. Como isso funcionaria para um modelo não linear? (Sim, estou usando R.) Adicionei o que é à minha pergunta, caso isso ajude.gam
ou algo parecido (mgcv
pacote)? Caso contrário, você deve conferir.Aqui está como eu faria isso, basicamente um teste de razão de verossimilhança. Mas lembre-se de que "a chave" para entender um teste de adequação é entender a classe de alternativas contra as quais você está testando. Agora, temos a probabilidade de cada ponto de dados individual como:
Onde é a probabilidade do termo de erro em seu modelo e é a previsão do modelo para o i-ésimo ponto de dados, dado e . Agora, para cada ponto de dados , podemos escolher tal que - o "modelo saturado" como você o chama. Portanto, o é apropriado aqui, se você quiser testar apenas alternativas dentro da classe daqueles com a mesma probabilidade de erro, , e tiver independência de cada uma das probabilidades (ou seja, saber outrof i = x i - 1g(ϵ ) xia(xi,yi)afi=yiχ2g(ϵ)fEu= xEu- 1umax2Eu+ 1√ xEu uma ( xEu,yEu) uma fEu= yEu χ2 g( ϵ ) xj, yj não ajudaria em prever , dado a ). yEu uma
fonte
No contexto de regressão linear, o teste de qualidade do ajuste é frequentemente realizado contra uma alternativa mais complicada. Você tem uma regressão linear - jogue em alguns termos polinomiais para testar se a forma linear é suficiente. Como você já possui uma forma funcional não linear, a alternativa complicada que você precisaria considerar seria a regressão não paramétrica . Não tentarei fornecer uma introdução ao tópico, pois exige uma mentalidade própria e vale a pena uma introdução apropriada separada. Para o teste de regressões paramétricas x não paramétricas, Wooldridge (1992) ou Hardle e Mammen (1993) , eles fazem coisas muito semelhantes. Hardle também escreveu um ótimo livro sobre o assunto.
fonte