Estou usando a glmfit
função no MATLAB. A função retorna apenas o desvio e não a probabilidade do log. Entendo que o desvio é basicamente o dobro da diferença entre as probabilidades de log dos modelos, mas o que não entendo é que estou apenas usando glmfit
para criar um modelo, mas de alguma forma estou obtendo um desvio.
- O cálculo da probabilidade -2 Log requer 2 modelos?
- Como o desvio pode ser analisado quando existe apenas um modelo?
Outra pergunta que tenho é dizer que eu tinha dois modelos e que os comparava usando o teste de probabilidade de log. A hipótese nula seria o primeiro modelo e a hipótese alternativa seria o segundo modelo. Depois de obter a estatística do teste de verossimilhança do log, eu a compararia com o chi quadrado cdf para determinar o valor de p? Estou certo de que, se for menor que o nível alfa, rejeitaria o nulo e, se for maior, falharia em rejeitar o nulo?
fonte
Respostas:
O termo estatístico desvio é jogado um pouco demais. Na maioria das vezes, os programas retornam o desvioD ( y) = - 2 log{ p ( y|θ^) } ,
Onde θ^ é o (s) parâmetro (s) estimado (s) do ajuste do modelo e y é alguma ocorrência potencialmente observada / observável da quantidade aleatória em questão.
O desvio mais comum a que você se refere trataria o desvio acima como uma função de duas variáveis, os dados e os parâmetros ajustados:D ( y,θ^) = - 2 log{ p ( y|θ^) }
e então se você tivesse um y valor, mas dois valores de parâmetros ajustados concorrentes, θ^1 e θ^2 , então você obteria o desvio que você mencionou - 2 ( log{ p ( y|θ^1) } -log{ p ( y|θ^2) } ).
Você pode ler sobre a função Matlab que você mencionou
glmfit()
, vinculada aqui . Uma discussão mais frutífera, embora mais curta, sobre o desvio está relacionada aqui .A estatística de desvio implicitamente assume dois modelos: o primeiro é o seu modelo ajustado, retornado porθ^1 . O segundo é o "modelo completo" (também chamado de "modelo saturado"), que é um modelo no qual existe uma variável livre para cada ponto de dados, chame esse vetor de parâmetroθ^s . Ter tantas variáveis livres é obviamente uma coisa estúpida, mas permite que você se ajuste exatamente a esses dados.
glmfit()
, chame esse vetor de parâmetroPortanto, a estatística de desvio é calculada como a diferença entre a probabilidade logarítmica calculada no modelo ajustado e no modelo saturado. DeixeiY= {y1,y2, ⋯ ,yN} seja a coleção dos N pontos de dados. Então:
Veja o Capítulo 6 da Análise de Dados Bayesiana para uma boa discussão sobre desvio.
Quanto ao seu segundo ponto sobre a estatística do teste de probabilidade, sim, parece que você basicamente sabe a coisa certa a fazer. Mas, em muitos casos, você considerará a hipótese nula como algo que o conhecimento externo especializado permite adivinhar com antecedência (como um coeficiente igual a zero). Não é necessariamente algo que resulta do ajuste do modelo.
fonte