Tenho dificuldade em interpretar alguns resultados. Estou fazendo uma regressão hierárquica relacionada ecoreg
. Se eu digitar o código, receberei resultados com odds ratio, ratio de confiança e uma probabilidade de log maximizada 2x.
No entanto, não entendo completamente como interpretar a probabilidade de log maximizada 2x. Tanto quanto sei, a probabilidade de log é usada como uma maneira conveniente de calcular uma probabilidade e calcula o valor dos parâmetros com base nos resultados. Mas não entendo se um valor maior ou menor é melhor. Eu olhei para várias fontes online, por exemplo , /programming/2343093/what-is-log-likelihood , mas ainda estou emperrado.
Abaixo o resultado que recebo:
Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke +
soclass, data = dfAggPlus, cross = cross)
Aggregate-level odds ratios:
OR l95 u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome 1.0689951 0.95574925 1.19565924
Individual-level odds ratios:
OR l95 u95
fracSmoke 3.124053 2.0761956 4.700765
soclass 1.001050 0.9930815 1.009083
-2 x log-likelihood: 237.4882
Então, como devo interpretar um valor de 237.4882 em comparação com um resultado de 206 ou 1083? A ajuda é muito apreciada!
fonte
Respostas:
Para obter pelo menos algum significado da probabilidade L, lembre-se de que, para corrigir a contagem de amostras N, a probabilidade máxima de log para um determinado modelo de distribuição depende principalmente da escala. Para determinada variação, a distribuição normal tem o valor mais alto. Para ter uma ideia, dividiria o logL por N e, talvez, também fizesse uma correção de escala. Se seus dados se ajustarem melhor a uma distribuição uniforme, seria melhor usar a probabilidade uniforme como função máxima de entropia para determinado intervalo como um tipo de referência. Outro valor de referência geral pode ser o caso contínuo de usar um ajuste do KDE e calcular o L para isso. No entanto, o que você faz L é mais difícil de interpretar do que, por exemplo, o valor KS ou o erro rms.
Se você pegar outro modelo e obter um L maior, isso não significa que o modelo seja melhor, porque talvez você esteja em uma situação de sobreajuste. Para incluir isso, use o valor AIC. Aqui menor é melhor e, novamente, você pode usar uma distribuição normal como "referência".
fonte