Fundo:
Estou tentando seguir a revisão de Princeton sobre a estimativa de MLE para GLM .
I compreender os conceitos básicos de estimativa MLE: likelihood
, score
, observado e esperado Fisher information
ea Fisher scoring
técnica. E eu sei como justificar a regressão linear simples com a estimativa do MLE .
A questão:
Não consigo entender nem a primeira linha desse método :(
Qual é a intuição por trás da variáveis de trabalho definido como:
Por que eles são usados em vez de para estimar ?
E qual é a relação deles com a response/link function
qual é a conexão entre e
Se alguém tiver uma explicação simples ou puder me direcionar para um texto de nível mais básico sobre isso, ficaria grato.
Respostas:
Alguns anos atrás, escrevi um artigo sobre isso para meus alunos (em espanhol), para tentar reescrever essas explicações aqui. Examinarei o IRLS (mínimos quadrados ponderados iterativamente) através de uma série de exemplos de crescente complexidade. Para o primeiro exemplo, precisamos do conceito de uma família em escala de localização. Sejaf0 0 uma função de densidade centrada em zero em algum sentido. Podemos construir uma família de densidades definindo
Agora vamos usar o IRLS em alguns exemplos simples. Primeiro, vamos encontrar os estimadores de ML (máxima verossimilhança) no modelo com a densidade f ( y ) = 1
Para calcular o estimador de ML na prática, precisamos de um valor inicialμ^( 0 ) , poderíamos usar a mediana, por exemplo. Usando esse valor, calculamos resíduos
Agora estudamos esse processo com uma localização mais geral e uma família de escalas,f( y) = 1σf0 0( y- μσ) , com menos detalhes. DeixeiY1, Y2, ... , Yn seja independente da densidade acima. Definir tambémϵEu= yEu- μσ . A função loglikelihood é
A seguir, apresentamos um exame numérico usando R, para o modelo exponencial duplo (com escala conhecida) e com dados
y <- c(-5,-1,0,1,5)
. Para esses dados, o valor verdadeiro do estimador de ML é 0. O valor inicial serámu <- 0.5
. Uma passagem do algoritmo éCom esta função, você pode experimentar fazer as iterações "manualmente". Em seguida, o algoritmo iterativo pode ser feito por
Exercício: Se o modelo é umtk distribuição com parâmetro de escala σ mostre que as iterações são dadas pelo peso
Por enquanto, deixarei aqui, continuarei este post.
fonte