O que são "valores iniciais" na função glm ()?

12

Quais são os parâmetros start, etastart, mustartna função GLM () ? Eu estive pesquisando os documentos e a Internet, mas não encontrei uma explicação clara do que isso significa.

Assemelha-se a "valores iniciais" bayesianos para as cadeias, mas duvido que isso esteja relacionado, pois a função glm () em R é uma estatística frequente ...

Curioso
fonte

Respostas:

10

Apenas tem a ver com a técnica de estimativa - como é chegado um conjunto de estimativas para os parâmetros no modelo. Um modelo linear generalizado é ajustado por mínimos quadrados iterativamente ponderados. Para começar, é escolhido um conjunto arbitrário de pesos (geralmente todos iguais para começar); depois, são escolhidas estimativas dos parâmetros no preditor linear que minimizam a soma ponderada dos quadrados dos resíduos. Esses parâmetros estimados no preditor linear são usados ​​para estimar um novo vetor de médias. A partir disso, um novo conjunto de pesos é derivado - por exemplo, dependendo de qual função de família e vínculo está sendo usada, a variação da resposta pode ser proporcional à média da resposta - para que os pesos sejam inversamente proporcionais à média. Esse novo conjunto de pesos é usado em uma nova iteração de todo o procedimento.

Portanto, os três argumentos para glm () sobre os quais você perguntou são apenas maneiras de o usuário iniciar o procedimento em algum ponto arbitrário, em vez de permitir que ele escolha seu próprio ponto inicial padrão. No arquivo de ajuda ao qual você vinculou:

  • start - valores iniciais para os parâmetros no preditor linear.
  • etastart - valores iniciais para o preditor linear.
  • mustart - valores iniciais para o vetor de médias.
Peter Ellis
fonte
Obrigado Peter! Assemelha-se completamente ao procedimento bayesiano do MCMC! Pensei pacotes frequentistas são mais inteligente e não é assim que funciona :-) Isto é o que eu estava confuso sobre ... por que na terra existe algo como valores iniciais no pacote frequencista :-)
Curious
11
Às vezes, sem valores iniciais, você pode falhar em convergir ou convergir para um máximo local que não é uma solução ideal globalmente. Portanto, é bom ter a opção de experimentar diferentes valores iniciais.
22813 Peter Ellis
Eu começar a ter a sensação de que ainda glm()é bayesiana :-)
Curious
4
@ Curioso Não é particularmente bayesiano. Tudo o que você pede é que o pacote de software encontre um ponto específico por meio de uma técnica de pesquisa. Os valores iniciais apenas indicam por onde começar - não dá um peso específico a essa resposta, mas pode ajudar se estiver vagando por um espaço complicado. Não há nada particularmente bayesiano em "Eu começaria, digamos, 0,05 e trabalharia a partir daí ..."
Fomite 17/07/2015