Eu calculei essas taxas de probabilidade corretamente?

Sou o autor do pacote ez para R e estou trabalhando em uma atualização para incluir o cálculo automático das taxas de verossimilhança (LRs) na saída de ANOVAs. A idéia é fornecer uma LR para cada efeito que seja análogo ao teste desse efeito que a ANOVA alcança. Por exemplo, a LR para efeito principal representa a comparação de um modelo nulo com um modelo que inclui o efeito principal, a LR para uma interação representa a comparação de um modelo que inclui os efeitos principais dos componentes versus um modelo que inclui os efeitos principais e a interação deles, etc.

Agora, meu entendimento sobre computação LR vem de Glover & Dixon ( PDF ), que abrange cálculos básicos e correções de complexidade, e o apêndice de Bortolussi & Dixon ( apêndice PDF ), que abrange cálculos envolvendo variáveis de medidas repetidas. Para testar meu entendimento, desenvolvi esta planilha , que pega os dfs & SSs de um exemplo de ANOVA (gerado a partir de um design 2 * 2 * 3 * 4 usando dados falsos) e percorre o cálculo da LR para cada efeito.

Eu realmente apreciaria se alguém com um pouco mais de confiança com esse cálculo pudesse dar uma olhada e garantir que eu fiz tudo corretamente. Para aqueles que preferem código abstrato, aqui está o código R que implementa a atualização para ezANOVA () (consulte as linhas 15-95).

r anova likelihood-ratio Mike Lawrence
fonte

Respostas:

Embora o raciocínio sobre o cálculo da LR a partir dos valores de SS seja bastante justo, o método dos mínimos quadrados é equivalente, mas não o mesmo que uma estimativa de probabilidade. (A diferença pode ser ilustrada, por exemplo, no cálculo do se, que é dividido por (n-1) em uma abordagem de mínimos quadrados e dividido por n em uma probabilidade máxima. A estimativa de probabilidade máxima é, portanto, consistente, mas ligeiramente tendenciosa )

Isso tem algumas implicações: você pode calcular o LR como a probabilidade é proporcional a , mas isso não fornece a probabilidade do próprio modelo de anova. Apenas diz algo sobre a proporção. Como o AIC é definido classicamente em termos de probabilidade, não tenho certeza se você pode usá-lo como pretende. $\frac{1}{s}$

Examinei a planilha, mas os valores para a "LR não corrigida dentro" (também não estou acompanhando completamente o que exatamente você está tentando calcular lá) parecem altamente improváveis para mim.

Em uma nota lateral, o poder do teste de LR é que você pode simplesmente contrastar os modelos que deseja, não precisa fazer isso para todos eles (o que reduz o erro de vários testes). Se você fizer isso para cada termo, seu LR é completamente equivalente a um teste F, e no caso de mínimos quadrados, tanto quanto eu sei numericamente sobre o mesmo.

Sua milha pode variar, mas nunca estive confiante ao misturar conceitos de duas estruturas diferentes (ou seja, mínimos quadrados versus máxima probabilidade). Pessoalmente, eu reportaria as estatísticas F e implementaria o LR em uma função que permite comparar modelos (por exemplo, a função anova para modelos lme que faz exatamente isso).

Meus 2 centavos.

PS: Eu olhei para o seu código, mas não consegui descobrir todas as variáveis. Se você anotasse seu código usando comentários, isso tornaria a vida um pouco mais fácil novamente. A folha EXCEL também não é a mais fácil de descobrir. Vou verificar novamente mais tarde para ver se consigo fazer algo com isso.

Joris Meys
fonte