Desenvolvi o pacote ez para R como um meio de ajudar as pessoas a fazer a transição de pacotes de estatísticas como SPSS para R. Isso é (espero) alcançado, simplificando a especificação de vários tipos de ANOVA e fornecendo resultados semelhantes ao SPSS (incluindo tamanhos e suposições de efeitos testes), entre outros recursos. A ezANOVA()
função serve principalmente como invólucro car::Anova()
, mas a versão atual de ezANOVA()
implementa apenas somas de quadrados tipo II, enquanto car::Anova()
permite a especificação de somas de quadrados tipo II ou -III. Como eu provavelmente esperava, vários usuários solicitaram que eu forneça um argumento emezANOVA()
que permite ao usuário solicitar o tipo II ou III. Fui reticente a fazê-lo e descrevi meu raciocínio abaixo, mas agradeceria a contribuição da comunidade sobre meu ou qualquer outro raciocínio que tenha relação com o problema.
Razões para não incluir um argumento "SS_type" em ezANOVA()
:
- A diferença entre os quadrados de soma dos tipos I, II e III só aparece quando os dados são desequilibrados; nesse caso, eu diria que mais benefícios são derivados de melhorar o desequilíbrio por meio da coleta de dados adicionais do que mexer com o cálculo da ANOVA.
- A diferença entre os tipos II e III aplica-se a efeitos de ordem inferior qualificados por efeitos de ordem superior; nesse caso, considero os efeitos de ordem inferior cientificamente desinteressantes. (Mas veja abaixo para uma possível complicação do argumento)
- Para aquelas raras circunstâncias em que (1) e (2) não se aplicam (quando a coleta de dados adicional é impossível e o pesquisador tem interesse científico válido em um efeito principal qualificado que não posso imaginar no momento), pode-se modificar com relativa facilidade a
ezANOVA()
fonte ou empregarcar::Anova()
-se para conseguir testes III tipo. Dessa maneira, vejo o esforço / entendimento extra necessário para obter testes do tipo III como um meio pelo qual posso garantir que apenas aqueles que realmente sabem o que estão fazendo sigam esse caminho.
Agora, o solicitante mais recente do tipo III apontou que o argumento (2) é prejudicado pela consideração de circunstâncias em que efeitos de ordem superior existentes, mas "não significativos", podem influenciar o cálculo de somas de quadrados para efeitos de ordem inferior. Nesses casos, é imaginável que um pesquisador observe o efeito de ordem superior e, vendo que é "não significativo", tente interpretar os efeitos de ordem inferior que, sem o conhecimento do pesquisador, foram comprometidos. Minha reação inicial é que isso não é um problema com somas de quadrados, mas com valores-p e a tradição de teste de hipótese nula. Suspeito que uma medida de evidência mais explícita, como a razão de verossimilhança, tenha maior probabilidade de gerar uma imagem menos ambígua dos modelos suportados de maneira consistente com os dados. No entanto, eu não
fonte
Respostas:
Só para amplificar - eu sou o solicitante mais recente, acredito.
Em comentário específico sobre os pontos de Mike:
É claramente verdade que a diferença I / II / III se aplica apenas a preditores correlacionados (dos quais projetos desequilibrados são o exemplo mais comum, certamente na ANOVA fatorial) - mas isso me parece ser um argumento que descarta a análise da situação desequilibrada (e, portanto, qualquer debate do tipo I / II / III). Pode ser imperfeito, mas é assim que as coisas acontecem (e em muitos contextos os custos de coleta de dados adicionais superam o problema estatístico, apesar das ressalvas).
Isso é completamente justo e representa a base da maioria dos argumentos "II contra III, favorecendo II" que encontrei. O melhor resumo que encontrei é Langsrud (2003) "ANOVA para dados desequilibrados: use as somas de quadrados do Tipo II em vez das do Tipo III", Statistics and Computing 13: 163-167 (tenho um PDF se o original for difícil de encontrar ) Ele argumenta (tomando o caso de dois fatores como o exemplo básico) que, se houver uma interação, há uma interação; portanto, a consideração dos efeitos principais geralmente não faz sentido (um ponto obviamente justo) - e, se não houver interação, a análise do Tipo II de Os efeitos principais são mais poderosos que o Tipo III (sem dúvida), portanto, você deve sempre usar o Tipo II. Eu já vi outros argumentos (por exemplo, Venables,
E eu concordo com isso: se você tem uma interação, mas também tem alguma dúvida sobre o efeito principal, provavelmente está no território do faça você mesmo.
Claramente, existem aqueles que apenas desejam o Tipo III porque o SPSS o faz, ou alguma outra referência à Autoridade Superior Estatística. Eu não sou totalmente contra esse ponto de vista, se houver muitas pessoas aderindo ao SPSS (contra o qual tenho algumas coisas, como tempo, dinheiro e condições de validade da licença) e SS Tipo III, ou muitas pessoas mudando para R e SS Tipo III. No entanto, esse argumento é claramente estúpido estatisticamente.
No entanto, o argumento que achei bastante mais substancial a favor do Tipo III é o apresentado independentemente por Myers & Well (2003, "Research Design and Statistical Analysis", pp. 323, 626-629) e Maxwell & Delaney (2004, " Projetando Experiências e Analisando Dados: Uma Perspectiva de Comparação de Modelos ", pp. 324-328, 332-335). É o seguinte:
Portanto, minha interpretação (e eu não sou especialista!) É que há muita Autoridade Estatística Superior nos dois lados do argumento; que os argumentos usuais apresentados não são sobre a situação usual que daria origem a problemas (sendo essa situação comum a interpretação dos efeitos principais com uma interação não significativa); e que existem razões justas para se preocupar com a abordagem do Tipo II nessa situação (e tudo se resume a uma questão de poder versus potencial excesso de liberalismo).
Para mim, basta desejar a opção Tipo III no ezANOVA, bem como o Tipo II, porque (pelo meu dinheiro) é uma excelente interface para os sistemas ANOVA da R. O R está longe de ser fácil de usar para iniciantes, na minha opinião, e o pacote "ez", com o ezANOVA e as adoráveis funções de plotagem de efeitos, ajuda bastante a tornar o R acessível a um público de pesquisa mais geral. Alguns dos meus pensamentos em andamento (e um desagradável hack para o ezANOVA) estão em http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Estaria interessado em ouvir os pensamentos de todos!
fonte
Advertência: uma resposta puramente não estatística. Prefiro trabalhar com uma função (ou pelo menos um pacote) ao fazer o mesmo tipo de análise (por exemplo, ANOVA). Até o momento, uso de forma consistente,
Anova()
pois prefiro sua sintaxe para especificar modelos com medidas repetidas - em comparação comaov()
e perder pouco (SS tipo I) com medidas não repetidas.ezANOVA()
é bom para o benefício adicional de tamanhos de efeito. Mas o que eu particularmente não gosto é ter que lidar com três funções diferentes para fazer essencialmente o mesmo tipo de análise, apenas porque uma delas implementa o recurso X (mas não Y) e a outra Y (mas não X).Para ANOVA, posso escolher entre
oneway()
,lm()
,aov()
,Anova()
,ezANOVA()
, e provavelmente outros. Ao ensinar R, já é difícil explicar as diferentes opções, como elas se relacionam (aov()
é um invólucrolm()
) e qual função faz o que:oneway()
somente para projetos de fator único, mas com opçãovar.equal=FALSE
. Não existe essa opçãoaov()
e outras, mas essas funções também para projetos multifatoriais.aov()
, melhorAnova()
aov()
, não emAnova()
Anova()
, e não emaov()
ezANOVA()
, não em outrosSeria legal ter apenas que ensinar uma função com uma sintaxe consistente que faça tudo. Sem o SS tipo III conveniente,
ezANOVA()
não pode ser essa função para mim porque sei que os alunos serão solicitados a usá-los em algum momento ("apenas verifique esses resultados que John Doe obteve com o SPSS"). Eu sinto que é melhor ter a opção de fazer a escolha sozinho, sem ter que aprender mais uma sintaxe para especificar modelos. A atitude "sei o que é melhor para você" pode ter seus méritos, mas pode ser superprotetora.fonte
multcomp
pacote (que, tanto quanto me lembro, requeraov
objetos). Caso contrário, eu concordo totalmente e normalmente usaez
para o meu dever diário, porque é tão fácil ...aov
elemento que seria ótimo. Até agora eu sou normalmente a preguiça de fazer o meu próprioaov
elemento e usá-loezANOVA
em vez com t.tests ...ez
pacote tem um grande potencial: em psicologia, ele já é recomendado com bastante frequência (cf. livro alemão "R für Einsteiger", de Luhmann). Torná-lo ainda mais flexível certamente seria apreciado.O mundo R não gosta muito do SS Tipo 3.
Uma das referências geralmente citadas é a "Exegeses sobre modelos lineares" de Bill Venables (2000) .
Espero não estar enganando ele, mas acho que seu principal argumento é que o SS Tipo 3 viola o princípio da marginalidade dos modelos lineares e, portanto, não é razoável.
fonte
Este foi um debate revelador sobre a questão do tipo II / III para mim. Obrigado por todos o esforço em fornecer a discussão. Eu cheguei à ideia de promover o tipo II consistentemente sobre o tipo III, mas tinha um entendimento fraco do argumento - apenas confiei nos conselhos do livro de regressão (carro) de John Fox que recomendava que os testes tipo III raramente eram interpretável (bem, acho que ele disse isso ...).
Enfim, o ezANOVA é realmente útil para permitir o acesso à funcionalidade R que, de outra forma, seria impossível para os estudantes de graduação que eu ensino em psicologia. Eu forneço módulos R on-line, um com o ezANOVA para demonstrar projetos mistos de ANOVA (embora pareça que a pré-versão 3 possa ter sido um bug para isso ... doh!)
Experimente aqui:
http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp
depois que o módulo for carregado (~ 10s), localize o botão de computação (na metade da página) e ele executará o ezANOVA e tabelas e gráficos associados.
Ian
fonte