Devo incluir um argumento para solicitar somas de quadrados do tipo III no ezANOVA?

16

Desenvolvi o pacote ez para R como um meio de ajudar as pessoas a fazer a transição de pacotes de estatísticas como SPSS para R. Isso é (espero) alcançado, simplificando a especificação de vários tipos de ANOVA e fornecendo resultados semelhantes ao SPSS (incluindo tamanhos e suposições de efeitos testes), entre outros recursos. A ezANOVA()função serve principalmente como invólucro car::Anova(), mas a versão atual de ezANOVA()implementa apenas somas de quadrados tipo II, enquanto car::Anova()permite a especificação de somas de quadrados tipo II ou -III. Como eu provavelmente esperava, vários usuários solicitaram que eu forneça um argumento emezANOVA()que permite ao usuário solicitar o tipo II ou III. Fui reticente a fazê-lo e descrevi meu raciocínio abaixo, mas agradeceria a contribuição da comunidade sobre meu ou qualquer outro raciocínio que tenha relação com o problema.

Razões para não incluir um argumento "SS_type" em ezANOVA():

  1. A diferença entre os quadrados de soma dos tipos I, II e III só aparece quando os dados são desequilibrados; nesse caso, eu diria que mais benefícios são derivados de melhorar o desequilíbrio por meio da coleta de dados adicionais do que mexer com o cálculo da ANOVA.
  2. A diferença entre os tipos II e III aplica-se a efeitos de ordem inferior qualificados por efeitos de ordem superior; nesse caso, considero os efeitos de ordem inferior cientificamente desinteressantes. (Mas veja abaixo para uma possível complicação do argumento)
  3. Para aquelas raras circunstâncias em que (1) e (2) não se aplicam (quando a coleta de dados adicional é impossível e o pesquisador tem interesse científico válido em um efeito principal qualificado que não posso imaginar no momento), pode-se modificar com relativa facilidade a ezANOVA()fonte ou empregar car::Anova()-se para conseguir testes III tipo. Dessa maneira, vejo o esforço / entendimento extra necessário para obter testes do tipo III como um meio pelo qual posso garantir que apenas aqueles que realmente sabem o que estão fazendo sigam esse caminho.

Agora, o solicitante mais recente do tipo III apontou que o argumento (2) é prejudicado pela consideração de circunstâncias em que efeitos de ordem superior existentes, mas "não significativos", podem influenciar o cálculo de somas de quadrados para efeitos de ordem inferior. Nesses casos, é imaginável que um pesquisador observe o efeito de ordem superior e, vendo que é "não significativo", tente interpretar os efeitos de ordem inferior que, sem o conhecimento do pesquisador, foram comprometidos. Minha reação inicial é que isso não é um problema com somas de quadrados, mas com valores-p e a tradição de teste de hipótese nula. Suspeito que uma medida de evidência mais explícita, como a razão de verossimilhança, tenha maior probabilidade de gerar uma imagem menos ambígua dos modelos suportados de maneira consistente com os dados. No entanto, eu não

Mike Lawrence
fonte
2
Logo - sim. Simplesmente para permitir consistência com outros pacotes (mesmo que o resultado esteja "errado" de alguma forma - nesse caso, uma massagem de aviso seria adequada). E obrigado pelo seu pacote incrível!
Tal Galili
Quando eu escrevi "pacotes" Eu quis dizer outros pacotes estatísticos (como SPSS e SAS) - Estou contente outros têm impulsionado o ponto mais casa, então eu fiz :)
Tal Galili
2
Como muitos já sabem, o pacote ez atual (versão 3) atualizou o ezANOVA, que possui argumentos para o Tipo SS e o modelo de retorno aov.
jiggysoo

Respostas:

9

Só para amplificar - eu sou o solicitante mais recente, acredito.

Em comentário específico sobre os pontos de Mike:

  1. É claramente verdade que a diferença I / II / III se aplica apenas a preditores correlacionados (dos quais projetos desequilibrados são o exemplo mais comum, certamente na ANOVA fatorial) - mas isso me parece ser um argumento que descarta a análise da situação desequilibrada (e, portanto, qualquer debate do tipo I / II / III). Pode ser imperfeito, mas é assim que as coisas acontecem (e em muitos contextos os custos de coleta de dados adicionais superam o problema estatístico, apesar das ressalvas).

  2. Isso é completamente justo e representa a base da maioria dos argumentos "II contra III, favorecendo II" que encontrei. O melhor resumo que encontrei é Langsrud (2003) "ANOVA para dados desequilibrados: use as somas de quadrados do Tipo II em vez das do Tipo III", Statistics and Computing 13: 163-167 (tenho um PDF se o original for difícil de encontrar ) Ele argumenta (tomando o caso de dois fatores como o exemplo básico) que, se houver uma interação, há uma interação; portanto, a consideração dos efeitos principais geralmente não faz sentido (um ponto obviamente justo) - e, se não houver interação, a análise do Tipo II de Os efeitos principais são mais poderosos que o Tipo III (sem dúvida), portanto, você deve sempre usar o Tipo II. Eu já vi outros argumentos (por exemplo, Venables,

  3. E eu concordo com isso: se você tem uma interação, mas também tem alguma dúvida sobre o efeito principal, provavelmente está no território do faça você mesmo.

Claramente, existem aqueles que apenas desejam o Tipo III porque o SPSS o faz, ou alguma outra referência à Autoridade Superior Estatística. Eu não sou totalmente contra esse ponto de vista, se houver muitas pessoas aderindo ao SPSS (contra o qual tenho algumas coisas, como tempo, dinheiro e condições de validade da licença) e SS Tipo III, ou muitas pessoas mudando para R e SS Tipo III. No entanto, esse argumento é claramente estúpido estatisticamente.

No entanto, o argumento que achei bastante mais substancial a favor do Tipo III é o apresentado independentemente por Myers & Well (2003, "Research Design and Statistical Analysis", pp. 323, 626-629) e Maxwell & Delaney (2004, " Projetando Experiências e Analisando Dados: Uma Perspectiva de Comparação de Modelos ", pp. 324-328, 332-335). É o seguinte:

  • se houver uma interação, todos os métodos dão o mesmo resultado para a soma dos quadrados da interação
  • O tipo II assume que não há interação para testar os principais efeitos; tipo III não
  • Alguns (por exemplo, Langsrud) argumentam que, se a interação não for significativa, você estará justificado em supor que não existe uma e observando os principais efeitos (mais poderosos) do Tipo II
  • Porém, se o teste da interação é insuficiente, ainda há uma interação, a interação pode sair "não significativa" e ainda assim levar a uma violação das suposições do teste de efeitos principais do Tipo II, enviesando esses testes para que sejam muito liberais .
  • Myers & Well citam Appelbaum / Cramer como os principais proponentes da abordagem do Tipo II, e continuam [p323]: "... Critérios mais conservadores para a não-significância da interação poderiam ser usados, como exigir que a interação não seja significativa no momento. nível 0,25, mas não há entendimento suficiente das consequências dessa abordagem.Como regra geral, as somas de quadrados do tipo II não devem ser calculadas, a menos que haja uma forte razão a priori para não assumir efeitos de interação e uma interação claramente não significativa soma de quadrados ". Eles citam [p629] No geral, Lee & Hornick 1981 como uma demonstração de que interações que não se aproximam da significância podem influenciar os testes dos efeitos principais. Maxwell e Delaney [p334] defendem a abordagem do Tipo II se a interação da população for zero, por poder, e a abordagem do tipo III, se não for [pela interpretabilidade dos meios derivados dessa abordagem]. Eles também defendem o uso do Tipo III na situação da vida real (quando você faz inferências sobre a presença da interação a partir dos dados) por causa do problema de cometer um erro do tipo 2 [insuficiente] no teste de interação e, assim, violar acidentalmente os pressupostos da abordagem SS tipo II; eles fazem outros pontos semelhantes aos de Myers & Well e observam o longo debate sobre esse assunto! refazer inferências sobre a presença da interação a partir dos dados) devido ao problema de cometer um erro do tipo 2 [subpotência] no teste de interação e violar acidentalmente as suposições da abordagem da SS do tipo II; eles fazem outros pontos semelhantes aos de Myers & Well e observam o longo debate sobre esse assunto! refazer inferências sobre a presença da interação a partir dos dados) devido ao problema de cometer um erro do tipo 2 [subpotência] no teste de interação e violar acidentalmente as suposições da abordagem da SS do tipo II; eles fazem outros pontos semelhantes aos de Myers & Well e observam o longo debate sobre esse assunto!

Portanto, minha interpretação (e eu não sou especialista!) É que há muita Autoridade Estatística Superior nos dois lados do argumento; que os argumentos usuais apresentados não são sobre a situação usual que daria origem a problemas (sendo essa situação comum a interpretação dos efeitos principais com uma interação não significativa); e que existem razões justas para se preocupar com a abordagem do Tipo II nessa situação (e tudo se resume a uma questão de poder versus potencial excesso de liberalismo).

Para mim, basta desejar a opção Tipo III no ezANOVA, bem como o Tipo II, porque (pelo meu dinheiro) é uma excelente interface para os sistemas ANOVA da R. O R está longe de ser fácil de usar para iniciantes, na minha opinião, e o pacote "ez", com o ezANOVA e as adoráveis ​​funções de plotagem de efeitos, ajuda bastante a tornar o R ​​acessível a um público de pesquisa mais geral. Alguns dos meus pensamentos em andamento (e um desagradável hack para o ezANOVA) estão em http://www.psychol.cam.ac.uk/statistics/R/anova.html .

Estaria interessado em ouvir os pensamentos de todos!

Rudolf Cardinal
fonte
Ah, eu não tinha percebido que a distinção do tipo II / III surge sempre que os preditores são correlacionados, dos quais um design desequilibrado é apenas um exemplo. Isso certamente mina ainda mais o meu primeiro argumento "basta coletar mais dados".
Mike Lawrence
2
Estou bastante convencido pelo seu argumento de que R obterá mais conversões SPSS se forem fornecidas com meios fáceis de obter análises familiares, mesmo que essas análises exijam uma consideração mais sutil do que normalmente é aplicada. Então, uma vez que eles estejam ligados ao R, podemos tentar convencê-los de que a abordagem familiar nem sempre é necessariamente a abordagem apropriada. Acho que ainda colocarei o padrão como type = 2 com um grande aviso na documentação de que esse padrão pode produzir resultados diferentes do SPSS e os links fazem a documentação sobre a distinção do tipo II / III.
Mike Lawrence
Outras variações em preditores correlacionados geralmente são com preditores contínuos, mas sim, esse é o problema geral. // Isso me parece ótimo! Às vezes, essas mudanças são lentas; o uso de correções de esfericidade (em vez de ignorar o problema) é um que eu acho que houve progresso na neurociência. Houve momentos em que qualquer menção a ele (principalmente se você relatou o df corrigido e não inteiro) fez os árbitros pensarem que você estava latindo.
Cardeal Rudolf
Eu gostaria de acrescentar que os argumentos do Tipo III são todos sobre testes de hipóteses conservadores ou liberais, mas não sobre o significado dos componentes. Um efeito principal no Tipo III simplesmente não é sensato, pois inclui a interação com os principais efeitos ausentes. Independentemente das questões de teste conservadoras ou liberais, a coerência básica do modelo requer o Tipo II porque um efeito principal do Tipo II faz sentido. Dito isto, o ezANOVA deve ter o Tipo III por outros motivos.
John
7

Advertência: uma resposta puramente não estatística. Prefiro trabalhar com uma função (ou pelo menos um pacote) ao fazer o mesmo tipo de análise (por exemplo, ANOVA). Até o momento, uso de forma consistente, Anova()pois prefiro sua sintaxe para especificar modelos com medidas repetidas - em comparação com aov()e perder pouco (SS tipo I) com medidas não repetidas. ezANOVA()é bom para o benefício adicional de tamanhos de efeito. Mas o que eu particularmente não gosto é ter que lidar com três funções diferentes para fazer essencialmente o mesmo tipo de análise, apenas porque uma delas implementa o recurso X (mas não Y) e a outra Y (mas não X).

Para ANOVA, posso escolher entre oneway(), lm(), aov(), Anova(), ezANOVA(), e provavelmente outros. Ao ensinar R, já é difícil explicar as diferentes opções, como elas se relacionam ( aov()é um invólucro lm()) e qual função faz o que:

  • oneway()somente para projetos de fator único, mas com opção var.equal=FALSE. Não existe essa opção aov()e outras, mas essas funções também para projetos multifatoriais.
  • sintaxe para medidas repetidas um pouco complicada aov(), melhorAnova()
  • conveniente SS tipo I apenas em aov(), não emAnova()
  • SS convenientes tipo II e III apenas em Anova(), e não emaov()
  • tamanho de efeito conveniente mede ezANOVA(), não em outros

Seria legal ter apenas que ensinar uma função com uma sintaxe consistente que faça tudo. Sem o SS tipo III conveniente, ezANOVA()não pode ser essa função para mim porque sei que os alunos serão solicitados a usá-los em algum momento ("apenas verifique esses resultados que John Doe obteve com o SPSS"). Eu sinto que é melhor ter a opção de fazer a escolha sozinho, sem ter que aprender mais uma sintaxe para especificar modelos. A atitude "sei o que é melhor para você" pode ter seus méritos, mas pode ser superprotetora.

caracal
fonte
1
Para adicionar mais um requisito: Seria totalmente incrível se a função também pudesse executar todos os tipos de contrastes desta ANOVA, por exemplo, usando o multcomppacote (que, tanto quanto me lembro, requer aovobjetos). Caso contrário, eu concordo totalmente e normalmente usa ezpara o meu dever diário, porque é tão fácil ...
Henrik
1
adicionar um argumento "method" (com valores possíveis como "oneway", "aov" e "Anova" e com um argumento "..." para passar var.eq = FALSE para oneway e digite = 2 para Anova) é uma idéia intrigante, e certamente parece que seria fácil incorporar. Obrigado pela sugestão.
Mike Lawrence
@ Henrik: Eu tenho que ser honesto que meu entendimento de contrastes é muito limitado, e nunca os utilizo em minha pesquisa, por isso não priorizei a incorporação de contrastes no ez.
Mike Lawrence.
@ Mike Se você puder adicionar o argumento do método, sua função poderá retornar um aovelemento que seria ótimo. Até agora eu sou normalmente a preguiça de fazer o meu próprio aovelemento e usá-lo ezANOVAem vez com t.tests ...
Henrik
@ Mike Eu não tinha ousado sugerir algo assim, já que é o seu trabalho que você está colocando. Obrigado por isso! O ezpacote tem um grande potencial: em psicologia, ele já é recomendado com bastante frequência (cf. livro alemão "R für Einsteiger", de Luhmann). Torná-lo ainda mais flexível certamente seria apreciado.
caracal
2

O mundo R não gosta muito do SS Tipo 3.

Uma das referências geralmente citadas é a "Exegeses sobre modelos lineares" de Bill Venables (2000) .

Espero não estar enganando ele, mas acho que seu principal argumento é que o SS Tipo 3 viola o princípio da marginalidade dos modelos lineares e, portanto, não é razoável.

Henrik
fonte
0

Este foi um debate revelador sobre a questão do tipo II / III para mim. Obrigado por todos o esforço em fornecer a discussão. Eu cheguei à ideia de promover o tipo II consistentemente sobre o tipo III, mas tinha um entendimento fraco do argumento - apenas confiei nos conselhos do livro de regressão (carro) de John Fox que recomendava que os testes tipo III raramente eram interpretável (bem, acho que ele disse isso ...).

Enfim, o ezANOVA é realmente útil para permitir o acesso à funcionalidade R que, de outra forma, seria impossível para os estudantes de graduação que eu ensino em psicologia. Eu forneço módulos R on-line, um com o ezANOVA para demonstrar projetos mistos de ANOVA (embora pareça que a pré-versão 3 possa ter sido um bug para isso ... doh!)

Experimente aqui:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

depois que o módulo for carregado (~ 10s), localize o botão de computação (na metade da página) e ele executará o ezANOVA e tabelas e gráficos associados.

Ian


fonte
Quando você diz que o ez estava com erros para projetos mistos de ANOVA, você está baseando isso no meu recente anúncio da versão 3.0, no qual observo que houve um erro no código ezMixed ()? Nesse caso, acho que você interpretou mal essa nota. O ezMixed () não está relacionado ao ezANOVA (). O ezMixed () serve para ajudar a avaliar a influência de efeitos fixos em um contexto de modelagem de efeitos mistos.
Mike Lawrence
Oi Mike - você está certo - foi sua nota sobre ezMixed (). Eu li e interpretei isso errado para ezANOVA ().