Atualmente, estou tentando resolver violações às suposições da ANOVA. Eu usei Shapiro-Wilk para testar a normalidade e me envolvi tanto com o teste de Levene quanto com o teste de igualdade de variância de Bartlett. Desde então, o log transformou meus dados para tentar corrigir as variações desiguais. Eu refiz o teste de Bartlett no registro de dados transformados, e ainda recebi um valor p significativo, e por curiosidade também executei o teste de Levene e obtive um valor p não significativo. Em que teste devo confiar?
Provavelmente nenhum. Seria melhor olhar para seus dados e ver quão ruins são as violações. Modelos lineares (por exemplo, ANOVA) são bastante robustos a pequenas violações quando os grupos s são iguais. Uma regra prática para a heterocedasticidade é que a variação máxima do grupo pode ser até 4 vezes a variação mínima do grupo sem causar muito dano à sua análise. Se você está preocupado com a possibilidade de haver violações, uma abordagem ainda melhor é simplesmente usar análises robustas para as possíveis violações desde o início, em vez de tentar detectar violações e tomar decisões com base nisso 1 . n
Pelo que vale a pena, a Wikipedia diz que o teste de Bartlett é mais sensível a violações da normalidade do que o teste de Levene. Portanto, você pode ter dados não normais em vez de dados heterocedásticos. Novamente, uma análise mais robusta pode ser preferível 2 .
... bastante robusto a pequenas violações com Ns iguais.
John John
E há o problema em que você pode ter fortes razões para acreditar que as amostras provêm de populações com variações aproximadamente iguais ... Em que são baseados os testes de robustez.
John
Posso verificar visualmente a gama de variações usando gráficos de diagnóstico?
Clarice
Claro, @Clarice. Qualquer número de parcelas ajudará nisso. Você pode fazer um gráfico de dispersão com os pontos dispostos verticalmente nos níveis de categoria marcados no eixo x, para ver como eles se comparam. Você também pode tentar boxplots, por exemplo.
gung - Restabelece Monica
4
Para um teste menos sensível para condições não normais do que o teste de Levene, pelo menos algumas vezes, use o teste de Conover , o AKA ao quadrado classifica o teste não paramétrico. Descobri que isso às vezes é preferível ao teste de Bartlett na implementação do VarianceEquivalenceTest no Mathematica .
Aqui está uma lista de métodos e suposições de testes de variação copiados do link Equivalência de Variância acima
Bartlett normality modified likelihood ratio test
BrownForsythe robust robust Levene test
Conover symmetry Conover's squared ranks test
FisherRatio normality based on variance ratio
Levene robust,symmetry compares individual and group variances
O que deve ser óbvio nessa lista é que as violações de suposições são testáveis, embora a documentação do Mathematica não seja específica sobre como, por exemplo, o teste de simetria de Conover está sendo executado ou mesmo por que se testa simetria. E, até agora, ninguém respondeu a essa pergunta .
Portanto, a resposta para a pergunta do OP é que apenas o teste de condições pode sugerir qual método é preferível em qualquer caso específico. Além disso, se todos os 5 testes forem tentados e não forem excluídos devido à violação de suposições, geralmente é possível distinguir entre respostas melhores e piores com as respostas geradas.
Na pior das hipóteses, pode-se executar a simulação de Monte Carlo usando valores de verdade conhecidos para explorar quais condições levam a quais probabilidades. Mas, sem mais informações sobre o problema em si, a pergunta não pode ser respondida em termos do conjunto de dados do OP. Se o OP desejar uma resposta específica orientada a dados, forneça os dados.
O teste de Conover é uma sugestão razoável aqui. Mas você não deve misturar uma resposta a esta pergunta com uma nova pergunta sua e uma solicitação de feedback (de quem?) Sobre partes de sua resposta ou pedir que a edição sugerida seja aprovada.
gung - Restabelece Monica
@gung Sim, mudei para ser mais útil imediatamente.
Para um teste menos sensível para condições não normais do que o teste de Levene, pelo menos algumas vezes, use o teste de Conover , o AKA ao quadrado classifica o teste não paramétrico. Descobri que isso às vezes é preferível ao teste de Bartlett na implementação do VarianceEquivalenceTest no Mathematica .
Aqui está uma lista de métodos e suposições de testes de variação copiados do link Equivalência de Variância acima
O que deve ser óbvio nessa lista é que as violações de suposições são testáveis, embora a documentação do Mathematica não seja específica sobre como, por exemplo, o teste de simetria de Conover está sendo executado ou mesmo por que se testa simetria. E, até agora, ninguém respondeu a essa pergunta .
Portanto, a resposta para a pergunta do OP é que apenas o teste de condições pode sugerir qual método é preferível em qualquer caso específico. Além disso, se todos os 5 testes forem tentados e não forem excluídos devido à violação de suposições, geralmente é possível distinguir entre respostas melhores e piores com as respostas geradas.
Na pior das hipóteses, pode-se executar a simulação de Monte Carlo usando valores de verdade conhecidos para explorar quais condições levam a quais probabilidades. Mas, sem mais informações sobre o problema em si, a pergunta não pode ser respondida em termos do conjunto de dados do OP. Se o OP desejar uma resposta específica orientada a dados, forneça os dados.
fonte