fundo
Para analisar diferenças em alguma variável contínua entre diferentes grupos (dados por uma variável categórica), pode-se realizar uma ANOVA unidirecional. Se houver várias variáveis explicativas (categóricas), é possível realizar uma ANOVA fatorial. Se alguém deseja analisar diferenças entre grupos em várias variáveis contínuas (ou seja, várias variáveis de resposta), é necessário executar uma ANOVA multivariada (MANOVA).
Questão
Eu mal entendo como é possível realizar um teste do tipo ANOVA em várias variáveis de resposta e, mais importante, não entendo qual poderia ser a hipótese nula. É a hipótese nula:
- "Para cada variável de resposta, as médias de todos os grupos são iguais",
ou é
- "Para pelo menos uma variável de resposta, as médias de todos os grupos são iguais",
ou é outra coisa?
hypothesis-testing
anova
manova
Remi.b
fonte
fonte
H0
de MANOVA é que não há diferença no espaço multivariado . O caso multivariado é consideravelmente mais complexo do que univariado, porque temos que lidar com covariâncias, não apenas com variações. Existem várias maneiras de formular asH0-H1
hipóteses no MANOVA. Leia a Wikipedia.For each response variable
. Para mim, parece (ou leio como) "o teste é realizado de maneira unívoca em cada um" (e, de alguma forma, combinado).Respostas:
A hipótese nula de uma ANOVA unidirecional é que as médias de todos os grupos são iguais:A hipótese nula de uma MANOVA unidirecional é que as médias [multivariadas] de todos os grupos são iguais:Isso equivale a dizer que as médias são iguais para cada variável de resposta, ou seja, sua primeira opção está correta .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0
Nos dois casos, a hipótese alternativa é a negação do nulo. Nos dois casos, as premissas são (a) distribuições gaussianas dentro do grupo e (b) variâncias iguais (para ANOVA) / matrizes de covariância (para MANOVA) entre os grupos.H1
Diferença entre MANOVA e ANOVAs
Isso pode parecer um pouco confuso: a hipótese nula de MANOVA é exatamente a mesma que a combinação de hipóteses nulas para uma coleção de ANOVAs univariadas, mas ao mesmo tempo sabemos que fazer MANOVA não é equivalente a fazer ANOVAs univariadas e, de alguma forma " combinar "os resultados (pode-se encontrar várias maneiras de combinar). Por que não?
A resposta é que executar todas as ANOVAs univariadas, mesmo que testasse a mesma hipótese nula, terá menos poder. Veja minha resposta aqui para uma ilustração: Como o MANOVA pode relatar uma diferença significativa quando nenhuma das ANOVAs univariadas atinge significância? O método ingênuo de "combinar" (rejeitar o nulo global se pelo menos uma ANOVA rejeitar o nulo) também levaria a uma inflação enorme da taxa de erro do tipo I; mas mesmo se você escolher uma maneira inteligente de "combinar" para manter a taxa de erro correta, perderá o poder.
Como o teste funciona
ANOVA decompõe soma total de quadrados a em entre-grupo da soma dos quadrados e dentro do grupo da soma dos quadrados , de modo que . Em seguida, calcula a relação . Sob a hipótese nula, essa proporção deve ser pequena (em torno de ); pode-se calcular a distribuição exata dessa relação esperada sob a hipótese nula (isso dependerá de e do número de grupos). Comparar o valor observado com esta distribuição gera um valor p.T B W T=B+W B/W 1 n B/W
MANOVA decompõe-se a dispersão total de matriz em entre-grupo de dispersão matriz e dentro do grupo de dispersão matriz , de modo que . Em seguida, calcula a matriz . Sob a hipótese nula, essa matriz deve ser "pequena" (em torno de ); mas como quantificar quão "pequeno" é? MANOVA examina os autovalores desta matriz (todos são positivos). Novamente, sob a hipótese nula, esses valores próprios devem ser "pequenos" (em torno deT B W T=B+W W−1B I λi 1 ) Mas, para calcular um valor-p, precisamos de um número (chamado "estatística") para poder compará-lo com sua distribuição esperada sob o valor nulo. Existem várias maneiras de fazer isso: pegue a soma de todos os autovalores ; pegue o valor próprio máximo , etc. Em cada caso, esse número é comparado com a distribuição dessa quantidade esperada sob o nulo, resultando em um valor-p.∑λi max{λi}
Escolhas diferentes da estatística de teste levam a valores de p ligeiramente diferentes, mas é importante perceber que, em cada caso, a mesma hipótese nula está sendo testada.
fonte
SSdifference/SSerror
escalar. No MANOVA, o efeito multivariado é aSSCPerror^(-1)SSCPdifference
matriz (covariâncias totais e dentro dos grupos contabilizados). Porém, como existem vários autovalores nele que poderiam ser "combinados" não de uma maneira única em uma estatística de teste, existem várias hipóteses alternativas possíveis. Mais poder - mais complexidade teórica.É o primeiro.
No entanto, do jeito que faz, não é literalmente comparar as médias de cada uma das variáveis originais. Em vez disso, as variáveis de resposta são transformadas linearmente de maneira muito semelhante à análise dos componentes principais . (Existe uma excelente discussão sobre o PCA aqui: Entendendo a análise de componentes principais, vetores próprios e valores próprios .) A diferença é que o PCA orienta seus eixos para se alinhar com as direções de variação máxima, enquanto o MANOVA gira seus eixos nas direções que maximizar a separação de seus grupos.
Para deixar claro, porém, nenhum dos testes associados a uma MANOVA está testando todas as médias uma após a outra em um sentido direto, seja com as médias no espaço original ou no espaço transformado. Existem várias estatísticas de teste diferentes, cada uma trabalhando de uma maneira ligeiramente diferente, mas elas tendem a operar sobre os valores próprios da decomposição que transforma o espaço. Mas no que diz respeito à natureza da hipótese nula, é que todos os meios de todos os grupos são os mesmos em cada variável de resposta, não que eles possam diferir em algumas variáveis, mas são iguais em pelo menos uma.
fonte