Qual é a hipótese nula de uma MANOVA?

fundo

Para analisar diferenças em alguma variável contínua entre diferentes grupos (dados por uma variável categórica), pode-se realizar uma ANOVA unidirecional. Se houver várias variáveis explicativas (categóricas), é possível realizar uma ANOVA fatorial. Se alguém deseja analisar diferenças entre grupos em várias variáveis contínuas (ou seja, várias variáveis de resposta), é necessário executar uma ANOVA multivariada (MANOVA).

Questão

Eu mal entendo como é possível realizar um teste do tipo ANOVA em várias variáveis de resposta e, mais importante, não entendo qual poderia ser a hipótese nula. É a hipótese nula:

"Para cada variável de resposta, as médias de todos os grupos são iguais",

ou é

"Para pelo menos uma variável de resposta, as médias de todos os grupos são iguais",

ou é outra coisa? $H_0$

hypothesis-testing anova manova Remi.b
fonte

Não sei dizer, você também está perguntando como funciona uma ANOVA? No contexto da discussão sobre o que é um erro padrão, explico essencialmente a idéia básica por trás de uma ANOVA: Como o erro padrão funciona?

gung - Restabelece Monica

Nenhuma de suas duas declarações. H0de MANOVA é que não há diferença no espaço multivariado . O caso multivariado é consideravelmente mais complexo do que univariado, porque temos que lidar com covariâncias, não apenas com variações. Existem várias maneiras de formular as H0-H1hipóteses no MANOVA. Leia a Wikipedia.

precisa saber é

@ttnphns: Por que não? O da ANOVA é que as médias de todos os grupos são iguais. O de MANOVA é que as médias multivariadas de todos os grupos são iguais. Essa é exatamente a alternativa 1 no OP. As covariâncias etc. inserem as suposições e os cálculos de MANOVA, não a hipótese nula.

H_{0}

$H_0$

H_{0}

$H_0$

ameba diz Restabelecer Monica

@amoeba, eu não gostei For each response variable. Para mim, parece (ou leio como) "o teste é realizado de maneira unívoca em cada um" (e, de alguma forma, combinado).

precisa saber é o seguinte

Respostas:

A hipótese nula de uma ANOVA unidirecional é que as médias de todos os grupos são iguais:A hipótese nula de uma MANOVA unidirecional é que as médias [multivariadas] de todos os grupos são iguais:Isso equivale a dizer que as médias são iguais para cada variável de resposta, ou seja, sua primeira opção está correta . $H_0$

H_{0} : μ_{1} = μ_{2} = . . . = μ_{k} .

$H_0: \mu_1 = \mu_2 = ... = \mu_k.$

H_{0}

$H_0$

H_{0} : μ_{1} = μ_{2} = . . . = μ_{k} .

$H_0: \boldsymbol \mu_1 = \boldsymbol \mu_2 = ... = \boldsymbol \mu_k.$

Nos dois casos, a hipótese alternativa é a negação do nulo. Nos dois casos, as premissas são (a) distribuições gaussianas dentro do grupo e (b) variâncias iguais (para ANOVA) / matrizes de covariância (para MANOVA) entre os grupos. $H_1$

Diferença entre MANOVA e ANOVAs

Isso pode parecer um pouco confuso: a hipótese nula de MANOVA é exatamente a mesma que a combinação de hipóteses nulas para uma coleção de ANOVAs univariadas, mas ao mesmo tempo sabemos que fazer MANOVA não é equivalente a fazer ANOVAs univariadas e, de alguma forma " combinar "os resultados (pode-se encontrar várias maneiras de combinar). Por que não?

A resposta é que executar todas as ANOVAs univariadas, mesmo que testasse a mesma hipótese nula, terá menos poder. Veja minha resposta aqui para uma ilustração: Como o MANOVA pode relatar uma diferença significativa quando nenhuma das ANOVAs univariadas atinge significância? O método ingênuo de "combinar" (rejeitar o nulo global se pelo menos uma ANOVA rejeitar o nulo) também levaria a uma inflação enorme da taxa de erro do tipo I; mas mesmo se você escolher uma maneira inteligente de "combinar" para manter a taxa de erro correta, perderá o poder.

Como o teste funciona

ANOVA decompõe soma total de quadrados a em entre-grupo da soma dos quadrados e dentro do grupo da soma dos quadrados , de modo que . Em seguida, calcula a relação . Sob a hipótese nula, essa proporção deve ser pequena (em torno de ); pode-se calcular a distribuição exata dessa relação esperada sob a hipótese nula (isso dependerá de e do número de grupos). Comparar o valor observado com esta distribuição gera um valor p. $T$ $B$ $W$ $T=B+W$ $B/W$ $1$ $n$ $B/W$

MANOVA decompõe-se a dispersão total de matriz em entre-grupo de dispersão matriz e dentro do grupo de dispersão matriz , de modo que . Em seguida, calcula a matriz . Sob a hipótese nula, essa matriz deve ser "pequena" (em torno de ); mas como quantificar quão "pequeno" é? MANOVA examina os autovalores desta matriz (todos são positivos). Novamente, sob a hipótese nula, esses valores próprios devem ser "pequenos" (em torno de $\mathbf T$ $\mathbf B$ $\mathbf W$ $\mathbf T = \mathbf B + \mathbf W$ $\mathbf W^{-1} \mathbf B$ $\mathbf{I}$ $\lambda_i$ $1$ ) Mas, para calcular um valor-p, precisamos de um número (chamado "estatística") para poder compará-lo com sua distribuição esperada sob o valor nulo. Existem várias maneiras de fazer isso: pegue a soma de todos os autovalores ; pegue o valor próprio máximo , etc. Em cada caso, esse número é comparado com a distribuição dessa quantidade esperada sob o nulo, resultando em um valor-p. $\sum \lambda_i$ $\max\{\lambda_i\}$

Escolhas diferentes da estatística de teste levam a valores de p ligeiramente diferentes, mas é importante perceber que, em cada caso, a mesma hipótese nula está sendo testada.

ameba diz Restabelecer Monica
fonte

Além disso, se você não corrigir vários testes, a abordagem de ANOVAs univariadas também produzirá inflação de erro do tipo I.

gung - Restabelece Monica

@ gung: Sim, isso também é verdade. No entanto, pode-se ser mais inteligente ao "combinar" do que apenas rejeitar o nulo assim que pelo menos uma das ANOVAs rejeitar o nulo. Meu argumento foi que, por mais inteligente que se tente "combinar", ainda se perde poder em comparação com o MANOVA (mesmo que se consiga manter o tamanho do teste sem aumentar a taxa de erro).

Ameba diz Reinstate Monica

Mas agora não é esse "poder" diretamente relacionado à noção de covariância? A moral é que, com uma (série de) teste univariado, testamos apenas o efeito marginal, que é SSdifference/SSerrorescalar. No MANOVA, o efeito multivariado é a SSCPerror^(-1)SSCPdifferencematriz (covariâncias totais e dentro dos grupos contabilizados). Porém, como existem vários autovalores nele que poderiam ser "combinados" não de uma maneira única em uma estatística de teste, existem várias hipóteses alternativas possíveis. Mais poder - mais complexidade teórica.

precisa saber é

@ttnphns, sim, tudo está correto, mas acho que não altera o fato de que a hipótese nula é o que eu escrevi (e é disso que se tratava). Qualquer que seja a estatística de teste usada (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling), eles estão tentando testar a mesma hipótese nula. Posso expandir minha resposta mais tarde para discutir isso em mais detalhes.

ameba diz Restabelecer Monica

@gung me pediu para gritar (não sei por que ... eu ensinei MANOVA há 7 anos e nunca a apliquei) - eu diria que a ameba está certa ao dizer que é uma negação completa do nulo , que é um hiperespaço dimensional no espaço dimensional dos parâmetros (se é a dimensão que ninguém se incomodou em definir até agora) . E é a opção 1 dada pelo OP. A opção 2 é significativamente mais difícil de testar.

H_{1}

$H_1$

H_{0} : μ_{group 1} = \dots = μ_{group k}

$H_0: \mu_{\mbox{group }1} = \ldots = \mu_{\mbox{group }k}$

p

$p$

k p

$kp$

p

$p$

StasK

É o primeiro.

No entanto, do jeito que faz, não é literalmente comparar as médias de cada uma das variáveis originais. Em vez disso, as variáveis de resposta são transformadas linearmente de maneira muito semelhante à análise dos componentes principais . (Existe uma excelente discussão sobre o PCA aqui: Entendendo a análise de componentes principais, vetores próprios e valores próprios .) A diferença é que o PCA orienta seus eixos para se alinhar com as direções de variação máxima, enquanto o MANOVA gira seus eixos nas direções que maximizar a separação de seus grupos.

Para deixar claro, porém, nenhum dos testes associados a uma MANOVA está testando todas as médias uma após a outra em um sentido direto, seja com as médias no espaço original ou no espaço transformado. Existem várias estatísticas de teste diferentes, cada uma trabalhando de uma maneira ligeiramente diferente, mas elas tendem a operar sobre os valores próprios da decomposição que transforma o espaço. Mas no que diz respeito à natureza da hipótese nula, é que todos os meios de todos os grupos são os mesmos em cada variável de resposta, não que eles possam diferir em algumas variáveis, mas são iguais em pelo menos uma.

Repor a Monica
fonte

Ooh ... Então, o Manova faz uma análise discriminante linear (para maximizar a distância entre a média dos grupos) e, em seguida, executa uma anova padrão usando o primeiro eixo como variável de resposta? Portanto, é "os meios - em termos de PC1 - de todos os grupos são os mesmos". Isso está certo?

H o

$Ho$

Remi.b 13/01

Existem vários testes possíveis. Testar apenas o 1º eixo está essencialmente usando a maior raiz de Roy como teste. Este será frequentemente o teste mais poderoso, mas também é mais limitado. Acho que há uma discussão em andamento sobre qual teste é 'melhor'.

gung - Restabelece Monica

Acho que usamos MANOVA em vez de várias ANOVAs para evitar vários problemas de teste. Mas se, ao fazer uma MANOVA, apenas fizermos uma ANOVA no PC1 de um LDR , ainda teremos um problema de teste múltiplo a considerar ao olhar para o Pvalue. Isto está certo? (Esperança de que faz mais sentido eu deletei meu comentário claro anterior.)

Remi.b

Esse é um ponto perspicaz, mas há dois problemas: 1) os eixos agora são ortogonais e podem mudar os problemas com vários testes; 2) as distribuições amostrais das estatísticas do teste MANOVA levam em consideração os múltiplos eixos.

gung - Restabelece Monica

@ Remi.b: Estas são boas perguntas, mas para deixar claro: MANOVA não é equivalente a uma ANOVA no primeiro eixo discriminante da LDA! Veja aqui a relação entre MANOVA e LDA: Como a MANOVA está relacionada à LDA?

ameba diz Restabelecer Monica