Como testar um efeito de interação com um teste não paramétrico (por exemplo, um teste de permutação)?

10

Eu tenho duas variáveis ​​categóricas / nominais. Cada um deles pode ter apenas dois valores distintos (então, eu tenho 4 combinações no total).

Cada combinação de valores vem com um conjunto de valores numéricos. Então, eu tenho 4 conjuntos de números. Para torná-lo mais concreto, digamos que eu tenho male / femalee young / oldcomo variáveis ​​nominais e que eu tenho weightcomo "saída" numérica dependente.

Eu sei que a transição de malepara femalemuda o peso médio e essas mudanças são estatisticamente significativas. Então, eu posso calcular um genderfator. O mesmo é aplicável à agevariável. Sei que a transição de youngpara oldaltera o peso médio e posso calcular o agefator correspondente .

Agora, o que realmente quero ver se os dados provam que a transição de mulheres jovens para homens idosos é mais uma combinação de fatores de gênero e idade. Em outras palavras, quero saber se os dados provam que existem "efeitos 2D" ou, em outras palavras, que efeitos de idade e gênero não são independentes. Por exemplo, pode ser que envelhecer para homens aumente o peso pelo fator 1,3 e para mulheres o fator correspondente seja 1,1.

Claro que posso calcular os dois fatores mencionados (fator idade para homens e fator idade para mulheres) e eles são diferentes. Mas quero calcular a significância estatística dessa diferença. Quão real é essa diferença.

Eu gostaria de fazer um teste não paramétrico, se possível. É possível fazer o que eu quero, misturando os quatro conjuntos, embaralhando-os, re-dividindo e calculando alguma coisa.

romano
fonte
2
Uma dificuldade em lidar com a interação de forma não paramétrica é que uma transformação monotônica da resposta pode remover a interação que estava presente, induzir a interação onde estava ausente ou mudar a direção da interação. Isso sugere que abordagens baseadas em classificação, por exemplo, podem não fazer o que você espera que elas façam.
Glen_b -Reinstala Monica
Com testes de permutação nas variáveis ​​originais, você não tem esse problema, mas acontece que não há testes exatos para interação. Você pode obter alguns testes aproximados.
Glen_b -Reinstate Monica

Respostas:

5

Existem testes não paramétricos para interação. Grosso modo, você substitui os pesos observados por suas classificações e trata o conjunto de dados resultante como ANOVA heterocedástica. Veja, por exemplo, "Métodos não paramétricos em projetos fatoriais" de Brunner e Puri (2001).

No entanto, o tipo de interação não paramétrica em que você está interessado não pode ser mostrado nessa generalidade. Você disse:

Em outras palavras, quero saber se os dados provam que existem "efeitos 2D" ou, em outras palavras, que efeitos de idade e gênero não são independentes. Por exemplo, pode ser que envelhecer para homens aumente o peso pelo fator 1,3 e para mulheres o fator correspondente seja 1,1.

O último é impossível. A interação não paramétrica deve envolver uma mudança de sinal, ou seja, envelhecer aumenta o peso dos machos, mas diminui o peso das fêmeas. Essa mudança de sinal permanece mesmo se você transformar monotonicamente os pesos. Mas você pode escolher uma transformação monótona nos dados que mapeiam o aumento de peso pelo fator 1.1 tão perto quanto você deseja 1.3. Obviamente, você nunca mostrará uma diferença significativa se puder ser tão próxima quanto você desejar.

Se você realmente está interessado em interações sem alteração de sinal, deve seguir a análise paramétrica usual. Lá, transformações monótonas que "engolem a diferença" não são permitidas. Claro, isso é novamente algo a ser lembrado ao modelar e interpretar suas estatísticas.

Horst Grünbusch
fonte
1

Se você acredita que os efeitos de idade e sexo são mais do que efeitos individuais, considere o modeloO coeficiente captura o tamanho do efeito "2D" da idade e do sexo. Você pode verificar a estatística t de para ter uma idéia aproximada de se a observada em seu modelo é significativamente diferente de .weighti=αagei+βgenderi+γ(genderiagei).γγγγ=0

Aqui está um exemplo gráfico bastante aproximado para mostrar o que esse termo multiplicativo adicional faz.genderiagei

Na do modelo , tentamos essencialmente ajustar um hiperplano simples aos dadosresponse=x1+x2

insira a descrição da imagem aqui

Esse modelo é linear nas covariáveis, daí a forma linear que você vê no gráfico acima.

Por outro lado, a do modelo não é linear em e e, portanto, permite algum nível de curvaturaresponse=x1+x2+x1x2x1x2

insira a descrição da imagem aqui

Falhar em rejeitar a hipótese de que é como falhar em rejeitar a existência de alguma curvatura dessa forma no modelo.γ=0

Em termos de um teste não paramétrico, você pode fazer algo como sugeriu, obtendo erros padrão de autoinicialização para . Isso significa que, várias vezes você: 1) coleta seus dados com substituição, 2) recalcula o modo linear, 3) obtém uma estimativa . Depois de ter muitas estimativas de , é possível usar o quantil para configurar um intervalo de confiança não paramétrico de para . Para saber mais, google "erros padrão de autoinicialização".γγ^γ^50±p%2p%γ

Mustafa S Eisa
fonte
Como isso pode ser não linear se x1 e x2 podem apenas assumir valores de 0 ou 1? Como a gama no seu exemplo explicaria qualquer forma de curvatura?
5ayat 23/05
Não importa qual é o domínio, ele ainda não é linear, porque a função não pode ser escrita como uma combinação linear de seus argumentos (por exemplo, ). Para seu segundo ponto, observe que eu disse cuidadosamente "um exemplo gráfico muito rude". Este é um análogo contínuo do caso binário. αR2:x1+x2+x1x2=i=12αixi
Mustafa S Eisa
Acrescentarei, no entanto, que quando o domínio é binário (que é como os vértices do cubo 2D), você pode tratar essa função linearmente. Mas a forma funcional é estritamente não linear.
Mustafa S Eisa
@MustafaMEisa, nunca vi um termo de interação em um modelo linear explicado em termos de "os vértices de um cubo 2D". Seria informativo se você pudesse elaborar.
5ayat 27/05
@ HorstGrünbusch, também estou curioso quanto ao seu comentário sobre esta resposta, pois você já fez um comentário útil sobre a minha resposta.
5ayat 27/05
1

Como outros observaram, isso pode ser modelado linearmente com uma interação. Você está interagindo com dois manequins, e não há nada de não linear nisso. Dado o modelo: O efeito marginal 'gender' é a derivada parcial:

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

Veja como se sexo e idade só podem assumir valores de 0 ou 1, estamos basicamente apenas observando a diferença de médias para quatro grupos diferentes? Ou seja, temos apenas as quatro combinações diferentes que podemos conectar nas equações acima: (1) e , (2) e , (3) e e (4) e . Portanto, seu exemplo específico é equivalente a uma comparação entre quatro médias de grupos.gender=0age=0gender=1age=1gender=0age=1gender=1age=0

Também pode ser útil ver esta discussão para entender como o acima é equivalente à ANOVA com duas variáveis ​​nominais interagidas. Como outra maneira de reafirmar o fato de que, com seu exemplo específico, (novamente, porque existem apenas quatro combinações possíveis de idade e sexo), também poderíamos especificar um modelo como o seguinte, sem um termo explícito de interação:

wt=α+b1young.male+b2old.male+b3young.female+ϵ

Onde é omitido como sua categoria de referência e, por exemplo, o coeficiente será uma diferença nas médias entre e . Onde a interceptação também será igual à média de em (novamente, a categoria de referência).old.femaleb1old.femaleyoung.maleαwtold.female

Experimente com seus próprios dados. Com um modelo linear com uma interação, uma ANOVA com uma interação ou usando manequins para cada um dos grupos sem interação, você obterá os mesmos resultados. Muito legal, né? Um livro de estatística pode discutir cada um desses métodos em diferentes capítulos mas todos os caminhos levam a Roma. Realmente, ver como isso funciona com seus próprios dados é uma das melhores maneiras de aprender.

Os exemplos acima são, portanto, uma maneira excessivamente complicada de chegar a essa conclusão (que estamos realmente apenas comparando quatro médias de grupo), mas para aprender sobre como as interações funcionam, acho que esse é um exercício útil. Existem outros posts muito bons no CV sobre a interação de uma variável contínua com uma variável nominal ou a interação de duas variáveis ​​contínuas. Embora sua pergunta tenha sido editada para especificar testes não paramétricos, acho útil pensar no seu problema a partir de uma abordagem mais convencional (isto é, paramétrica), porque a maioria das abordagens não paramétricas ao teste de hipóteses tem a mesma lógica, mas geralmente com menos suposições sobre distribuições específicas.

Mas a pergunta pedia especificamente uma abordagem não paramétrica, que poderia ser mais apropriada, por exemplo, se não quiséssemos fazer certas suposições sobre a normalidade do . Um teste não paramétrico apropriado seria o teste de Dunn . Esse teste é semelhante ao teste de soma-rank de Wilcoxon-Mann-Whitney, mas com mais de duas categorias.wt

Outros testes de permutação também podem ser apropriados se você tiver uma diferença específica nos meios pelos quais está testando, por exemplo, vs. . Se vai ou não usar R, o pacote 'moeda' documenation fornece um resumo bem de diferentes testes não paramétricos, e em que circunstâncias estes testes pode ser apropriada. old.menyoung.women

Um breve resumo sobre interações "significativas"

Às vezes, você verá declarações como "a interação entre e foi estatisticamente significativa". Tais declarações não são necessariamente erradas, mas são enganosas. Geralmente, quando um autor escreve isso, eles estão dizendo que o coeficiente no termo de interação foi estatisticamente significativo. Mas este é um efeito incondicional em um modelo condicional . Um relatório mais preciso diria que " foi estatisticamente significativo em relação a 'alguns valores' de ", onde todas as outras covariáveis ​​foram mantidas constantes em algum valor razoável, como média, mediana ou modo.x 2 x 1 x 2x1x2x1x2Mas, mais uma vez, se tivermos apenas duas covariáveis ​​que só podem aceitar valores de 0 ou 1, isso significa que estamos olhando essencialmente para quatro médias de grupos.

Exemplo Trabalhado

Vamos comparar os resultados do modelo de interação com os resultados do teste de Dunn. Primeiro, vamos gerar alguns dados em que (a) homens pesam mais que mulheres, (b) homens mais jovens pesam menos que homens mais velhos e (c) não há diferença entre mulheres mais jovens e mais velhas.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

Estime o modelo de interação e obtenha a previsão de partir do efeito marginal (com pacote de 'efeitos'). Veja aqui por que não queremos interpretar os efeitos incondicionais em um modelo como este. Em vez disso, queremos interpretar efeitos marginais. O modelo faz um trabalho decente ao detectar as diferenças que impusemos quando geramos nossos dados de exemplo.wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

Precisa calcular um erro padrão ou intervalo de confiança para o seu efeito marginal? O pacote de 'efeitos' mencionado acima pode fazer isso por você, mas melhor ainda, Aiken e West (1991) fornecem as fórmulas, mesmo para modelos de interação muito mais complicados. Suas tabelas são convenientemente impressas aqui , juntamente com ótimos comentários de Matt Golder.

Agora, para implementar o teste de Dunn.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

O valor de p no resultado do teste qui-quadrado de Kruskal-Wallis sugere que pelo menos um de nossos grupos 'vem de uma população diferente'. Para as comparações de grupo por grupo, o número superior é a estatística do teste z de Dunn e o número inferior é um valor p, que foi ajustado para várias comparações. Como nossos dados de exemplo foram bastante artificiais, não surpreende que tenhamos tantos pequenos valores de p. Mas observe a comparação inferior direita entre mulheres mais jovens e mais velhas. O teste suporta corretamente a hipótese nula de que não há diferença entre esses dois grupos.

Portanto, o modelo de interação e o teste de Dunn nos levam a conclusões semelhantes. Em todos os exemplos dados acima, estamos de alguma forma comparando médias de grupos. E, embora certamente haja abordagens mais diretas para comparar médias de grupos, tentei ilustrar como comparar médias de grupos também pode ser entendido como uma interação ou "efeito 2D", com algumas especificações de modelo, especificamente com interações nominais. Eu acho que entender isso é útil para entender modelos mais complicados com efeitos de interação. Vou vincular a este artigo mais uma vez, apenas porque acho que deve ser uma leitura obrigatória para quem trabalha com interações (há uma razão pela qual este artigo foi citado mais de 3 mil vezes ).

ATUALIZAÇÃO: Dadas outras respostas, essa resposta foi atualizada para contestar a idéia de que isso requer qualquer forma de modelagem não linear ou que - dado o exemplo específico do OP de duas covariáveis ​​binárias, ou seja, quatro grupos -, que deve haver um assinar mudança para avaliar isso de forma não paramétrica. Se a idade fosse contínua, por exemplo, haveria outras maneiras de abordar esse problema, mas esse não foi o exemplo dado pelo OP.

5ayat
fonte
Você não usa a estrutura de dois fatores cruzados. Você apenas compara quatro grupos. O teste de Dunn não tem nada a ver com interação.
Horst Grünbusch
Concordado, o teste de Dunn não é sobre interação. No entanto, a pergunta é específica sobre uma interação entre duas variáveis ​​binárias. Minha resposta demonstra como isso é equivalente à comparação dos quatro grupos. Se os termos de interação forem novos no OP, espero que seja uma ilustração útil.
5ayat
1

Então você tem estas variáveis ​​aleatórias:

  • AN
  • S{male,female}
  • W]0,[

E você tem estas funções de massa / densidade de probabilidade:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • W , A , SfW,A,S - densidade de conjunta de RV .W,A,S

Você sabe que existe peso , idade e sexo tais que:a swas

  • fW,A(w,a)fW(w) , portanto, o peso não é independente da idade.
  • fW,S(w,s)fW(w) , portanto, o peso não é independente do sexo.

Agora, você deseja descobrir se a idade e o sexo são independentes, pois estão relacionados de maneira conjunta / combinatória ao peso. Em outras palavras, você deseja encontrar o seguinte:

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

No entanto, você não conhece os verdadeiros PDFs conjuntos acima. Como você deseja limitar-se a métodos não paramétricos, sua tarefa agora é encontrar essas estimativas não paramétricas:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

E então mostre que:

  • Suas estimativas de densidade são precisas o suficiente.
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)
homem das cavernas
fonte
0

Isso seria verificar se há efeitos de interação . A modelagem linear seria capaz de verificar isso, mas não é paramétrico, então acho que outra ferramenta deve ser usada.

Como você está verificando seu agee genderefeito até agora?

EDIT: esta resposta parece que iria ajudá-lo

Riff
fonte