Eu tenho duas variáveis categóricas / nominais. Cada um deles pode ter apenas dois valores distintos (então, eu tenho 4 combinações no total).
Cada combinação de valores vem com um conjunto de valores numéricos. Então, eu tenho 4 conjuntos de números. Para torná-lo mais concreto, digamos que eu tenho male / female
e young / old
como variáveis nominais e que eu tenho weight
como "saída" numérica dependente.
Eu sei que a transição de male
para female
muda o peso médio e essas mudanças são estatisticamente significativas. Então, eu posso calcular um gender
fator. O mesmo é aplicável à age
variável. Sei que a transição de young
para old
altera o peso médio e posso calcular o age
fator correspondente .
Agora, o que realmente quero ver se os dados provam que a transição de mulheres jovens para homens idosos é mais uma combinação de fatores de gênero e idade. Em outras palavras, quero saber se os dados provam que existem "efeitos 2D" ou, em outras palavras, que efeitos de idade e gênero não são independentes. Por exemplo, pode ser que envelhecer para homens aumente o peso pelo fator 1,3 e para mulheres o fator correspondente seja 1,1.
Claro que posso calcular os dois fatores mencionados (fator idade para homens e fator idade para mulheres) e eles são diferentes. Mas quero calcular a significância estatística dessa diferença. Quão real é essa diferença.
Eu gostaria de fazer um teste não paramétrico, se possível. É possível fazer o que eu quero, misturando os quatro conjuntos, embaralhando-os, re-dividindo e calculando alguma coisa.
Respostas:
Existem testes não paramétricos para interação. Grosso modo, você substitui os pesos observados por suas classificações e trata o conjunto de dados resultante como ANOVA heterocedástica. Veja, por exemplo, "Métodos não paramétricos em projetos fatoriais" de Brunner e Puri (2001).
No entanto, o tipo de interação não paramétrica em que você está interessado não pode ser mostrado nessa generalidade. Você disse:
O último é impossível. A interação não paramétrica deve envolver uma mudança de sinal, ou seja, envelhecer aumenta o peso dos machos, mas diminui o peso das fêmeas. Essa mudança de sinal permanece mesmo se você transformar monotonicamente os pesos. Mas você pode escolher uma transformação monótona nos dados que mapeiam o aumento de peso pelo fator 1.1 tão perto quanto você deseja 1.3. Obviamente, você nunca mostrará uma diferença significativa se puder ser tão próxima quanto você desejar.
Se você realmente está interessado em interações sem alteração de sinal, deve seguir a análise paramétrica usual. Lá, transformações monótonas que "engolem a diferença" não são permitidas. Claro, isso é novamente algo a ser lembrado ao modelar e interpretar suas estatísticas.
fonte
Se você acredita que os efeitos de idade e sexo são mais do que efeitos individuais, considere o modeloO coeficiente captura o tamanho do efeito "2D" da idade e do sexo. Você pode verificar a estatística t de para ter uma idéia aproximada de se a observada em seu modelo é significativamente diferente de .weighti=α⋅agei+β⋅genderi+γ⋅(genderi⋅agei). γ γ γ γ=0
Aqui está um exemplo gráfico bastante aproximado para mostrar o que esse termo multiplicativo adicional faz.genderi⋅agei
Na do modelo , tentamos essencialmente ajustar um hiperplano simples aos dadosresponse=x1+x2
Esse modelo é linear nas covariáveis, daí a forma linear que você vê no gráfico acima.
Por outro lado, a do modelo não é linear em e e, portanto, permite algum nível de curvaturaresponse=x1+x2+x1⋅x2 x1 x2
Falhar em rejeitar a hipótese de que é como falhar em rejeitar a existência de alguma curvatura dessa forma no modelo.γ=0
Em termos de um teste não paramétrico, você pode fazer algo como sugeriu, obtendo erros padrão de autoinicialização para . Isso significa que, várias vezes você: 1) coleta seus dados com substituição, 2) recalcula o modo linear, 3) obtém uma estimativa . Depois de ter muitas estimativas de , é possível usar o quantil para configurar um intervalo de confiança não paramétrico de para . Para saber mais, google "erros padrão de autoinicialização".γ γ^ γ^ 50±p% 2p% γ
fonte
Como outros observaram, isso pode ser modelado linearmente com uma interação. Você está interagindo com dois manequins, e não há nada de não linear nisso. Dado o modelo: O efeito marginal 'gender' é a derivada parcial:
Veja como se sexo e idade só podem assumir valores de 0 ou 1, estamos basicamente apenas observando a diferença de médias para quatro grupos diferentes? Ou seja, temos apenas as quatro combinações diferentes que podemos conectar nas equações acima: (1) e , (2) e , (3) e e (4) e . Portanto, seu exemplo específico é equivalente a uma comparação entre quatro médias de grupos.gender=0 age=0 gender=1 age=1 gender=0 age=1 gender=1 age=0
Também pode ser útil ver esta discussão para entender como o acima é equivalente à ANOVA com duas variáveis nominais interagidas. Como outra maneira de reafirmar o fato de que, com seu exemplo específico, (novamente, porque existem apenas quatro combinações possíveis de idade e sexo), também poderíamos especificar um modelo como o seguinte, sem um termo explícito de interação:
Onde é omitido como sua categoria de referência e, por exemplo, o coeficiente será uma diferença nas médias entre e . Onde a interceptação também será igual à média de em (novamente, a categoria de referência).old.female b1 old.female young.male α wt old.female
Experimente com seus próprios dados. Com um modelo linear com uma interação, uma ANOVA com uma interação ou usando manequins para cada um dos grupos sem interação, você obterá os mesmos resultados. Muito legal, né? Um livro de estatística pode discutir cada um desses métodos em diferentes capítulos mas todos os caminhos levam a Roma. Realmente, ver como isso funciona com seus próprios dados é uma das melhores maneiras de aprender.…
Os exemplos acima são, portanto, uma maneira excessivamente complicada de chegar a essa conclusão (que estamos realmente apenas comparando quatro médias de grupo), mas para aprender sobre como as interações funcionam, acho que esse é um exercício útil. Existem outros posts muito bons no CV sobre a interação de uma variável contínua com uma variável nominal ou a interação de duas variáveis contínuas. Embora sua pergunta tenha sido editada para especificar testes não paramétricos, acho útil pensar no seu problema a partir de uma abordagem mais convencional (isto é, paramétrica), porque a maioria das abordagens não paramétricas ao teste de hipóteses tem a mesma lógica, mas geralmente com menos suposições sobre distribuições específicas.
Mas a pergunta pedia especificamente uma abordagem não paramétrica, que poderia ser mais apropriada, por exemplo, se não quiséssemos fazer certas suposições sobre a normalidade do . Um teste não paramétrico apropriado seria o teste de Dunn . Esse teste é semelhante ao teste de soma-rank de Wilcoxon-Mann-Whitney, mas com mais de duas categorias.wt
Outros testes de permutação também podem ser apropriados se você tiver uma diferença específica nos meios pelos quais está testando, por exemplo, vs. . Se vai ou não usar R, o pacote 'moeda' documenation fornece um resumo bem de diferentes testes não paramétricos, e em que circunstâncias estes testes pode ser apropriada.old.men young.women
Um breve resumo sobre interações "significativas"
Às vezes, você verá declarações como "a interação entre e foi estatisticamente significativa". Tais declarações não são necessariamente erradas, mas são enganosas. Geralmente, quando um autor escreve isso, eles estão dizendo que o coeficiente no termo de interação foi estatisticamente significativo. Mas este é um efeito incondicional em um modelo condicional . Um relatório mais preciso diria que " foi estatisticamente significativo em relação a 'alguns valores' de ", onde todas as outras covariáveis foram mantidas constantes em algum valor razoável, como média, mediana ou modo.x 2 x 1 x 2x1 x2 x1 x2 Mas, mais uma vez, se tivermos apenas duas covariáveis que só podem aceitar valores de 0 ou 1, isso significa que estamos olhando essencialmente para quatro médias de grupos.
Exemplo Trabalhado
Vamos comparar os resultados do modelo de interação com os resultados do teste de Dunn. Primeiro, vamos gerar alguns dados em que (a) homens pesam mais que mulheres, (b) homens mais jovens pesam menos que homens mais velhos e (c) não há diferença entre mulheres mais jovens e mais velhas.
Estime o modelo de interação e obtenha a previsão de partir do efeito marginal (com pacote de 'efeitos'). Veja aqui por que não queremos interpretar os efeitos incondicionais em um modelo como este. Em vez disso, queremos interpretar efeitos marginais. O modelo faz um trabalho decente ao detectar as diferenças que impusemos quando geramos nossos dados de exemplo.wt
Precisa calcular um erro padrão ou intervalo de confiança para o seu efeito marginal? O pacote de 'efeitos' mencionado acima pode fazer isso por você, mas melhor ainda, Aiken e West (1991) fornecem as fórmulas, mesmo para modelos de interação muito mais complicados. Suas tabelas são convenientemente impressas aqui , juntamente com ótimos comentários de Matt Golder.
Agora, para implementar o teste de Dunn.
O valor de p no resultado do teste qui-quadrado de Kruskal-Wallis sugere que pelo menos um de nossos grupos 'vem de uma população diferente'. Para as comparações de grupo por grupo, o número superior é a estatística do teste z de Dunn e o número inferior é um valor p, que foi ajustado para várias comparações. Como nossos dados de exemplo foram bastante artificiais, não surpreende que tenhamos tantos pequenos valores de p. Mas observe a comparação inferior direita entre mulheres mais jovens e mais velhas. O teste suporta corretamente a hipótese nula de que não há diferença entre esses dois grupos.
Portanto, o modelo de interação e o teste de Dunn nos levam a conclusões semelhantes. Em todos os exemplos dados acima, estamos de alguma forma comparando médias de grupos. E, embora certamente haja abordagens mais diretas para comparar médias de grupos, tentei ilustrar como comparar médias de grupos também pode ser entendido como uma interação ou "efeito 2D", com algumas especificações de modelo, especificamente com interações nominais. Eu acho que entender isso é útil para entender modelos mais complicados com efeitos de interação. Vou vincular a este artigo mais uma vez, apenas porque acho que deve ser uma leitura obrigatória para quem trabalha com interações (há uma razão pela qual este artigo foi citado mais de 3 mil vezes ).…
ATUALIZAÇÃO: Dadas outras respostas, essa resposta foi atualizada para contestar a idéia de que isso requer qualquer forma de modelagem não linear ou que - dado o exemplo específico do OP de duas covariáveis binárias, ou seja, quatro grupos -, que deve haver um assinar mudança para avaliar isso de forma não paramétrica. Se a idade fosse contínua, por exemplo, haveria outras maneiras de abordar esse problema, mas esse não foi o exemplo dado pelo OP.
fonte
Então você tem estas variáveis aleatórias:
E você tem estas funções de massa / densidade de probabilidade:
Você sabe que existe peso , idade e sexo tais que:a sw a s
Agora, você deseja descobrir se a idade e o sexo são independentes, pois estão relacionados de maneira conjunta / combinatória ao peso. Em outras palavras, você deseja encontrar o seguinte:
No entanto, você não conhece os verdadeiros PDFs conjuntos acima. Como você deseja limitar-se a métodos não paramétricos, sua tarefa agora é encontrar essas estimativas não paramétricas:
E então mostre que:
fonte
Isso seria verificar se há efeitos de interação . A modelagem linear seria capaz de verificar isso, mas não é paramétrico, então acho que outra ferramenta deve ser usada.
Como você está verificando seu
age
egender
efeito até agora?EDIT: esta resposta parece que iria ajudá-lo
fonte