Não transitividade da correlação: correlações entre sexo e tamanho do cérebro e entre tamanho do cérebro e QI, mas sem correlação entre gênero e QI

18

Encontrei uma explicação a seguir em um blog e gostaria de obter mais informações sobre a não transitividade da correlação:

Temos os seguintes fatos indiscutíveis:

  • Em média, há uma diferença no volume cerebral entre homens e mulheres
  • Existe uma correlação entre QI e tamanho do cérebro; a correlação é de 0,33 e, portanto, corresponde a 10% da variabilidade do QI

Destas premissas 1 e 2, parece resultar logicamente disso: as mulheres têm, em média, um QI mais baixo que os homens. Mas é uma falácia! Nas estatísticas, as correlações não são transitivas. A prova é que você só precisa observar os resultados dos testes de QI, e eles mostram que o QI de homens e mulheres não difere, em média.

Eu gostaria de entender um pouco mais essa não transitividade da correlação.

Se a correlação entre o QI e o tamanho do cérebro fosse de 0,9 (o que eu sei que não é (1)), deduzir que as mulheres têm, em média, um QI menor do que os homens ainda seria uma falácia?

Por favor, não estou aqui para falar sobre QI (e os limites do teste), sexismo, estereótipo de mulher, arrogância e assim por diante (2). Eu só quero entender o raciocínio lógico por trás da falácia.


(1) o que eu sei que não é: os neandertais tinham cérebros maiores que o homo sapiens, mas não eram mais inteligentes;

(2) Eu sou uma mulher e, no geral, não me considero, ou as outras mulheres, menos inteligentes que os homens, não me importo com o teste de QI, porque o que conta é o valor das pessoas e não se baseia no habilidades intelectuais.


A fonte original em francês:

Em um les faits indiscutables suivants:

  • você tem uma diferença de volume intermediária em homens e mulheres?
  • você é uma correlação entre QI e volume central; a correção é de 0,33 e corresponde a 10% da variabilidade

Dos prêmios 1 e 2, a menor quantidade de logotipos que: as mulheres são afetadas por um membro da QI infantil.

Mais c'est une erreur de raisonnement! Em estatística, as correções não são passivas. No caso anterior, o que derramar no líquido da rede, é suficiente considerar os resultados dos testes de QI e controlar o fluxo de QI dos homens e das mulheres nos diferentes países da Europa.

insira a descrição da imagem aqui

MagTun
fonte
5
Não entendo como essas afirmações têm alguma relação com a correlação (e referir-se a "transitividade" parece totalmente inapropriado nesse contexto). A conclusão, afinal, tem a ver com uma diferença média. Essa estatística (que é o primeiro momento) é totalmente independente da correlação (que é derivada do segundo momento). Mesmo quando a correlação é perfeita não se pode tirar nenhuma conclusão sobre a diferença de médias da segunda variável com base na diferença de médias da primeira variável. ±1
whuber
5
Pode-se mostrar (Langford, Schwertman e Owens (2001)) que a correlação positiva é transitiva se a soma das correlações ao quadrado for maior que 1: ρXY2+ρYX2>1ρXZ>0
CloseToC
2
@ whuber: Sim, mas esta não é uma questão sobre a relação entre as médias de X e Y (tamanho do cérebro e QI), é a questão sobre a relação entre as médias de Y em dois grupos diferentes ... Eu acho que é óbvio se a correlação entre o tamanho do cérebro e o QI é perfeita (ou seja, o QI é uma função linear do tamanho do cérebro) e se o tamanho médio do cérebro difere entre homens e mulheres, então o QI médio difere entre homens e mulheres.
ameba diz Restabelecer Monica
2
@Amoeba Obrigado por essa interpretação. A cotação começa a fazer sentido (finalmente!). Mas referir-se a isso como "transitividade da correlação" é tão obscuro que pode ser francamente enganador. (A frase existe no francês original, por isso não podemos culpar a tradução.)
whuber
3
@amoeba Isso é plausível. Mas acho que você está tendo que esticar um pouco as coisas para chegar lá! A citação não caracteriza a relação entre gênero e tamanho do cérebro como uma "correlação" - apenas como uma diferença nas médias entre os dois grupos (que não é uma medida padrão de correlação, aliás). Mas acho que devemos entender "correlação" em um sentido amplo como "falta de dependência" ou algo assim.
whuber

Respostas:

16

Sim, ainda seria uma falácia.

Aqui está uma figura muito simples, mostrando quatro situações diferentes. Em cada caso, pontos vermelhos representam mulheres, pontos azuis representam homens, o eixo horizontal representa o tamanho do cérebro e o eixo vertical representa o QI. Gerei todos os quatro conjuntos de dados de modo que:

  • sempre há a mesma diferença no tamanho médio do cérebro entre homens ( ) e mulheres ( 28 unidades são arbitrárias). Essas são médias populacionais, mas essa diferença é grande o suficiente para ser estatisticamente significativa com qualquer tamanho de amostra razoável;2228

  • sempre há diferença zero no QI médio entre homens e mulheres (ambos ) e também correlação zero entre gênero e QI;100

  • a força da correlação entre o tamanho do cérebro e o QI varia conforme mostrado na figura.

correlações

Na subparcela superior esquerda, a correlação dentro do sexo (calculada separadamente por homens e separadamente por mulheres e, em seguida, calculada a média) é , como em sua citação. Na subtrama superior direita, a correlação geral (entre homens e mulheres juntos) é de 0,3 . Observe que sua cotação não especifica a que o número de 0,33 se refere. Na subparcela inferior esquerda, a correlação dentro do sexo é de 0,9 , como no seu exemplo hipotético; na subtrama inferior direita, a correlação geral é de 0,9 .0.30.30.330.90.9

Portanto, você pode ter qualquer valor de correlação e não importa se é calculado globalmente ou dentro do grupo. Qualquer que seja o coeficiente de correlação, é muito possível que não haja correlação zero entre gênero e QI e diferença de gênero zero no QI médio.


Explorando a não transitividade

Vamos explorar todo o espaço de possibilidades, seguindo a abordagem sugerida por @kjetil. Suponha que você tenha três variáveis e (sem perda de generalidade) suponha que a correlação entre x 1 e x 2 seja a > 0 e a correlação entre x 2 e x 3 seja b > 0 . A questão é: qual é o valor positivo possível mínimo da correlação λ entre x 1 e x 3x1,x2,x3x1x2a>0x2x3b>0λx1x3? Às vezes tem que ser positivo ou sempre pode ser zero?

A matriz de correlação é e deve ter um determinante não negativo, ou seja, d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) 0 , o que significa que λ deve estar entre a b ±

R=(1aλa1bλb1)
detR=λ2+2abλ(a2+b21)0,
λSe ambas as raízes são positivas, o valor mínimo possível deλé igual à raiz menor (eλdeve ser positivo!). Se o zero estiver entre essas duas raízes,λpoderá ser zero.
ab±(1a2)(1b2).
λλλ

Podemos resolver este numericamente e traçar o mínimo possível valor positivo de para diferentes um e b :λab

Explorando a não transitividade

Informalmente, podemos dizer que as correlações seria transitivo se dado que e b > 0 , pode-se concluir que λ > 0 . Vemos que para a maioria dos valores de um e b , λ pode ser zero, o que significa que as correlações são não-transitiva. No entanto, para alguns valores suficientemente elevados de um e b , correlação λ tem que ser positivo , o que significa que há "um certo grau de transitivity" depois de tudo, mas restringida apenas correlações muito altas. Note-se que ambas as correlações um e ba>0b>0λ>0abλabλ ab tem que ser alto.

Podemos elaborar uma condição precisa para essa "transitividade": como mencionado acima, a raiz menor deve ser positiva, ou seja, , o que é equivalente auma2+b2>1. Esta é uma equação de um círculo! E, de fato, se você olhar para a figura acima, notará que a região azul forma um quarto de círculo.ab(1a2)(1b2)>0a2+b2>1

No seu exemplo específico, a correlação entre sexo e tamanho do cérebro é bastante moderada (talvez ) e a correlação entre tamanho do cérebro e QI é b = 0,33 , o que está firmemente dentro da região azul ( a 2 + b 2 < 1 ), o que significa que λ pode ser positivo, negativo ou zero.a=0.5b=0.33a2+b2<1λ


Figura relevante do estudo original

Você queria evitar discutir gênero e cérebro, mas não posso deixar de apontar que, olhando para a figura completa do artigo original ( Gur et al. 1999 ), pode-se ver que, embora não haja diferença de gênero no escore de QI verbal, há uma diferença óbvia e significativa no escore de QI espacial! Compare as subparcelas D e F.

Gur et al.

ameba diz Restabelecer Monica
fonte
2
Eu amo aqueles enredos que você gerou. Os do papel, não tanto ...
shadowtalker
1
@AleksandrBlekh: Para dizer a verdade, não tenho certeza. "Mapa de calor"? "Gráfico de contorno", mas colorido e sem contornos?
Ameba diz Reinstate Monica
2
|λ|λ
1
xyyzxzab0λ0
1
Obrigado ameba por esta resposta longa e detalhada (e até adicionada de forma extra, muito bem-vinda pelo caminho)! Isso torna as coisas bem claras! O conceito é tão difícil de entender para o meu cérebro estatisticamente destreinado e você sombreava a luz do problema! Muito obrigado pelo tempo que levou para postar sua resposta!
precisa saber é
8

x1=IQ,x2=genderx3

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
ρ2λ+12ρ=0.9λ0.62

Atualizar:

p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20as informações sobre a diferença média de QI estão erradas! Isso seria verdade se o gênero fosse uma variável contínua, o que obviamente não é. Observe que esse fato está relacionado ao fato de que, para a distribuição binomial, a variação é uma função da média (como deve ser, pois existe apenas um parâmetro livre para variar). O que fizemos acima é realmente estendendo isso para covariância / correlação.

ρ=0.33λ0.7822λ=0

kjetil b halvorsen
fonte
1
cor(x1,x2)0.62E(x1)E(x2)
5
+1 - Mas acho o conceito da correlação entre QI de homens e mulheres um tanto confuso, pois você nunca poderia calcular esse valor.
Andy W
1
Qual é a correlação entre QI de homens e mulheres?
Ameba diz Reinstate Monica
sim, está certo @amoeba! Talvez eu não tenha usado as palavras corretas para expressar minha confusão (é difícil porque não estou acostumado a estatísticas), mas as variáveis ​​são de fato sexo, QI e tamanho do cérebro.
precisa saber é
7

É uma situação em que gosto de usar diagramas de caminhos para ilustrar efeitos diretos e indiretos , e como esses dois afetam as correlações gerais.

Pela descrição original, temos uma matriz de correlação abaixo. O tamanho do cérebro tem uma correlação de 0,3 com o QI, o feminino e o QI têm uma correlação 0 entre si. Eu preencheu a correlação negativa entre o tamanho feminino e o cérebro como -0,3 (se eu tivesse que adivinhar que é muito menor que isso, mas isso servirá para fins ilustrativos).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Se ajustarmos um modelo de regressão em que o QI é uma função do tamanho do cérebro e do sexo feminino, podemos ilustrar isso em termos de um diagrama de caminho. Preenchi os coeficientes de regressão parcial nas setas, e o nó B significa tamanho do cérebro e o nó F significa feminino.

insira a descrição da imagem aqui

Agora, quão louco é isso - ao controlar o tamanho do cérebro, dadas essas correlações, as mulheres têm uma relação positiva com o QI. Por que isso, quando a correlação marginal é zero? Por regras com diagramas de caminho lineares ( Wright, 1934 ), podemos decompor a correlação marginal em função do efeito direto ao controlar o tamanho do cérebro e o efeito indireto:

TotalF,IQ=DirectF,IQ+IndirectF,B,IQ

TotalF,IQ=Cor(F,IQ)

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30.33

Como o efeito total é zero, sabemos que o efeito direto deve ser simplesmente o sinal oposto exato e o tamanho do efeito indireto ; portanto, o efeito direto é igual a 0,099 neste exemplo. Agora, aqui temos uma situação ao avaliar o QI esperado das mulheres, obtemos duas respostas diferentes, embora provavelmente não seja o que você esperava inicialmente ao especificar a pergunta. Ao simplesmente avaliar o QI marginal esperado de mulheres versus homens, a diferença é zero como você a definiu (por ter uma correlação zero). Ao avaliar a diferença esperada condicional ao tamanho do cérebro, as mulheres têm um QI maior que os homens.

Você pode inserir neste exemplo correlações maiores entre tamanho do cérebro e QI (ou correlações menores entre tamanho feminino e cerebral), considerando os limites que o kjetil mostra em sua resposta. Aumentar o primeiro aumenta ainda mais a disparidade entre o QI condicional de mulheres e homens em favor das mulheres, diminuindo o segundo diminui as diferenças.

Andy W
fonte
Se você observar a figura fornecida, ela mostra uma correlação positiva (e mais forte que a dos homens) do volume cerebral das mulheres com o QI.
Alecos Papadopoulos
1
@ Andy W Estou totalmente envergonhado de fazer essa pergunta boba, mas qual software você usou para desenhar o gráfico de nós?
Mugen
1
Foi um trabalho rápido no inkscape @mugen. Levando mais tempo, acho que as que eu faço usando Látex e Tikz são melhores.
Andy W
+1 Você poderia me indicar uma teoria por trás de sua segunda fórmula?
Aleksandr Blekh
2
@AleksandrBlekh - o artigo de Wright que cito é a fonte seminal. Judea Pearl faz comentários mais extensos em seu livro Causality , embora haja tratamentos mais simples. (Para modelos lineares as decomposições muitas vezes são dadas tratamento superficial nos livros de modelagem de equações estruturais.)
Andy W
3

vq12

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Observe que, embora o texto citado fale sobre "correlação entre volume cerebral e QI" em geral, a imagem fornecida faz uma distinção com as duas linhas de tendência (ou seja, mostra a correlação para os dois subgrupos separadamente). Portanto, nós os consideramos separadamente (que é o caminho correto a seguir).

Então

ρ(v1,q1)>0Cov(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

e

ρ(v2,q2)>0Cov(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

E(q1)>E(q2)

(4)E(q1)=E(q2)=q¯

Então deve ser o caso que

(5)(2),(4)E(v1q1)q¯>E(v1)

e essa

(6)(3),(4)E(v2q2)βq¯>E(v1)

(5)(6)
(1)

(1)E(q1)E(q2)(1)

Alecos Papadopoulos
fonte
2
Apesar de todos os cálculos mostrados aqui, ainda não vejo como a correlação revela alguma coisa (ou impõe quaisquer restrições) relativa às relações entre valores médios .
whuber
@whuber A resposta toda é sobre mostrar que não. As últimas frases dizem exatamente isso. Vamos adicionar mais um para esse efeito.
Alecos Papadopoulos
Mas isso é absolutamente básico: não é necessário uma página inteira de equações para mostrá-lo! Basta observar que os coeficientes de correlação são QED invariantes à localização . Estou interpretando mal a pergunta?
whuber
1
@whuber Com todo o respeito e sem ofensa para ninguém, mas temo que você esteja "interpretando mal" o nível de conhecimento do OP. Caso contrário, a pergunta não teria sido publicada.
Alecos Papadopoulos
4
Gostaria de encorajá-lo, então, a refletir sobre se e como qualquer resposta que depende muito de equações matemáticas é apropriada para abordar pôsteres que parecem estar pedindo exposições elementares de conceitos básicos. Essa é uma questão sutil, porque às vezes essa é exatamente a abordagem correta. Além disso, o grau em que se usa matemática - e como se expõe as idéias matemáticas - pode ser uma questão de gosto. Mas IMHO esse tipo de resposta é eficaz apenas quando a matemática é clara e consistentemente focada em uma idéia essencial.
whuber