Encontrei uma explicação a seguir em um blog e gostaria de obter mais informações sobre a não transitividade da correlação:
Temos os seguintes fatos indiscutíveis:
- Em média, há uma diferença no volume cerebral entre homens e mulheres
- Existe uma correlação entre QI e tamanho do cérebro; a correlação é de 0,33 e, portanto, corresponde a 10% da variabilidade do QI
Destas premissas 1 e 2, parece resultar logicamente disso: as mulheres têm, em média, um QI mais baixo que os homens. Mas é uma falácia! Nas estatísticas, as correlações não são transitivas. A prova é que você só precisa observar os resultados dos testes de QI, e eles mostram que o QI de homens e mulheres não difere, em média.
Eu gostaria de entender um pouco mais essa não transitividade da correlação.
Se a correlação entre o QI e o tamanho do cérebro fosse de 0,9 (o que eu sei que não é (1)), deduzir que as mulheres têm, em média, um QI menor do que os homens ainda seria uma falácia?
Por favor, não estou aqui para falar sobre QI (e os limites do teste), sexismo, estereótipo de mulher, arrogância e assim por diante (2). Eu só quero entender o raciocínio lógico por trás da falácia.
(1) o que eu sei que não é: os neandertais tinham cérebros maiores que o homo sapiens, mas não eram mais inteligentes;
(2) Eu sou uma mulher e, no geral, não me considero, ou as outras mulheres, menos inteligentes que os homens, não me importo com o teste de QI, porque o que conta é o valor das pessoas e não se baseia no habilidades intelectuais.
A fonte original em francês:
Em um les faits indiscutables suivants:
- você tem uma diferença de volume intermediária em homens e mulheres?
- você é uma correlação entre QI e volume central; a correção é de 0,33 e corresponde a 10% da variabilidade
Dos prêmios 1 e 2, a menor quantidade de logotipos que: as mulheres são afetadas por um membro da QI infantil.
Mais c'est une erreur de raisonnement! Em estatística, as correções não são passivas. No caso anterior, o que derramar no líquido da rede, é suficiente considerar os resultados dos testes de QI e controlar o fluxo de QI dos homens e das mulheres nos diferentes países da Europa.
Respostas:
Sim, ainda seria uma falácia.
Aqui está uma figura muito simples, mostrando quatro situações diferentes. Em cada caso, pontos vermelhos representam mulheres, pontos azuis representam homens, o eixo horizontal representa o tamanho do cérebro e o eixo vertical representa o QI. Gerei todos os quatro conjuntos de dados de modo que:
sempre há a mesma diferença no tamanho médio do cérebro entre homens ( ) e mulheres ( 28 unidades são arbitrárias). Essas são médias populacionais, mas essa diferença é grande o suficiente para ser estatisticamente significativa com qualquer tamanho de amostra razoável;22 28.
sempre há diferença zero no QI médio entre homens e mulheres (ambos ) e também correlação zero entre gênero e QI;100
a força da correlação entre o tamanho do cérebro e o QI varia conforme mostrado na figura.
Na subparcela superior esquerda, a correlação dentro do sexo (calculada separadamente por homens e separadamente por mulheres e, em seguida, calculada a média) é , como em sua citação. Na subtrama superior direita, a correlação geral (entre homens e mulheres juntos) é de 0,3 . Observe que sua cotação não especifica a que o número de 0,33 se refere. Na subparcela inferior esquerda, a correlação dentro do sexo é de 0,9 , como no seu exemplo hipotético; na subtrama inferior direita, a correlação geral é de 0,9 .0,3 0,3 0,33 0,9 0,9
Portanto, você pode ter qualquer valor de correlação e não importa se é calculado globalmente ou dentro do grupo. Qualquer que seja o coeficiente de correlação, é muito possível que não haja correlação zero entre gênero e QI e diferença de gênero zero no QI médio.
Explorando a não transitividade
Vamos explorar todo o espaço de possibilidades, seguindo a abordagem sugerida por @kjetil. Suponha que você tenha três variáveis e (sem perda de generalidade) suponha que a correlação entre x 1 e x 2 seja a > 0 e a correlação entre x 2 e x 3 seja b > 0 . A questão é: qual é o valor positivo possível mínimo da correlação λ entre x 1 e x 3x1, x2, x3 x1 x2 a > 0 x2 x3 b > 0 λ x1 x3 ? Às vezes tem que ser positivo ou sempre pode ser zero?
A matriz de correlação é e deve ter um determinante não negativo, ou seja, d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , o que significa que λ deve estar entre a b ± √
Podemos resolver este numericamente e traçar o mínimo possível valor positivo de para diferentes um e b :λ uma b
Informalmente, podemos dizer que as correlações seria transitivo se dado que e b > 0 , pode-se concluir que λ > 0 . Vemos que para a maioria dos valores de um e b , λ pode ser zero, o que significa que as correlações são não-transitiva. No entanto, para alguns valores suficientemente elevados de um e b , correlação λ tem que ser positivo , o que significa que há "um certo grau de transitivity" depois de tudo, mas restringida apenas correlações muito altas. Note-se que ambas as correlações um e ba > 0 b > 0 λ > 0 uma b λ uma b λ uma b tem que ser alto.
Podemos elaborar uma condição precisa para essa "transitividade": como mencionado acima, a raiz menor deve ser positiva, ou seja, , o que é equivalente auma2+b2>1. Esta é uma equação de um círculo! E, de fato, se você olhar para a figura acima, notará que a região azul forma um quarto de círculo.a b - ( 1 - a2) ( 1 - b2)-------------√> 0 uma2+ b2> 1
No seu exemplo específico, a correlação entre sexo e tamanho do cérebro é bastante moderada (talvez ) e a correlação entre tamanho do cérebro e QI é b = 0,33 , o que está firmemente dentro da região azul ( a 2 + b 2 < 1 ), o que significa que λ pode ser positivo, negativo ou zero.a = 0,5 b = 0,33 uma2+ b2< 1 λ
Figura relevante do estudo original
Você queria evitar discutir gênero e cérebro, mas não posso deixar de apontar que, olhando para a figura completa do artigo original ( Gur et al. 1999 ), pode-se ver que, embora não haja diferença de gênero no escore de QI verbal, há uma diferença óbvia e significativa no escore de QI espacial! Compare as subparcelas D e F.
fonte
Atualizar:
fonte
É uma situação em que gosto de usar diagramas de caminhos para ilustrar efeitos diretos e indiretos , e como esses dois afetam as correlações gerais.
Pela descrição original, temos uma matriz de correlação abaixo. O tamanho do cérebro tem uma correlação de 0,3 com o QI, o feminino e o QI têm uma correlação 0 entre si. Eu preencheu a correlação negativa entre o tamanho feminino e o cérebro como -0,3 (se eu tivesse que adivinhar que é muito menor que isso, mas isso servirá para fins ilustrativos).
Se ajustarmos um modelo de regressão em que o QI é uma função do tamanho do cérebro e do sexo feminino, podemos ilustrar isso em termos de um diagrama de caminho. Preenchi os coeficientes de regressão parcial nas setas, e o nó B significa tamanho do cérebro e o nó F significa feminino.
Agora, quão louco é isso - ao controlar o tamanho do cérebro, dadas essas correlações, as mulheres têm uma relação positiva com o QI. Por que isso, quando a correlação marginal é zero? Por regras com diagramas de caminho lineares ( Wright, 1934 ), podemos decompor a correlação marginal em função do efeito direto ao controlar o tamanho do cérebro e o efeito indireto:
Como o efeito total é zero, sabemos que o efeito direto deve ser simplesmente o sinal oposto exato e o tamanho do efeito indireto ; portanto, o efeito direto é igual a 0,099 neste exemplo. Agora, aqui temos uma situação ao avaliar o QI esperado das mulheres, obtemos duas respostas diferentes, embora provavelmente não seja o que você esperava inicialmente ao especificar a pergunta. Ao simplesmente avaliar o QI marginal esperado de mulheres versus homens, a diferença é zero como você a definiu (por ter uma correlação zero). Ao avaliar a diferença esperada condicional ao tamanho do cérebro, as mulheres têm um QI maior que os homens.
Você pode inserir neste exemplo correlações maiores entre tamanho do cérebro e QI (ou correlações menores entre tamanho feminino e cerebral), considerando os limites que o kjetil mostra em sua resposta. Aumentar o primeiro aumenta ainda mais a disparidade entre o QI condicional de mulheres e homens em favor das mulheres, diminuindo o segundo diminui as diferenças.
fonte
Observe que, embora o texto citado fale sobre "correlação entre volume cerebral e QI" em geral, a imagem fornecida faz uma distinção com as duas linhas de tendência (ou seja, mostra a correlação para os dois subgrupos separadamente). Portanto, nós os consideramos separadamente (que é o caminho correto a seguir).
Então
e
Então deve ser o caso que
e essa
fonte