Pergunta : Como posso construir um teste para determinar se a frequência do alelo "montanha" observada (Fig 1) é significativamente mais baixa nas montanhas do centro-sul do que o previsto (Fig 2) pelo modelo de seleção ecológica ( veja detalhes abaixo )?
Problema : Meu pensamento inicial foi regredir os resíduos do modelo em relação à latitude: longitude e altitude (o que resulta apenas na interação entre latitude e longitude como significativa). O problema é que os resíduos (Fig. 3) podem refletir variações não explicadas pelo modelo e / ou que são algo biológico acontecendo, por exemplo, o alelo não teve tempo de se espalhar para o sul ao seu potencial ou existe alguma barreira ao fluxo gênico. Se você comparar as freqüências observadas (Fig. 1) versus as esperadas (Fig. 2) dos alelos das montanhas, haverá uma diferença óbvia, especialmente nas montanhas do centro ao sul da Suécia e da Noruega. Aceito que o modelo possa não explicar toda a variação, mas posso fazer um teste razoável para explorar a idéia de que o alelo da montanha não atingiu seu potencial nas montanhas do centro ao sul?
fundo: Eu tenho um marcador AFLP bi-alélico cuja distribuição de frequência parece estar associada a habitats de montanha (e latitude: longitude) versus habitats de planície na península escandinava (Fig. 1). O alelo "montanha" é quase fixo no norte, que é montanhoso. Está quase ausente ou corrigido para o alelo "planície" no sul, que carece de montanhas. Quando se move de norte a sul nas montanhas, o alelo "montanha" ocorre em menor frequência. Essa diferença na frequência do alelo "montanha" de norte a sul pode ser simplesmente devida a filogeografia ou processos históricos, já que a região foi colonizada pelo norte e pelo sul. Por exemplo, se o alelo da montanha se origina na população do norte, talvez ele não tenha tido tempo de se expandir totalmente na população do sul,
Minha hipótese de trabalho é que a frequência do alelo "montanha" é resultado da seleção ecológica (hipótese nula é seleção neutra).
Para o meu modelo de seleção ecológica, usei um modelo aditivo generalizado (GAM) com a frequência do alelo binomial como variável de resposta (129 locais amostrados na Fennoscandinavia com tipicamente 10 a 20 indivíduos amostrados em cada local) e várias variáveis climáticas e da estação de crescimento como as variáveis preditoras. Os resultados do modelo são os seguintes (TMAX04-06 = temperatura máxima em abril-junho, Phen_NPPMN = produtividade média da vegetação na estação de crescimento, PET_HE_YR = evapotranspiração potencial anual, Dist_Coast = distância da costa):
Family: binomial
Link function: logit
Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) +
s(PET_HE_YR) + s(Dist_Coast)
Parametric coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.74372 0.04736 -15.7 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Approximate significance of smooth terms:
edf Ref.df Chi.sq p-value
s(TMAX_04) 3.8100 4.812 25.729 9.43e-05 ***
s(TMAX_05) 0.8601 1.000 5.887 0.01526 *
s(TMAX_06) 0.8862 1.000 7.644 0.00569 **
s(Phen_NPPMN) 6.2177 7.375 39.028 3.16e-06 ***
s(PET_HE_YR) 3.1882 4.147 18.039 0.00145 **
s(Dist_Coast) 2.2882 2.857 9.725 0.01906 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
R-sq.(adj) = 0.909 Deviance explained = 89.7%
REML score = 326.73 Scale est. = 1 n = 129
Figura 1. Frequência do alelo "montanha" observada para o marcador AFLP bi-alélico. Linhas de contorno 0,1 intervalos de frequência, sombreamento de cores é a altitude com azuis para os mais baixos e vermelhos mais altos.
Figura 2. Frequência prevista do alelo "montanha" para o marcador AFLP bi-alélico. Linhas de contorno 0,1 intervalos de frequência, sombreamento de cores é a altitude com azuis para os mais baixos e vermelhos mais altos.
Figura 3. Resíduos do modelo de seleção ecológica (usando GAM) discriminados por toda a área de estudo (Fennoscandinavia) e separadamente para Noruega, Suécia e Finlândia. As linhas tracejadas vermelhas representam uma zona de contato secundária entre as populações norte e sul inferidas a partir de outros marcadores da AFLP e uma análise isotópica estável das penas cultivadas em seus locais de inverno separados na África. A fina linha pontilhada preta é o centro da zona.
fonte
Respostas:
Essa pergunta pode estar morta, mas os gráficos aqui são lindos e a resposta aqui parece intuitivamente óbvia. Se você estiver procurando por um alelo "montanha", a escolha óbvia seria usar a altitude (ou algum substituto) como seu preditor. Se isso mostrasse uma associação significativa com a frequência do alelo, forneceria uma forte evidência para sua hipótese.
Você pode adicionar mais variáveis preditivas que descrevem outros aspectos da montanha além de sua altitude - por exemplo, "rugosidade" do terreno ou tipo de vegetação - que são exclusivamente montanhosas e também podem estar associadas à frequência do alelo.
fonte