A evidência do aquecimento global causado pelo homem atinge o 'padrão ouro': como eles fizeram isso?

Atualmente, esta mensagem no artigo de Reuter de 25.02.2019 está em todas as notícias:

Evidências do aquecimento global causado pelo homem atingem o 'padrão ouro'

[Os cientistas] disseram que a confiança de que as atividades humanas estavam aumentando o calor na superfície da Terra havia atingido um nível de “cinco sigma”, um medidor estatístico que significa que há apenas uma chance em um milhão de que o sinal apareça se houver sem aquecimento.

Acredito que isso se refira a este artigo "Comemorando o aniversário de três eventos importantes na ciência das mudanças climáticas", que contém uma trama, que é mostrada esquematicamente abaixo (é um esboço porque não consegui encontrar uma imagem de código aberto para um original semelhante) imagens gratuitas são encontradas aqui ). Outro artigo do mesmo grupo de pesquisa, que parece ser uma fonte mais original, está aqui (mas usa uma significância de 1% em vez de ). $5\sigma$

O gráfico apresenta medições de três grupos de pesquisa diferentes: Sistemas de Sensoriamento Remoto, o Centro de Aplicações e Pesquisas de Satélite e a Universidade do Alabama em Huntsville.

O gráfico exibe três curvas crescentes da relação sinal / ruído em função do comprimento da tendência.

Então, de alguma forma, os cientistas mediram um sinal antropogênico de aquecimento global (ou mudança climática?) No nível , o que aparentemente é um padrão científico de evidência . $5\sigma$

Para mim, esse gráfico, que tem um alto nível de abstração, levanta muitas questões , e em geral me pergunto sobre a pergunta 'Como eles fizeram isso?' . Como explicamos esse experimento em palavras simples (mas não tão abstratas) e também explicamos o significado do nível ? $^{\dagger}$ $5\sigma$

Faço essa pergunta aqui porque não quero uma discussão sobre clima. Em vez disso, quero respostas sobre o conteúdo estatístico e, principalmente, para esclarecer o significado de uma afirmação que está usando / reivindicando . $5 \sigma$

$^\dagger$ Qual é a hipótese nula? Como eles montaram o experimento para obter um sinal antropogênico ? Qual é o tamanho do efeito do sinal? É apenas um sinal pequeno e só o medimos agora porque o ruído está diminuindo ou o sinal está aumentando? Que tipo de suposições são feitas para criar o modelo estatístico pelo qual elas determinam a passagem de um limite de 5 sigma (independência, efeitos aleatórios, etc ...)? Por que as três curvas para os diferentes grupos de pesquisa são diferentes, têm ruído diferente ou sinais diferentes e, no caso deste último, o que isso significa em relação à interpretação da probabilidade e validade externa?

p-value intuition application communication climate Sextus Empiricus
fonte

@MattF. Minha expectativa é que seja possível fazer uma exposição simples que explique o conceito estatístico do limite de usado aqui (pelo menos os físicos de partículas de alta energia, que também usam discrepâncias / efeitos para descrever o sinal para relação de ruído na contagem de eventos, não tem nenhum problema com isso). Com simples, quero dizer algo despojado do jargão da climatologia, mas sofisticado o suficiente para conter a essência. Digamos, seria algo escrito para estatísticos e matemáticos profissionais de modo que eles possam entender o aqui.

5 σ

$5\sigma$

σ

$\sigma$

5 σ

$5\sigma$

Sextus Empiricus

Para enfatizar o contraste com a física de alta energia: para este campo, os estatísticos podem entender que o nível é basicamente sem sentido e a barra é elevada porque o cálculo é tecnicamente errado (1. o efeito de procurar outro lugar 2. suposições erradas sobre o erro distribuição ignorando efeitos sistemáticos 3. fazendo implicitamente uma análise bayesiana, 'alegações extraordinárias requerem evidências extraordinárias').

5 σ

$5\sigma$

Sextus Empiricus 6/03

A questão é quanto esses três efeitos estão presentes no caso deste artigo sobre aquecimento global produzido pelo homem. Eu acho que é importante deixar isso claro, desmistificar as alegações de ciência. É tão comum apenas jogar alguns números em uma discussão para parecer rigorosa, e a maioria das pessoas para de questioná-la.

Sextus Empiricus 6/03

Você já viu esta crítica: judithcurry.com/2019/03/01/… ?

Robert Long

Por coincidência, eu estava lendo esses jornais há apenas alguns dias e agora notei sua nova recompensa. Eu posso escrever algo agora.

amoeba diz Reinstate Monica

Respostas:

Nem sempre é sobre testes estatísticos. Também pode ser sobre teoria da informação.

O termo 5σ é o que diz: uma proporção de "sinal" para "ruído". No teste de hipóteses, temos uma estimativa de um parâmetro de distribuição e erro padrão da estimativa. O primeiro é um "sinal", o segundo é "ruído" e a proporção das estatísticas e seu erro padrão são as estatísticas z, estatísticas t, estatísticas F, o que você quiser.

No entanto, a relação sinal / ruído é útil em qualquer lugar onde recebemos / percebemos algumas informações através de algum ruído. Como o link citado explica

A relação sinal / ruído (SNR ou S / N, muitas vezes abreviada) é uma medida usada na ciência e na engenharia para quantificar quanto o sinal é corrompido pelo ruído.

No nosso caso, o "sinal" é a mudança real medida na temperatura de alguns estratos da atmosfera e o "ruído" são previsões da mudança a partir das simulações sem as influências antropogênicas conhecidas. Acontece que essas simulações previram temperatura mais ou menos estacionária com um certo desvio padrão σ.

Agora, de volta às estatísticas. Todas as estatísticas de teste (z, t, F) são as proporções da estimativa para seu erro padrão. Então, quando nós estatísticos ouvimos algo como S / N, pensamos em uma estatística z e a equipamos com a probabilidade. Os climatologistas obviamente não fazem isso (não há menção à probabilidade em nenhum lugar do artigo ). Eles simplesmente descobrem que a mudança é "aproximadamente três a oito" vezes maior que o esperado, o S / N é de 3σ a 8σ.

O que o artigo está relatando é que eles fizeram dois tipos de simulações: aquelas com as influências antropogênicas conhecidas incluídas no modelo e as outras com as influências antropogênicas conhecidas excluídas. As primeiras simulações foram semelhantes aos dados reais medidos por satélite, enquanto as segundas estavam longe. Se isso é provável ou não, eles não dizem e obviamente não se importam.

Para responder a outras perguntas. Eles não fizeram experimentos, fizeram simulações de acordo com seus modelos. Portanto, não há hipótese nula explícita, exceto a óbvia, de que a mudança é semelhante à esperada (S / N é 1).

O tamanho do efeito do sinal é uma diferença entre os dados reais e as simulações. É um sinal 5 vezes maior que o esperado (cinco vezes a variabilidade usual das temperaturas). Parece que o ruído está diminuindo devido à quantidade e possivelmente precisão das medições.

Ao contrário de nossas expectativas dos "cientistas reais", não existe um modelo estatístico sobre o qual possamos falar, portanto a pergunta sobre as suposições feitas é vazia. A única suposição é que seus modelos lhes permitam prever o clima. Isso é tão válido quanto dizer que os modelos usados para as previsões meteorológicas são sólidos.

Existem muito mais que três curvas. Eles são os resultados da simulação de diferentes modelos. Eles simplesmente têm que ser diferentes. E sim, tem barulho diferente. O sinal, na medida em que é diferente, são conjuntos de medidas diferentes, que apresentam erros de medição e também devem ser diferentes. O que isso significa em relação à interpretação? A interpretação de probabilidade do S / N não é boa. No entanto, a validade externa dos resultados é sólida. Eles simplesmente afirmam que as mudanças climáticas no período de 1979 a 2011 são comparáveis às simulações quando as influências antropogênicas conhecidas são contabilizadas e aproximadamente cinco vezes maiores que as calculadas por simulação quando os fatores antropogênicos conhecidos são excluídos do modelo.

Portanto, resta uma pergunta. Se os climatologistas pedissem aos estatísticos que fizessem um modelo, qual deveria ser? Na minha opinião, algo na linha do movimento browniano.

Nino Rode
fonte

Então, o que constitui o "sinal", qual é a natureza do "ruído" e a que processos invisíveis podemos atribuí-lo?

Josh

Sory @ Josh, eu bati prematuramente o botão enviar. Agora você pode ler minha resposta completa. Mais ainda, o "sinal" são as medidas reais e o "ruído" são os resultados das simulações quando os fatores antropogênicos conhecidos são excluídos do modelo. E na minha opinião isso é muito anti-estatístico ...

Nino Rode

n σ

$n\sigma$

@NinoRode Talvez esteja faltando alguma coisa, mas como o modelo de "ruído" sem influências antropogênicas está evidentemente errado devido ao fato de a temperatura média ter aumentado com base em medições empíricas , como esse modelo fornece uma linha de base relevante? Como se entende que as temperaturas flutuam devido a processos naturais ( pt.wikipedia.org/wiki/Little_Ice_Age ) além dos antropogênicos, qual é a base para a suposição de que o modelo de "ruído" deve ter um aumento de temperatura médio-zero ao longo de o período de análise?

Josh

@ Scott, o problema do desenho animado inteligente é que não há ruído mostrado ao longo da série temporal, porque as medidas provavelmente não são refinadas o suficiente para determinar qual era a temperatura em um determinado século, muito menos em um ano específico. Por isso, parece suave e gradual até o advento dos modernos dispositivos de medição. Na mecânica dos fluidos, isso seria como comparar uma observação instantânea de um campo de velocidade com um de média de Reynolds; não é uma comparação apropriada. A menos que você realmente pense que houve essencialmente zero volatilidade nas temperaturas globais até Greta Thunberg nascer. :)

Josh

Advertência: NÃO sou especialista em climatologia, esse não é o meu campo. Por favor, tenha isso em mente. Correções são bem-vindas.

A figura a que você está se referindo vem de um artigo recente de Santer et al. 2019, comemorando o aniversário de três eventos importantes na ciência das mudanças climáticas da Nature Climate Change . Não é um trabalho de pesquisa, mas um breve comentário. Esta figura é uma atualização simplificada de uma figura semelhante de um artigo anterior da Science dos mesmos autores, Santer et al. 2018, Influência humana no ciclo sazonal da temperatura troposférica . Aqui está a figura de 2019:

E aqui está a figura de 2018; o painel A corresponde à figura de 2019:

Aqui tentarei explicar a análise estatística por trás desse último número (todos os quatro painéis). O artigo da Science é de acesso aberto e bastante legível; os detalhes estatísticos estão, como sempre, ocultos nos Materiais Complementares. Antes de discutir as estatísticas como tais, é preciso dizer algumas palavras sobre os dados observacionais e as simulações (modelos climáticos) usadas aqui.

1. Dados

As abreviações RSS, UAH e STAR referem-se a reconstruções da temperatura troposférica a partir das medições de satélite. A temperatura troposférica é monitorada desde 1979 usando satélites meteorológicos: consulte a Wikipedia sobre medições de temperatura MSU . Infelizmente, os satélites não medem diretamente a temperatura; eles medem outra coisa, a partir da qual a temperatura pode ser inferida. Além disso, eles são conhecidos por sofrerem vários vieses dependentes do tempo e problemas de calibração. Isso torna a reconstrução da temperatura real um problema difícil. Vários grupos de pesquisa realizam essa reconstrução, seguindo metodologias um pouco diferentes e obtendo resultados finais um pouco diferentes. RSS, UAH e STAR são essas reconstruções. Para citar a Wikipedia,

Os satélites não medem a temperatura. Eles medem radiações em várias faixas de comprimento de onda, que devem ser matematicamente invertidas para obter inferências indiretas de temperatura. Os perfis de temperatura resultantes dependem dos detalhes dos métodos usados para obter temperaturas das radiações. Como resultado, diferentes grupos que analisaram os dados do satélite obtiveram diferentes tendências de temperatura. Entre esses grupos estão os Sistemas de Sensoriamento Remoto (RSS) e a Universidade do Alabama em Huntsville (UAH). A série de satélites não é totalmente homogênea - o registro é construído a partir de uma série de satélites com instrumentação semelhante, mas não idêntica. Os sensores deterioram-se com o tempo e são necessárias correções para a deriva do satélite em órbita.

Há muito debate sobre qual reconstrução é mais confiável. Cada grupo atualiza seus algoritmos de vez em quando, alterando toda a série temporal reconstruída. É por isso que, por exemplo, o RSS v3.3 difere do RSS v4.0 na figura acima. No geral, o AFAIK é bem aceito no campo que as estimativas da temperatura global da superfície são mais precisas do que as medições de satélite. De qualquer forma, o que importa para essa questão é que existem várias estimativas disponíveis da temperatura troposférica espacialmente resolvida, de 1979 até agora - isto é, em função da latitude, longitude e tempo.

$T(\mathbf x, t)$

2. Modelos

Existem vários modelos climáticos que podem ser executados para simular a temperatura troposférica (também em função da latitude, longitude e tempo). Esses modelos consideram a entrada de concentração de CO2, atividade vulcânica, irradiância solar, concentração de aerossóis e várias outras influências externas e produzem temperatura como saída. Esses modelos podem ser executados pelo mesmo período (1979 - agora), usando as influências externas medidas reais. As saídas podem então ser calculadas para obter a média da saída do modelo.

Também é possível executar esses modelos sem inserir os fatores antropogênicos (gases de efeito estufa, aerossóis etc.), para se ter uma idéia de previsões de modelos não antropogênicos. Observe que todos os outros fatores (solar / vulcânico / etc.) Flutuam em torno de seus valores médios, portanto a saída do modelo não antropogênico é estacionária por construção. Em outras palavras, os modelos não permitem que o clima mude naturalmente, sem nenhuma causa externa específica.

$M(\mathbf x,t)$ $N(\mathbf x, t)$

$z$

$T(\mathbf x, t)$ $M(\mathbf x, t)$ $N(\mathbf x, t)$

$T(\mathbf x, i)$ $M(\mathbf x, i)$ $N(\mathbf x, i)$ $i$

Média anual: simplesmente temperatura média durante todo o ano.
Ciclo sazonal anual: a temperatura do verão menos a temperatura do inverno.
$\mathbf x$ $i$
Ciclo sazonal anual com média global subtraída: o mesmo que (2), mas subtraindo novamente a média global.

$M(\mathbf x, i)$ $F(\mathbf x)$

$T(\mathbf x, i)$ $F(\mathbf x)$

Z (Eu) = \sum_{x} T (x, Eu) F (x),

$Z(i) = \sum_\mathbf x T(\mathbf x, i) F(\mathbf x),$

β

$\beta$

z

$z$

W (Eu) = \sum_{x} N (x, Eu) F (x),

$W(i) = \sum_\mathbf x N(\mathbf x, i) F(\mathbf x),$

β_{n o i s e}

$\beta_\mathrm{noise}$

β_{n o i s e}

$\beta_\mathrm{noise}$

z

$z$ -estatística:

z = \frac{β}{{Var}^{1 1 / 2} [β_{n o Eu s e}]} .

$z = \frac{\beta}{\operatorname{Var}^{1/2}[\beta_\mathrm{noise}]}.$

$z$

4. Alguns comentários

A primeira impressão digital (painel A) é, IMHO, a mais trivial. Significa simplesmente que as temperaturas observadas crescem monotonicamente, enquanto as temperaturas sob a hipótese nula não. Não acho que seja necessário todo esse maquinário complicado para chegar a essa conclusão. A série temporal média global da temperatura troposférica mais baixa (variante RSS) é semelhante a esta :

e claramente há uma tendência muito significativa aqui. Eu não acho que alguém precise de modelos para ver isso.

$z$

ameba diz Restabelecer Monica
fonte

(+1) Esta é uma ótima resposta! Se você não se importa: você poderia expandir a etapa "PCA através dos pontos do tempo"? Eu não entendo o pensamento por trás de fazer um PCA lá em vez de analisar cada dimensão separadamente.

mkt - Restabelece Monica

β_{noise}

$\beta_{\text {noise}}$

N (x, i)

$N(x,i)$

F (x)

$F(x)$

T (x, i)

$T(x,i)$

F (x)

$F(x)$

N (x, 2019)

$N(x, 2019)$

Sim, essas coisas podem ser discutidas de todos os tipos de ângulos. Pessoalmente, estou sem muito julgamento sobre qualquer lado, mas gosto que os argumentos sejam claros e claros. Atualmente, os relatórios sobre o clima são muito confusos.

Sextus Empiricus

F (x)

$F(x)$