Atualmente, esta mensagem no artigo de Reuter de 25.02.2019 está em todas as notícias:
Evidências do aquecimento global causado pelo homem atingem o 'padrão ouro'
[Os cientistas] disseram que a confiança de que as atividades humanas estavam aumentando o calor na superfície da Terra havia atingido um nível de “cinco sigma”, um medidor estatístico que significa que há apenas uma chance em um milhão de que o sinal apareça se houver sem aquecimento.
Acredito que isso se refira a este artigo "Comemorando o aniversário de três eventos importantes na ciência das mudanças climáticas", que contém uma trama, que é mostrada esquematicamente abaixo (é um esboço porque não consegui encontrar uma imagem de código aberto para um original semelhante) imagens gratuitas são encontradas aqui ). Outro artigo do mesmo grupo de pesquisa, que parece ser uma fonte mais original, está aqui (mas usa uma significância de 1% em vez de ).
O gráfico apresenta medições de três grupos de pesquisa diferentes: Sistemas de Sensoriamento Remoto, o Centro de Aplicações e Pesquisas de Satélite e a Universidade do Alabama em Huntsville.
O gráfico exibe três curvas crescentes da relação sinal / ruído em função do comprimento da tendência.
Então, de alguma forma, os cientistas mediram um sinal antropogênico de aquecimento global (ou mudança climática?) No nível , o que aparentemente é um padrão científico de evidência .
Para mim, esse gráfico, que tem um alto nível de abstração, levanta muitas questões , e em geral me pergunto sobre a pergunta 'Como eles fizeram isso?' . Como explicamos esse experimento em palavras simples (mas não tão abstratas) e também explicamos o significado do nível ? 5σ
Faço essa pergunta aqui porque não quero uma discussão sobre clima. Em vez disso, quero respostas sobre o conteúdo estatístico e, principalmente, para esclarecer o significado de uma afirmação que está usando / reivindicando .
Qual é a hipótese nula? Como eles montaram o experimento para obter um sinal antropogênico ? Qual é o tamanho do efeito do sinal? É apenas um sinal pequeno e só o medimos agora porque o ruído está diminuindo ou o sinal está aumentando? Que tipo de suposições são feitas para criar o modelo estatístico pelo qual elas determinam a passagem de um limite de 5 sigma (independência, efeitos aleatórios, etc ...)? Por que as três curvas para os diferentes grupos de pesquisa são diferentes, têm ruído diferente ou sinais diferentes e, no caso deste último, o que isso significa em relação à interpretação da probabilidade e validade externa?
fonte
Respostas:
Nem sempre é sobre testes estatísticos. Também pode ser sobre teoria da informação.
O termo 5σ é o que diz: uma proporção de "sinal" para "ruído". No teste de hipóteses, temos uma estimativa de um parâmetro de distribuição e erro padrão da estimativa. O primeiro é um "sinal", o segundo é "ruído" e a proporção das estatísticas e seu erro padrão são as estatísticas z, estatísticas t, estatísticas F, o que você quiser.
No entanto, a relação sinal / ruído é útil em qualquer lugar onde recebemos / percebemos algumas informações através de algum ruído. Como o link citado explica
No nosso caso, o "sinal" é a mudança real medida na temperatura de alguns estratos da atmosfera e o "ruído" são previsões da mudança a partir das simulações sem as influências antropogênicas conhecidas. Acontece que essas simulações previram temperatura mais ou menos estacionária com um certo desvio padrão σ.
Agora, de volta às estatísticas. Todas as estatísticas de teste (z, t, F) são as proporções da estimativa para seu erro padrão. Então, quando nós estatísticos ouvimos algo como S / N, pensamos em uma estatística z e a equipamos com a probabilidade. Os climatologistas obviamente não fazem isso (não há menção à probabilidade em nenhum lugar do artigo ). Eles simplesmente descobrem que a mudança é "aproximadamente três a oito" vezes maior que o esperado, o S / N é de 3σ a 8σ.
O que o artigo está relatando é que eles fizeram dois tipos de simulações: aquelas com as influências antropogênicas conhecidas incluídas no modelo e as outras com as influências antropogênicas conhecidas excluídas. As primeiras simulações foram semelhantes aos dados reais medidos por satélite, enquanto as segundas estavam longe. Se isso é provável ou não, eles não dizem e obviamente não se importam.
Para responder a outras perguntas. Eles não fizeram experimentos, fizeram simulações de acordo com seus modelos. Portanto, não há hipótese nula explícita, exceto a óbvia, de que a mudança é semelhante à esperada (S / N é 1).
O tamanho do efeito do sinal é uma diferença entre os dados reais e as simulações. É um sinal 5 vezes maior que o esperado (cinco vezes a variabilidade usual das temperaturas). Parece que o ruído está diminuindo devido à quantidade e possivelmente precisão das medições.
Ao contrário de nossas expectativas dos "cientistas reais", não existe um modelo estatístico sobre o qual possamos falar, portanto a pergunta sobre as suposições feitas é vazia. A única suposição é que seus modelos lhes permitam prever o clima. Isso é tão válido quanto dizer que os modelos usados para as previsões meteorológicas são sólidos.
Existem muito mais que três curvas. Eles são os resultados da simulação de diferentes modelos. Eles simplesmente têm que ser diferentes. E sim, tem barulho diferente. O sinal, na medida em que é diferente, são conjuntos de medidas diferentes, que apresentam erros de medição e também devem ser diferentes. O que isso significa em relação à interpretação? A interpretação de probabilidade do S / N não é boa. No entanto, a validade externa dos resultados é sólida. Eles simplesmente afirmam que as mudanças climáticas no período de 1979 a 2011 são comparáveis às simulações quando as influências antropogênicas conhecidas são contabilizadas e aproximadamente cinco vezes maiores que as calculadas por simulação quando os fatores antropogênicos conhecidos são excluídos do modelo.
Portanto, resta uma pergunta. Se os climatologistas pedissem aos estatísticos que fizessem um modelo, qual deveria ser? Na minha opinião, algo na linha do movimento browniano.
fonte
Advertência: NÃO sou especialista em climatologia, esse não é o meu campo. Por favor, tenha isso em mente. Correções são bem-vindas.
A figura a que você está se referindo vem de um artigo recente de Santer et al. 2019, comemorando o aniversário de três eventos importantes na ciência das mudanças climáticas da Nature Climate Change . Não é um trabalho de pesquisa, mas um breve comentário. Esta figura é uma atualização simplificada de uma figura semelhante de um artigo anterior da Science dos mesmos autores, Santer et al. 2018, Influência humana no ciclo sazonal da temperatura troposférica . Aqui está a figura de 2019:
E aqui está a figura de 2018; o painel A corresponde à figura de 2019:
Aqui tentarei explicar a análise estatística por trás desse último número (todos os quatro painéis). O artigo da Science é de acesso aberto e bastante legível; os detalhes estatísticos estão, como sempre, ocultos nos Materiais Complementares. Antes de discutir as estatísticas como tais, é preciso dizer algumas palavras sobre os dados observacionais e as simulações (modelos climáticos) usadas aqui.
1. Dados
As abreviações RSS, UAH e STAR referem-se a reconstruções da temperatura troposférica a partir das medições de satélite. A temperatura troposférica é monitorada desde 1979 usando satélites meteorológicos: consulte a Wikipedia sobre medições de temperatura MSU . Infelizmente, os satélites não medem diretamente a temperatura; eles medem outra coisa, a partir da qual a temperatura pode ser inferida. Além disso, eles são conhecidos por sofrerem vários vieses dependentes do tempo e problemas de calibração. Isso torna a reconstrução da temperatura real um problema difícil. Vários grupos de pesquisa realizam essa reconstrução, seguindo metodologias um pouco diferentes e obtendo resultados finais um pouco diferentes. RSS, UAH e STAR são essas reconstruções. Para citar a Wikipedia,
Há muito debate sobre qual reconstrução é mais confiável. Cada grupo atualiza seus algoritmos de vez em quando, alterando toda a série temporal reconstruída. É por isso que, por exemplo, o RSS v3.3 difere do RSS v4.0 na figura acima. No geral, o AFAIK é bem aceito no campo que as estimativas da temperatura global da superfície são mais precisas do que as medições de satélite. De qualquer forma, o que importa para essa questão é que existem várias estimativas disponíveis da temperatura troposférica espacialmente resolvida, de 1979 até agora - isto é, em função da latitude, longitude e tempo.
2. Modelos
Existem vários modelos climáticos que podem ser executados para simular a temperatura troposférica (também em função da latitude, longitude e tempo). Esses modelos consideram a entrada de concentração de CO2, atividade vulcânica, irradiância solar, concentração de aerossóis e várias outras influências externas e produzem temperatura como saída. Esses modelos podem ser executados pelo mesmo período (1979 - agora), usando as influências externas medidas reais. As saídas podem então ser calculadas para obter a média da saída do modelo.
Também é possível executar esses modelos sem inserir os fatores antropogênicos (gases de efeito estufa, aerossóis etc.), para se ter uma idéia de previsões de modelos não antropogênicos. Observe que todos os outros fatores (solar / vulcânico / etc.) Flutuam em torno de seus valores médios, portanto a saída do modelo não antropogênico é estacionária por construção. Em outras palavras, os modelos não permitem que o clima mude naturalmente, sem nenhuma causa externa específica.
4. Alguns comentários
A primeira impressão digital (painel A) é, IMHO, a mais trivial. Significa simplesmente que as temperaturas observadas crescem monotonicamente, enquanto as temperaturas sob a hipótese nula não. Não acho que seja necessário todo esse maquinário complicado para chegar a essa conclusão. A série temporal média global da temperatura troposférica mais baixa (variante RSS) é semelhante a esta :
e claramente há uma tendência muito significativa aqui. Eu não acho que alguém precise de modelos para ver isso.
fonte