O artigo “Machine learning map of climate policy literature reveals disparities between scientific attention, policy density, and emissions,” publicado na npj Climate Action, explora uma abordagem inovadora para analisar a vasta e dispersa literatura científica sobre políticas climáticas. Utilizando técnicas de aprendizado de máquina (machine learning), os autores criaram um mapa sistemático “vivo” da pesquisa em políticas climáticas, com o objetivo de identificar lacunas de conhecimento, clusters de pesquisa e áreas onde a atenção científica não corresponde à densidade de políticas implementadas ou às emissões de gases de efeito estufa (GEE). A relevância deste estudo reside na urgência de acelerar a mitigação das mudanças climáticas, tornando o aprendizado sobre políticas climáticas mais eficiente e direcionado.
Introdução: A Necessidade Urgente de Políticas Climáticas Eficazes
O Acordo de Paris, um marco histórico na luta contra as mudanças climáticas, estabeleceu o objetivo de manter o aumento da temperatura média global bem abaixo de 2°C acima dos níveis pré-industriais, e de envidar esforços para limitar o aumento a 1.5°C. No entanto, as políticas de mitigação em vigor são insuficientes para alcançar esta meta ambiciosa. As emissões globais de carbono continuam a aumentar, apesar da necessidade de atingir emissões líquidas zero nas próximas décadas. Para evitar os piores impactos das mudanças climáticas, os países precisam aumentar significativamente a ambição de suas Contribuições Nacionalmente Determinadas (NDCs) e superar a lacuna de implementação entre as promessas e as políticas atuais.
A janela de oportunidade para ação climática está se fechando rapidamente. Atingir emissões líquidas zero até meados do século exige um aprendizado acelerado sobre quais instrumentos de política funcionam em quais contextos. Embora as políticas atuais sejam insuficientes, milhares de medidas foram implementadas em diversos setores e regiões, com exemplos limitados de redução de emissões em algumas jurisdições. Um número crescente de estudos demonstra que a quantidade de políticas implementadas por um país está associada a reduções mais significativas nas emissões. Diversas bases de dados reúnem informações sobre essas políticas, representando um valioso recurso para o aprendizado e a replicação de estratégias eficazes.
Além das políticas implementadas, existe uma vasta literatura científica sobre instrumentos de política climática, que inclui avaliações ex post de políticas já implementadas e estudos ex ante sobre o potencial de diferentes instrumentos para reduzir as emissões. Ambas as vertentes são cruciais para um aprendizado eficaz. No entanto, os esforços para sistematizar essa literatura têm sido limitados em escopo, cobertura de instrumentos ou resultados estudados. Os principais desafios incluem a dificuldade em definir limites de sistema para políticas relevantes para o clima e a falta de tipologias consistentes e abrangentes de políticas climáticas.
A imensa quantidade de literatura sobre políticas climáticas, dispersa em diversas comunidades científicas e abrangendo diferentes setores, tipos de instrumentos e estruturas de análise, torna a síntese de evidências em larga escala particularmente desafiadora. Dada a escala e diversidade da pesquisa, é cada vez mais difícil para os cientistas se manterem atualizados sobre os desenvolvimentos em seus próprios campos. Esse também é um desafio para as avaliações científicas realizadas pelo Painel Intergovernamental sobre Mudanças Climáticas (IPCC), que é responsável por fornecer avaliações abrangentes da ciência das mudanças climáticas. Tecnologias digitais, aprendizado de máquina e processamento de linguagem natural (PNL) representam, portanto, avenidas promissoras para tornar a tarefa do IPCC mais gerenciável e para permitir trabalhos sintéticos em grande escala nos quais o IPCC deve se basear.
O estudo em questão representa um passo crítico para acelerar o aprendizado sobre políticas climáticas, ao apresentar uma visão geral dos desenvolvimentos na área. Utilizando métodos de aprendizado de máquina de PNL, o artigo mapeia sistematicamente a literatura científica sobre políticas climáticas. Um mapa sistemático “compila, descreve e cataloga as evidências disponíveis” para “identificar evidências para questões relevantes para políticas, lacunas de conhecimento e clusters de conhecimento”. Em vez de fornecer respostas diretas sobre os efeitos das políticas climáticas, este mapa mostra o que foi estudado e onde, informando potencialmente as direções para a pesquisa primária (inclusive por meio de financiamento) e permitindo mais trabalhos de síntese de evidências, desde revisões individuais até avaliações científicas como o IPCC. Dada a dimensão da literatura, a abordagem tradicional, manual, para montar tal mapa não é viável quando se trata de áreas de pesquisa com muitos milhares de artigos.
Utilizando um conjunto de mais de 2.500 documentos codificados manualmente, os autores ajustaram o modelo de linguagem ClimateBERT para identificar o subconjunto de 84.990 estudos na literatura climática mais ampla que investiga instrumentos de política climática, categorizá-los por tipo de política e setor e determinar o tipo de análise aplicada. O pipeline de classificação automatizado permite fornecer um mapa sistemático “vivo” em apoio às atividades de pesquisa, bem como avaliações científicas neste espaço.
Definindo Políticas Climáticas e Desenvolvendo uma Tipologia
O primeiro passo crucial foi caracterizar o que constitui uma política climática e desenvolver uma nova tipologia de instrumentos de política climática, abordando inconsistências e lacunas nos esquemas existentes. Isso permitiu operacionalizar uma definição de política climática que foi utilizada para codificar manualmente os estudos e treinar um modelo de aprendizado de máquina para identificar e categorizar a literatura mais ampla relevante para políticas climáticas.
Para estabelecer limites claros de sistema, os autores incluíram políticas apenas quando as reduções de emissões eram mencionadas ou quando uma política era inequivocamente motivada pelo desejo de reduzir as emissões de GEE ou as concentrações de GEE. Isso ocorre quando uma política tem como alvo direto os GEEs, como com um imposto sobre o carbono ou um padrão de emissões de GEE (ver Métodos para mais discussão). Como tal, um artigo sobre subsídios para tecnologias de energia renovável não seria incluído a menos que as reduções de emissões ou as metas climáticas fossem mencionadas, enquanto um artigo sobre um imposto sobre o carbono ou um sistema de comércio de emissões de GEE seria incluído. Isso ocorre porque um governo pode ter vários motivos para apoiar as tecnologias de energia renovável, como segurança energética, um desejo de se afastar do nuclear ou uma redução na poluição do ar local, enquanto a motivação climática para a precificação do carbono é inequívoca. O próprio instrumento tem como alvo explícito a redução das emissões de gases de efeito estufa.
Os autores reconhecem que isso significa que muitos estudos de políticas que têm efeitos importantes na redução das emissões serão perdidos, mas escolhem uma definição que pode ser aplicada consistentemente e com ambiguidade mínima. Como não têm acesso a cada política e às motivações dos tomadores de decisão que as promulgaram, concentram-se no que o próprio estudo diz. Se um estudo analisa uma política no contexto das mudanças climáticas ou da redução de emissões, consideram-no um estudo sobre política climática. Não propõem isso como uma definição superior ou conclusiva de políticas climáticas, mas simplesmente uma que pode ser aplicada com ambiguidade mínima. Seu conjunto de dados, sobre a literatura explícita de política climática, portanto, representa apenas um subconjunto da literatura sobre políticas que são relevantes para mitigar as mudanças climáticas, mas é a maior base de dados de literatura de política climática que conhecem.
A tipologia desenvolvida pelos autores é estruturada em três níveis:
- Nível 1: Categorias amplas de instrumentos de política (acordos, instrumentos econômicos, instrumentos regulatórios, informação, educação e treinamento, e governança, estratégias e metas).
- Nível 2: Tipos específicos de instrumentos (ex: preço de carbono versus subsídio).
- Nível 3: Especificações adicionais (ex: distinção entre impostos sobre o carbono e sistemas de comércio de emissões).
Esta tipologia foi projetada para ser abrangente e compatível com as tipologias existentes utilizadas em outras bases de dados de políticas climáticas.
Metodologia: Aprendizado de Máquina para Mapear a Literatura
A metodologia do estudo envolveu uma série de etapas:
- Coleta de dados: Busca na base de dados bibliográfica de acesso aberto OpenAlex com uma query abrangente para identificar toda a literatura climática. A query pode perder políticas específicas relevantes para o clima que não se referem a reduções de emissões ou metas climáticas, mas de acordo com sua definição operacional de literatura de política climática, tais documentos não seriam incluídos em seu estudo. A query retornou 1.026.371 estudos.
- Triagem e codificação manual: Triagem manual de 2.580 documentos para identificar aqueles relevantes para políticas climáticas e codificação dos documentos relevantes por tipo de instrumento de política, setor, país, nível de governança, tipo de análise (ex-post ou ex-ante) e metodologia (quantitativa ou qualitativa). Se vários instrumentos foram analisados, registraram cada um deles.
- Treinamento de modelos de aprendizado de máquina: Treinamento de classificadores de aprendizado de máquina para reproduzir as decisões de triagem e codificação manual. Diversos modelos de linguagem pré-treinados foram avaliados, incluindo o ClimateBERT.
- Avaliação do desempenho do modelo: Avaliação do desempenho dos modelos utilizando pontuações F1 para diferentes rótulos. O ClimateBERT previu as categorias inclusão, setor e o nível superior da tipologia de instrumentos melhor (Tabela 1). Observou-se uma pontuação macro F1 de 0,66 (tabela 1), embora o desempenho varie amplamente de sua categoria menos frequente (informação, educação e treinamento, que alcançou uma pontuação F1 de 0,31 com 57 exemplos rotulados) para sua categoria mais frequente (instrumentos econômicos, que alcançou uma pontuação F1 de 0,86 com 460 exemplos rotulados). O desempenho do classificador nem sempre foi confiável no nível mais detalhado, embora seu melhor modelo pudesse identificar a precificação do carbono com uma pontuação F1 de 0,77 (294 exemplos rotulados), alcançou uma pontuação F1 de 0 para a categoria “Instituições” (44 exemplos rotulados).
- Aplicação do modelo para mapear a literatura: Aplicação do modelo treinado para prever a inclusão e os rótulos de categoria para centenas de milhares de documentos potencialmente relevantes.
- Análise da distribuição da pesquisa em políticas climáticas: Análise da distribuição da pesquisa em políticas climáticas, identificando quais tipos de instrumentos foram estudados e onde. Comparação da densidade da pesquisa em políticas climáticas com a densidade de políticas reais e a distribuição de emissões.
Resultados: Desequilíbrios na Atenção Científica e na Implementação de Políticas
Os resultados do estudo revelaram diversas descobertas importantes:
- Crescimento da literatura sobre políticas climáticas: O número de artigos relevantes para instrumentos de política climática foi estimado em 84.990, com 26% desse total publicado desde 2020. Os tipos de instrumentos mais comuns são os instrumentos econômicos e as estratégias e metas de governança.
- Variação setorial: O tipo de instrumento estudado varia substancialmente entre os setores. Por exemplo, estudos sobre instrumentos econômicos superam os estudos sobre instrumentos regulatórios em todos os setores, exceto no setor da construção, onde os instrumentos regulatórios são mais comuns.
- Estudos ex-ante vs. ex-post: Estudos ex ante superam substancialmente estudos ex post em documentos que analisam instrumentos econômicos, bem como estratégias e metas de governança. Por outro lado, para instrumentos regulatórios, instrumentos de informação e acordos, a proporção de estudos ex post e ex ante é quase igual.
- Disparidades geográficas: Os EUA e a China são os países mais estudados na literatura sobre instrumentos de política climática, mas a sua quota de emissões de GEE é consideravelmente maior. Quando o número de estudos é normalizado pelas emissões de GEE de cada país, o Reino Unido torna-se o país mais estudado em relação às suas emissões.
- Desequilíbrio entre atenção científica e densidade de políticas: A proporção de estudos para políticas é alta para os EUA e a China e particularmente baixa para a África. Isto sugere que pode haver lacunas de conhecimento substanciais sobre a política climática africana, enquanto os EUA e a China são altamente estudados dada a quantidade de políticas que têm promulgado.
- Descompasso entre instrumentos estudados e instrumentos implementados: A atenção científica às políticas de diferentes tipos pode corresponder, em maior ou menor grau, à quota de políticas de diferentes tipos de instrumentos em cada país. Uma maior divergência entre a atenção científica e a política pode indicar que as prioridades ou preferências dos cientistas e dos responsáveis pela formulação de políticas são divergentes. A quota de estudos que se concentram em instrumentos económicos é superior à quota de políticas que utilizam instrumentos económicos. Os instrumentos regulatórios são comparativamente menos estudados em todas as regiões.
- Cobertura setorial variável: Um grande número de documentos discute o setor de energia ou reduções de emissões intersetoriais. As quotas de artigos por setor foram semelhantes ou ligeiramente superiores à quota de emissões em todos os setores, com exceção da indústria, que representou uma parte das emissões globais de GEE, mas apenas uma parte da atenção científica e das políticas implementadas.
- Níveis de governança: O maior número de estudos examina as políticas a nível nacional, em vez de a nível subnacional ou supranacional/internacional.
Discussão: Implicações para a Pesquisa e a Política Climática
As descobertas do estudo têm implicações significativas para a pesquisa e a política climática. A identificação de lacunas de conhecimento, como a sub-representação da pesquisa sobre políticas no setor industrial, destaca áreas onde é necessário mais esforço. A comparação entre a atenção científica e a densidade de políticas revela potenciais descompassos entre as prioridades dos cientistas e dos formuladores de políticas.
Os autores argumentam que o mapeamento sistemático, especialmente o mapeamento sistemático assistido por computador, tem de desempenhar um papel crescente no processo científico para ajudar os investigadores, os decisores políticos e os processos de avaliação a manterem-se a par das evidências científicas a custos razoáveis. Os sucessos na automatização destes processos para mapas vivos, que poderiam manter uma imagem abrangente da literatura disponível à medida que é produzida, aumentariam ainda mais a utilidade dos esforços de mapeamento.
A disponibilização do mapa criado pelos autores como um recurso comunitário interativo e pesquisável online (https://climateliterature.org/#/project/policymap) é uma contribuição valiosa para a comunidade de pesquisa e para os formuladores de políticas. A intenção de aprimorar o valor desse recurso automatizando o processo de atualizações, tornando-o um mapa sistemático “vivo,” demonstra o compromisso dos autores em fornecer informações atualizadas e relevantes para apoiar a tomada de decisões informadas sobre políticas climáticas.
A identificação de uma potencial lacuna de síntese de evidências na literatura de instrumentos de política climática é uma descoberta importante. O preenchimento dessa lacuna de síntese de evidências apoiará o IPCC e outras avaliações climáticas e melhorará o aprendizado de políticas.
O artigo conclui enfatizando a importância de avaliações sistemáticas e abrangentes de soluções climáticas, dada a urgência de aumentar a ambição da política climática e colmatar a lacuna de implementação.
Limitações do Estudo
Os autores reconhecem algumas limitações do estudo, incluindo a possibilidade de erros nas previsões dos modelos de aprendizado de máquina, a definição restritiva de política climática, o foco em estudos indexados em inglês e a falta de avaliação da qualidade dos estudos. Apesar dessas limitações, os autores argumentam que o mapa é tão abrangente quanto possível e que as omissões ou diferenças na qualidade dos artigos não são sistemáticas, de forma que as principais conclusões sobre a distribuição da pesquisa em política climática e como isso se relaciona com a distribuição setorial e geográfica de políticas e emissões seriam substancialmente afetadas.
A escolha de realizar a busca na literatura apenas em inglês pode ter influenciado os resultados, especialmente em relação à representação de estudos de países não anglófonos. A literatura científica em outras línguas pode conter informações valiosas sobre políticas climáticas implementadas e seus impactos em diferentes contextos.
A dependência de títulos e resumos para a triagem e codificação manual pode ter levado à exclusão de estudos que abordam políticas climáticas em detalhes no corpo do artigo, mas não mencionam esses aspectos no título ou resumo.
Considerações Finais
O estudo de Callaghan et al. representa uma contribuição significativa para o campo da pesquisa em políticas climáticas, ao demonstrar o potencial do aprendizado de máquina para mapear e analisar a vasta literatura existente. As descobertas revelam desequilíbrios importantes entre a atenção científica, a densidade de políticas e as emissões, destacando áreas onde é necessário mais esforço para acelerar a mitigação das mudanças climáticas. O mapa sistemático “vivo” criado pelos autores é um recurso valioso para a comunidade de pesquisa e para os formuladores de políticas, que pode auxiliar na tomada de decisões informadas e no desenvolvimento de políticas climáticas mais eficazes. As lacunas identificadas, como a menor atenção dada ao setor industrial e a menor análise ex post de instrumentos econômicos, são importantes indicações de onde a pesquisa deve ser direcionada. Apesar de suas limitações, este estudo representa um avanço importante no sentido de tornar o aprendizado sobre políticas climáticas mais eficiente e direcionado, impulsionando a ação climática necessária para enfrentar os desafios das mudanças climáticas.