FAQ 9.1 | Werden Klimamodelle besser, und wie können wir das prüfen?

Klimamodelle sind außerordentlich komplizierte Computerprogramme, die unser Verständnis des Klimasystems zusammenführen und die komplexen Wechselwirkungen zwischen Atmophäre, Ozean, Landoberfläche, Schnee und Eis, dem globalen Ökosystem und einer Vielzahl chemischer und biologischer Prozesse mit der gegenwärtig höchsten erreichbaren Genauigkeit simulieren.

Die Komplexität von Klimamodellen – die Darstellung physikalischer Prozesse wie Wolken, Landoberflächenwechselwirkungen und die des globalen Kohlenstoff- und Schwefelkreislaufes in vielen Modellen – hat seit dem ersten IPCC-Sachstandsbericht 1990 erheblich zugenommen, sodass in diesem Sinne die gegenwärtigen Erdsystemmodelle weitaus “besser“ sind als die Modelle aus dieser Zeit. Diese Entwicklung hält seit dem vierten Sachstandsbericht an, aber auch andere Faktoren trugen zur Modellverbesserung bei. Leistungsfähigere Supercomputer ermöglichen die Auflösung feinerer räumlicher Details in den aktuellen Modellen. Die heutigen Modelle spiegeln auch das verbesserte Verständnis darüber wider, wie Klimaprozesse funktionieren – ein Verständnis, das aus der laufenden Forschung und Analyse sowie neuen und verbesserten Beobachtungen stammt.

Klimamodelle von heute sind im Prinzip besser als ihre Vorgänger. Jedoch führt jede hinzugefügte Komplexität, obwohl sie einen bestimmten Aspekt des simulierten Klimas verbessern soll, auch zu neuen möglichen Fehlerquellen (z. B. durch unsichere Parameter) und neuen Wechselwirkungen zwischen den Modellkomponenten. Diese können, wenn auch nur vorübergehend, die Simulation anderer Aspekte des Klimasystems in einem Modell verschlechtern. Außerdem bleibt trotz des erzielten Fortschritts eine wissenschaftliche Unsicherheit bezüglich der Details vieler Prozesse bestehen.

Ein wichtiger Aspekt besteht darin, dass die Leistungsfähigkeit von Modellen nur gegenüber vergangenen Beobachtungen beurteilt werden kann, wobei die natürliche interne Variabilität berücksichtigt werden muss. Damit Vertrauen in Zukunftsprojektionen solcher Modelle bestehen kann, muss das historische Klima – mit seiner Variabilität und seinen Veränderungen – gut simuliert werden. Die Modellbewertung hat, in Bezug auf Art und Menge vorhandener Beobachtungen, die Verfügbarkeit von besser abgestimmten Modellexperimenten und die ausgedehnte Anwendung verschiedenster Leistungskennziffern, wesentlich quantitativere Informationen über die Leistungsfähigkeit von Modellen zur Verfügung gestellt. Aber das alleine könnte nicht ausreichen. Während Wetter- und Jahreszeitenvorhersagen regelmäßig überprüft werden können, ist dies für Klimaprojektionen, die sich über eine Zeitspanne von einem Jahrhundert oder mehr erstrecken, nicht möglich. Dies gilt besonders, da der anthropogene Antrieb das Klimasystem in Richtung von Zuständen verschiebt, wie sie seit Beginn der instrumentellen Messungen noch nie beobachtet wurden, und dies wird immer eine Einschränkung bleiben.

Modellleistungsfähigkeit zu quantifizieren ist ein Thema, das in allen vorangehenden IPCC-Berichten von Arbeitsgruppe I eine Rolle spielte. Liest man diese früheren Bewertungen, erhält man ein allgemeines Gefühl für die bereits erzielten Fortschritte. Vergangene Gutachten lieferten typischerweise einen eher breiten Überblick über Modellleistungsfähigkeiten, indem sie Unterschiede zwischen den modellberechneten Versionen verschiedener Klimagrößen und entsprechenden beobachtungsbasierten Abschätzungen aufzeigten.

Zwangsläufig erzielen manche Modelle bei bestimmten Klimavariablen bessere Ergebnisse als andere, aber kein einzelnes Modell erweist sich eindeutig als das insgesamt „Beste“. In letzter Zeit gab es Fortschritte darin, verschiedene Leistungskenngrößen zu berechnen, die die Leistungsfähigkeit der Modelle gegenüber einer Spannbreite verschiedener Beobachtungen anhand einfacher numerischer Bewertungskennziffern zusammenfassen. Natürlich sind die Definition einer solchen Bewertungskennziffer und ihre Berechnungsvorschrift ebenso wie die Auswahl der benutzten Beobachtungen (die ihre eigenen Unsicherheiten haben) und die Art und Weise, in der die verschiedenen Bewertungskennziffern kombiniert werden, allesamt von Bedeutung und beeinflussen letztendlich das Endergebnis. Trotzdem kann man verschiedene Modellgenerationen miteinander vergleichen, wenn die Kenngrößen konsistent berechnet werden. Die Ergebnisse solcher Vergleiche zeigen im Allgemeinen, dass, obwohl jede Generation eine Spannbreite verschiedener Leistungsfähigkeiten aufweist, der durchschnittliche Index der Modellleistungsfähigkeit sich von Generation zu Generation stetig verbessert hat. Ein Beispiel für Änderungen der Modellleistungsfähigkeit im Laufe der Zeit ist in FAQ 9.1, Abbildung 1, dargestellt und veranschaulicht die anhaltenden, wenn auch bescheidenen Verbesserungen. Es ist interessant festzustellen, dass sowohl die Modelle mit der besten als auch die mit der schlechtesten Leistungsfähigkeit Verbesserungen zeigen, und dass diese Verbesserungen mit zunehmender Modellkomplexität und der Beseitigung künstlicher Anpassungen an Atmosphäre-Ozean-Kopplung (so genannte “Flussanpassung“) einhergehen. Zu den Gründen für diese Verbesserung gehören das verbesserte Verständnis verschiedener Klimaprozesse und eine bessere Darstellung dieser Prozesse in Klimamodellen. Umfangreichere Erdsystembeobachtungen tragen ebenfalls zu Verbesserungen bei.

Also werden Klimamodelle tatsächlich besser, und wir können dies durch quantitative Leistungsmessungen anhand historischer Beobachtungen aufzeigen. Obwohl zukünftige Klimaprojektionen nicht direkt bewertet werden können, basieren Klimamodelle zu großen Teilen auf überprüfbaren physikalischen Prinzipien und sind in der Lage, viele wichtige Aspekte vergangener Reaktionen auf externe Antriebsfaktoren zu reproduzieren. Auf diese Weise bieten sie eine wissenschaftlich fundierte Vorschau auf die Klimawirkung verschiedener Szenarien anthropogener Antriebe.

FAQ 9.1, Abbildung 1 | Fähigkeit von Modellen, jährliche Durchschnittstemperaturen und Niederschlagsmuster zu simulieren, veranschaulicht durch Ergebnisse der drei letzten Stufen des „Gekoppelten Modellvergleichsprojekts“ (Coupled Model Intercomparison Project, CMIP) (CMIP2, Modelle aus den Jahren um 2000; CMIP3, Modelle aus den Jahren um 2005; und CMIP5, die aktuelle Modellgeneration). Die Abbildung zeigt die Korrelation (ein Maß für die Ähnlichkeit von Mustern) zwischen beobachteten und modellierten Temperatur- (oben) und Niederschlagswerten (unten). Größere Werte zeigen eine bessere Übereinstimmung von modellierten und beobachteten räumlichen Mustern. Die schwarzen Symbole kennzeichnen den Korrelationskoeffizienten einzelner Modelle, während die großen grünen Symbole den Median anzeigen (d. h. die Hälfte der Modellergebnisse liegt jeweils über und unter diesem Wert). Verbesserungen der Modellleistungsfähigkeit werden durch den Anstieg der Korrelation aufeinanderfolgender Modellgenerationen ersichtlich.