User Tools

Site Tools


wac:dataprocessing:intro

Climate Data Processing

Das Prozessieren von Modelldaten aus aktuellen gekoppelten 3D Atmosphärenmodellen ist in vielerlei Hinsicht eine Herausforderung. Welche die besten Werkzeuge hierfür sind ist nicht einfach zu beantworten. Es ist natürlich auch ein bisschen von der Vorliebe abhängig. Alle Software-Tools und Programmier/Skript-Sprachen haben ihre Stärken und Schwächen. Bei der Datenverarbeitung von wirklich großen Datensätzen (TB++), einer Unzahl einzelner Dateien in verschiedensten Dateiformaten ist die Empfehlung des einen optimalen Werkzeugs/Sprache ziemlich unsinnig. Der Normalfall ist ein recht wilder Verhau von Software-Tools und Sprachen, die natürlich wieder von persönlichen Vorlieben abhängig sind.

Folgt man Dennis Shea 1) und bringt ein bisschen Ordnung ins Angebot, so kann man die (Klimadaten)verarbeitung nicht unerwartet in die drei Komponenten Daten/Datei-Handling, Datenmanipulation und Berechnungen und Visualisierung gegliedert werden. Die verfügbaren methodischen Werkzeuge können wiederum in verschiedene Kategorien gegliedert werden:

  1. Compiler Sprachen (zB., Fortran, C, C++)
  2. Kommandozeilen Operatoren (NCO, CDO, NCview)
  3. Shell und Interpreter Sprachen (NCL, GrADS, Ferret, R,Python (CDAT, PyNIO, PyNGL, Numpy, matplotlib) sowie kommerziell Matlab und IDL

Alle haben wie gesagt ihre Vor und Nachteile:

Compiler-Sprachen sind i.d.R. signifikant schneller als Interpreter-Sprachen und so für die enormen Datenmengen effizienter. So sind Wettervorhersage- und Klimamodelle nach wie vor häufig in Fortran geschrieben. Die zentralen Nachteile sind ihre höhere Komplexität fehlende Formatunterstützung, fehlende highlevel Bibliotheken zur Auswertung von Klimadaten und aufwändige Entwicklung.

Befehlszeilen Operatoren (CLOs) sind Werkzeuge, die aus der shell ausgeführt werden. Die wichtigsten sind NCO und CDO. Diese Operatoren führen hocheffizient spezielle Aufgabe durch, etwa Mittelwerte ausgewählter Variablen.

Interpreter-Sprachen sind Allzweck-Werkzeuge in der Datenverarbeitung, GIS Fernerkundung usw. Sie haben viele eingebaute Funktionalität unterstützen Visualisierung Datenformate etc. Allerdings erfordern Sie nach wie vor erheblichen Programmieraufwand (ebd. 2) ).

Sehr viele Operationen können mit den CLO durchgeführt werden und diese sind immer zu bevorzugen weil sie validiert und sehr schnell sind. Alle Batch-Abläufe und -Prozesse können über die shell, R oder Python je nach Situation und know how gesteuert werden. Gleichzeitig ermöglichen R und Python eine extrem leistungsfähige Möglichkeit etwa fehlende Analysen oder eine spezielle Visualisierungsfunktionalität zu erstellen.

auf diesen Seiten wird für die Auswertung der Modelldaten eine bunte Mischung genutzt. Entsprechend dem zuvor gesagten wird viel in der Shell mit der zusätzlichen Hilfe von Python R und den CLOs erledigt. Hierzu ist jedoch einiges an Installationsarbeit auf einem Linuxsystem notwendig. Vornehmlich die Kompilierung der CDO das Einrichten von opengrads und NCL/NCAR je nach Linux ein bisschen Bastelarbeit.

Steht das System ist es allerdings vergleichsweise einfach komplexe Auswertungen und Analysen durchzuführen. Nachfolgend werden einige Howtos die Grundlagen erläutern.

2)
Shea, Dennis & National Center for Atmospheric Research Staff (Eds). Last modified 28 Aug 2013. “The Climate Data Guide: Overview: Climate Data Processing.” Retrieved from https://climatedataguide.ucar.edu/climate-data-tools-and-analysis/climate-data-processing-software
wac/dataprocessing/intro.txt · Last modified: 2015/11/06 18:51 (external edit)