HGF-Arbeitsgruppe Umweltdatenmanagement
HOME
UP
Protokoll der 10. Sitzung am 4./5. Mai 1998 in Potsdam (PIK)
Teilnehmer:
M.Flechsig (PIK Potsdam),
J.Hofmann (AWI Bremerhaven),
F.Hosenfeld (PZOe Kiel),
K.Kramer (PIK Potsdam),
H.Krasemann (GKSS Geesthacht),
M.Lautenschlager (DKRZ Hamburg),
F.Lochter (GFZ Potsdam),
H.-J. Lotz-Iwen (DLR/DFD Oberpfaffenhofen),
A.Mueller (UFZ Halle-Leipzig),
J.D.Schladot (FZ Juelich),
H.Thiemann (DKRZ Hamburg),
F.Toussaint (PIK Potsdam),
M.Wrobel (PIK Potsdam)
Absagen:
M.Reinke (AWI Bremerhaven),
W.Sinowski (GSF Neuherberg),
B.Spiegelhalder (DKFZ Heidelberg)
Tagesordnung
TOP1 : Begruessung, Organisatorisches, kurze Vorstellung des Instituts
TOP2 : Annahme der Agenda, Protokoll der 9. Sitzung (Dez.1997)
TOP2A: Berichte aus den Forschungszentren
TOP3 : Strukturelles: ZUDIS; Rolle und Etablierung der AG in der HGF; Web-Server der HGF-AG
TOP4 : Standards Metainformationen (DIF, FGDC, ISO/TC211, Z39.50, SDTS)
TOP5 : Vorstellung von Web-/Metadaten-Projekten an PIK (CERA und Web-Applet) und GKSS (LOTSE); jeweils mit Vorfuehrung.
TOP6 : HGF-Suchmaschine zu Umweltinformationen (H. Krasemann)
TOP6A: Fuehrung durch die Rechnerraeume des PIK (K. Kramer)
TOP7 : Uebertragbarkeit/zentrale Bereitstellung von www-Oberflaechen; Zusammenarbeit allgemein
TOP8 : Verschiedenes
Ablaufprotokoll
TOP1: Begruessung, Organisatorisches
Vorstellung der Teilnehmer; Protokollfuehrung: FT; kurze Vorstellung des PIK; kuenftig sollte vermehrt ueber Netz kommuniziert werden (Tagungsvorbereitungen, -protokolle).
TOP2: Agenda, Protokoll der 9. Sitzung (Dez.1997)
Annahme der Agenda mit leichten Abaenderungen; Annahme des Protokolls der 9. Sitzung
TOP2A: Berichte aus den Forschungszentren
2A.1 AWI
Das geologisch/geophysikalische Informationssystem PANGAEA (PaleoNetwork for Geological and Environmental Data) ist seit
kurzem unter der eigenen Domain http://www.pangaea.de/ im Internet zu erreichen.
Die Neugestaltung des AWI-WWW-Server (http://www.awi-bremerhaven.de/) wurde abgeschlossen.
Die Webseiten praesentieren sich seitdem in einem einheitlichen Look. Der Informationsumfang wurde erweitert und neu gegliedert.
2A.2 DKRZ
Das DKRZ befindet sich in einer Phase der Umstrukturierung. Diese Phase soll auf 1998 beschraenkt bleiben. Es ist geplant, den
wissenschaftlichen Bereich, der sich mit Klimamodellen und -daten befasst, abzuspalten und mit sehr aehnlichem Aufgabenprofil an der
GKSS anzusiedeln. Es ist eine personelle Verstaerkung speziell im Bereich des Datenmanagements geplant. Die Langfristdatenhaltung fuer
Klimamodelldaten und verwandte Daten aus dem Bereich der Instrumentenbeobachtung soll abgesichert werden. Der Uebergang ist
fuer Anfang 1999 geplant. Waehrend der Laufzeit des Ueberleitungsprojekts (diskutiert: 5 - 10 Jahre) wird der Arbeitsrahmen
der Gruppe durch einen Kontrollausschuss bestimmt. Formale Beschluesse von Seiten der GKSS und des DKRZ existieren dazu bisher
nicht, entsprechende Projektvorschlaege fuer die Ueberleitung befinden sich in der Phase der Begutachtung.
Gemeinsam mit AWI und PIK wurde ausgehend von CERA 1 (Datenmodell des DKRZ) das CERA 2 - Datenmodell entwickelt. Eine
Dokumentation befindet sich in Arbeit.
2A.3 DLR
Das Datenarchivsystem und auch die Web-Pages des DFD werden derzeit von Grund auf neu konfiguriert.
Die existierende Nutzerschnittstelle GISIS wird aber noch bis ca. 2002 weiter betrieben. Allerdings erfolgt eine Portierung
des Interface auf WWW noch in diesem Sommer (modifizierter NASA-IMS-Server). Der ISIS Thesaurus wurde bereits web-fähig gemacht
und kann getestet werden: http://isis.dlr.de/thesaurus.
Ab 1999 wird schrittweise der Übergang auf das neue DIMS-System erfolgen. Dieses basiert auf dem Grau-Abba/2 Robot Archiv
mit Hierarchical Storage Management Software, Oracle bzw. Informix als DB-Software und dem CIP Standard für die Katalog
Interoperabilität mit anderen Archiven. Das Datenmodell (Product Library) deckt nicht nur die reinen Archivanforderungen (Eingabe,
Speicherung, Zugriff) ab, sondern auch die Produktgenerierung und Operations Control innerhalb des Archivs. Als Nutzerschnittstelle
wird das MUIS release 1C der ESA zum Einsatz kommen, das wesentlich vom DFD mitspezifiziert wird.
Ab Ende 1999 wird das DFD über Landsat-7 daten aus eigenem Empfang und auch über digitale Höhendaten aus der Shuttle Radar
Terrain Mapping Mission SRTM verfügen. Die Abgabekonditionen werden derzeit noch verhandelt.
2A.4 FZJ
Nachdem der Wissenschaftsrat mit seinen Empfehlungen den Rahmen fuer die Umbildung der Umweltinstitute vorgegeben hatte, ist jetzt vom Umweltbeirat und einer ausgewählten Struktur-Kommission ein Konzept fuer ein neues Umwelt-Department vorgelegt. Da bis zum Jahr 2001 sechs von sieben Institutsleitern im Umweltbereich ausscheiden, wurde durch die Struktur-Kommission die Schliessung von sechs Instituten beschlossen. Gleichzeitig werden vier neue Umweltinstitute gegruendet.
Das neue Umwelt-Department des FZ-Juelich setzt sich zusammen aus den Instituten: Stratosphaere, Phytosphaere, Agrosphaere, sedimentäre Becken. Es hat in Zukunft den Namen: Institut fuer Chemeie und Dynamik der Geosphaere.
Wir hoffen, dass auch fuer unsere Aufgabe einige Erleichterungen eintreten; insofern, dass die Daten im Umweltbereich in Zukunft gebuendelt zusammenfliessen koennen.
2A.5 GFZ
Das Daten- und Rechenzentrum des GFZ versteht sich als Kompetenzzentrum innerhalb des GFZ beim Aufbau und der Entwicklung der
IT-Infrastruktur. Neben einem Robot-System zur Archivierung von Massendaten werden vor allem WWW-Applikationen in Kooperation
mit internen und externen Partnern erarbeitet. Schwerpunkte sind dabei Thesauri (thematisch, regional), Haltung, Import, Recherche
und Visualisierung raumbezogener Information in thematischen Karten (2D) und Virtuelle Welten (3D). Die einzelnen Projekte sind über:
http://dc.gfz-potsdam.de/dc/ zugreifbar. Im Rahmen von ICDP wird ein Clearinghouse
( http://icdp.gfz-potsdam.de/ch/) erarbeitet.
Es werden als Datenbanken Sybase und MSQL betrieben. Ein nach einem Sicherheitskonzept gestaffeltes System von WWW-Servern dient der
Applikationsentwicklung und der Präsentation der Daten im WWW. Als Standards werden HTML, VRML für die Visualisierung und DIF für den
Import von Metadaten benutzt.
2A.6 GKSS
hat nach wie vor eine heterogene Datenlage für Daten mit Umweltbezug. Nur ein sehr kleiner Teil der Daten ist strukturiert
in einer Datenbank, wobei ehemalige DB2-Systeme nach Oracle migrierten, eine ganze Reihe liegt in wenig dokumentierten aber
GKSS-allgemein zugänglichen Dateien auf Fileservern aber auch noch recht viel in nur den beteiligten Wissenschaftlern bekannter
Form und Quelle.
Seit Anfang des Jahres steht mit dem LOTSEn ein Werkzeug zur Verfügung,
um die Daten einzelner Projekte auch für andere wiederfindbar zu machen. Die geplante größere Nähe zur DKRZ
Modell- und Datengruppe wird, so ist die Hoffnung, in Zukunft einige Synergieeffekte bringen.
2A.7 PIK
Am PIK wurde Installation von CERA 2.0 abgeschlossen und mit der Anwendung begonnen; die bisherige html-Website zur Intranet-Abfrage der (Meta-)Datenbanken wurde prototypisch durch ein JAVA-Applet ersetzt (vgl. die Ausfuehrungen unter 5.1 und 5.2).
2A.8 PZOe
Das Oekologische Informationssysten KERIS
(http://www.pz-oekosys.uni-kiel.de/keris/) wird weiterentwickelt. Zukuenftig
sollen Simulationsmodelle staerker in das Informationssystem eingebunden werden. Bisher ist nur deren Dokumentation aufgenommen.
Zur Navigation wird neben dem zentralen Hierarchischen Thesaurus ein weiteres Instrument entwickelt, das auf einem Matrizensystem zur
Repraesentation oekosystemarer Stoff- und Energiefluesse (Interaktionen) beruht.
Im Bereich WWW ist eine wachsende Nachfrage zu beobachten. In Zukunft sollen weitere Entwicklungen auf der Basis von Java erfolgen.
2A.9 UFZ
In der Sektion Gewässerforschung in Magdeburg gibt es ein Metainformationssystem. Die Adresse ist
http://ifgsun1.gm.ufz.de:8000/.
In Arbeit ist ein Informationssystem in der Zweigstelle Bad Lauchstädt und vorbereitet wird das Metainformationssystem in
Leipzig. In allen Fällen wird als Datenbank Oracle eingesetzt. Alle drei Informationssysteme wurden bzw. werden in Zusammenarbeit
mit der Firma NOELL-Umweltdienste erstellt. Geplant ist dann auch die Anbindung aller drei Metainformationssysteme ans WWW.
TOP3: Strukturelles: ZUDIS; Rolle und Etablierung der AG in der HGF; Web-Server der HGF-AG
3.1: ZUDIS
ZUDIS laeuft am FZK ohne Pflege weiter. Die Pflege kann von anderen Zentren z.Zt. nicht uebernommen werden. ML entwirft eine Stellungnahme der AG als Brief an Prof. M. Popp (Vorsitzender des FZK und Vorsitzender des Lenkungsausschusses des HGF-Forschungsverbundes Umwelt) mit der Bitte um Pruefung, ob weitere Datenpflege im Bereich ZUDIS durchgefuehrt werden kann.
3.2: Rolle der AG in der HGF
Hauptaufgaben bleiben Meinungs- und Erfahrungsaustausch sowie Initiierung von Kooperationen. Die AG ist in HGF-Veroeffentlichungen z.Zt. nicht als solche bekannt (vgl. http://www.helmholtz.de/arbeitsformen/arbeitskreise/). HL schreibt in diesem Sinne an die Bonner Zentrale.
3.3: WebServer der AG
Die Webseiten der AG werden von der HGF-Homepage aus klickbar gemacht. Unterhalb der AG-Eingangsseite sind 6 Bereiche geplant:
- Beschreibung der AG Umweltdatenmanagement (physisch bei DLR)
- Zugang zu Informationssystemen mit Umweltdaten (physisch bei DLR), incl. Suchmaschine (physisch bei GKSS)
- Empfehlungen zur Datenhaltung (physisch bei DLR)
- Informationen zur Zusammenarbeit der Zentren im Bereich Umweltdatenmanagement (ab ca. 1.7.98 physisch bei GFZ unter http://dc.gfz-potsdam.de/hgf). Von hier URLs zu zugehoerigen Webseiten der Zentren mit Programmodulen, Thesauri, Datensammlungen; die Tabelle soll zum Lesen allgemein offen sein und zum Schreiben von den Zentren mit Passwort editierbar.
- Informationen zur naechsten Sitzung der AG (physisch bei DLR)
- Sitzungsprotokolle (nicht klickbar, versteckt, physisch bei DLR)
TOP4: Standards f. Metainformationen (DIF, FGDC, ISO/TC211, Z39.50, SDTS) (MR)
Wg. Krankheit entfallen; verschoben auf die naechste Sitzung.
TOP5: Vorstellung von Web-/Metadaten-Projekten
5.1: Die CERA-Datenbank-Struktur von AWI, DKRZ, PIK (FT)
Motivation raeumlich verteilter Metadaten:
Kopplung der institutsinternen DB zur gegenseitigen Datennutzung;
weniger Aufwand fuer Oberflaechen, Tools, Pflege; Vermeidung von Parallelentwicklungen;
Problem: extrem inhomogene, unterschiedlich strukturierte Daten an den verschiedenen Lokationen.
Anforderungen:
gemeinsamer, transparenter Zugriff auf Datenbestaende aller beteiligten Institute;
hoechste Flexibilitaet fuer Geodaten aller Art;
strukturelle Offenheit und -soweit moeglich- Einfachheit;
Kompatibilitaet zu Datenstandards (NASA-DIF, FGDC-CSDGM etc.) und funktionalen Standards (IEEE etc.).
Historie:
Abwaegung objektorientierte vs. relationale DB zugunsten relationaler (weil Systeme weiter entwickelt, besser handhabbar);
CERA = Climate and Environmental Data Retrieval and Archive;
CERA1 - Federfuehrung und Implementation im DKRZ;
Verwendung fuer Modelloutput;
Praxiseinsatz in verschiedenen Bereichen des DKRZ;
... mit verschiedenen grafischen Oberflaechen unter ORACLE Forms;
Problem: zu nahe an die Beduerfnisse des DKRZ (Modellrechnungen) angelehnt.
Umsetzung CERA2:
beteiligt: PIK (Federfuehrung), DKRZ, AWI, anfangs FZK, mit sehr unterschiedlichen Datenstrukturen;
Entwurf - Implementierung - ergaenzende Planungen (Module): Mai bis Dezember 1997;
Beschreibung und Nutzerdiskussion im Web;
Aufgliederung in Kernbereich (coreCERA = 58 Tabellen), Module fuer spezielle Installationen und lokale Erweiterungen.
CERA-Kernbereich: coreCERA:
Aufteilung von coreCERA in 8 Bloecke (nicht unter relationenalgebraischen sondern unter inhaltlichen Gesichtspunkten; Diagramm);
Uebersicht der Tabellen (Diagramm);
zahlreiche Wertetabellen zur vereinfachten Handhabung ueber Pull-Down-Menues.
Die Module:
Modul DATA_ORGANIZATION (Diagramm)
beschreibt die strukturelle Zuordnung der Daten zur 4-dimensionalen Raumzeit (z.B. Beschreibung der Achsen);
Modul DATA_ACCESS (Diagramm)
enthaelt Informationen fuer automatisierten Zugriff.
Installation:
DDL-SQL und SQL-tools im Web frei verfuegbar;
Befuellungsroutinen und Ladetabellen gehoeren zu einer input-Zwischenschicht, die eine Plausibilitaetskontrolle der Daten vor ihrer endgueltigen Eingabe ermoeglicht (Diagramm);
FORMS-Oberflaechen existieren zum Laden, Abfragen und Aendern;
Routinen fuer Datenexport in Normformaten (NASA-DIF, FGDC-CSDGM) am AWI.
Ausblick, Plaene:
Direktzugriff auf Daten von der Meta-Datenbank aus;
offene Weiterentwicklung (Module);
Pflege durch PIK und DKRZ mit gelegentlichen Nutzertreffen;
Beschreibung erscheint als DKRZ Technical Report (paper) und wird in den PIK-Webseiten veroeffentlicht;
Workshop-WebPage der Entwickler ist oeffentlich.
5.2: Das Web-GUI des PIK, mit Vorfuehrung (MW)
Motivation:
flexible Abfrage fuer >3 Geo(Meta)DB;
flexible Ausgabe fuer >3 Geo(Meta)DB;
Anforderungen:
netzwerkfaehig (Inter-/Intranet) und plattformunabhängig;
anwenderfreundlich fuer Nicht-Informatiker;
graphisch-interaktiv und ausbaufaehig;
pflegeleicht auch nach Wegfall der Projektstellen.
Historie:
1996: dynamisches HTML zur Meta-DB-Abfrage (ORACLE-PL/SQL); laeuft am PIK.
Umsetzung:
Programmiersprache JAVA;
Aufsetzen auf ORACLE DBMS ueber JDBC;
Struktur- und Layoutinformation der JAVA-Oberflaeche ist vollstaendig in der Datenbank.
Eigenschaften:
Anbindung weiterer DB ohne Reprogrammierung;
Aenderungen an den DB-Strukturen ohne Reprogrammierung;
Konfiguration der Abfrageoberflaechen ohne Reprogrammierung;
Flexible Anfrageerstellung (thematisch, raumbezogen, zeitbezogen, viele weitere) sowie Kombinierbarkeit der Eingaben;
Eingabekontrollen und Nutzerführung;
Interaktive Ergebnisausgabe.
Digital Java Atlas:
Raumauswahl ueber interaktiven digitalen Atlas (erlaubt Navigation, Zooming, Selektion ueber Mausklick oder Gummiband, Feedback (interaktive Ausgabe von bspw. Laendernamen und geographische Koordinaten);
Interaktive Darstellung von Metadaten im digitalen Atlas (z.B. Zeitreihen-Messstationen);
Anbindung an Visualisierungskomponente fuer Zeitreihen-Daten.
Ausblick:
weniger Layout-Einschraenkungen;
direkter Uebergang von Abfrageergebnissen der Metadatenbank auf die eigentlichen Datenbanken;
Kopplung der beteiligten Institue;
Ausbau der Geodaten-Visualisierung;
ASCII-Data Retrieval (via PL/SQL und ftp);
Beschreibung erscheint als PIK Report (paper-version) und wird in den PIK-Webseiten veroeffentlicht.
5.3: LOTSE (= Land Ocean Thematic Search Engine) am GKSS, mit Vorfuehrung (HK)
Motivation:
Daten und Projekte wiederfinden, vorhandene Systeme nutzen, wenig Arbeit in Beschreibung.
Anforderungen:
webbasiert, damit plattformunabhängig und anwenderfreundlich fuer sporadische Nutzer;
pflegeleicht besonders nach Ende der Entwicklungsphase, für Datensuche. -retrieval und (Metadaten-) -eingabe.
Historie:
1992-1995 LOTSE auf MVS oder verteilt aber nur für den Datenbestand in WADABA (verteiltes WATiS);
ab 96 web-basierte Lösung mit Verweisen auch außerhalb der WADABA, konzeptionelle Einbeziehung anderer Dienste.
Umsetzung (Version97):
dynamische HTML-Seiten mit perl-routinen;
backend-programm zur Kommunikation mit ORACLE DBMS in C. Einzelne Grafik- bzw. Downloadpakete in Java mit JDBC.
Eigenschaften:
3 integrierte Pakete zum Data-search, -retrieval und -input;
Projekt (Datenpaket) orientierte Struktur für Suche, Retrieval und Eingabe;
offen für verschiedenste Arbeitsbereiche, flexibel für verschieden intensive Beschreibung der Projekte/Datenpakete;
layered meta data;
automatische Generierung von statischen html Seiten mit Metainformation;
Integration von Standard-Suchmaschinen (Harvester) lokal wie web-weit;
Verweis von Metadaten zu Orginaldaten über web-links und/oder zu zunächst einer Datenbank (WADABA);
Datenbeschreibung und Download realisiert;
Zugriffssicherung per Nutzerkennung mit Paßwort realisiert;
Paßwortübertragung per https (apache ssl-server) mit anschließendem session key (1 Tag gültig);
Nutzer in Rollenkonzept integriert mit unterschiedlichen Autorisierungen für Lesen und Schreiben der verschiedenen Projekte/Datenpakete;
Kurzbeschreibung ist unter http://w3g.gkss.de/lotse/documentation/overview_hgf zu finden, eine ausführliche im Rahmen der Diplomarbeit von Norman Wolff: http://w3g.gkss.de/lotse/documentation/dipl_arbeit_norman_wolff/.
Ausblick:
Zusammenspiel mit anderen Suchmaschinen, siehe auch TOP 6 .
in der nächsten Entwicklungsphase Einbau einer soliden Middleware (CORBA);
Verbindung zu verschieden Diensten und Datenquellen (Klimadaten über CERA, Trilaterales Wattenmeermonitoring, Satellitenbildarchive
(GKSS-seitig) , ...).
TOP6: HGF-Suchmaschine zu Umweltinformationen (HK)
Über Suchmaschinen, die bereits über das Web laufen, sind viele Seiten zu Umweltdaten der HGF-Zentren bereits erfaßt.
Das Problem für Suchende ist, daß die relevante Information häufig schwer herauszufinden ist. Es wurde deshalb von
HK(GKSS) vorgeschlagen, eine HGF-Suchmaschine, die nur auf indizierte Umweltdaten der entsprechenden HGF-Zentren und
Partner-Institute verweist, anzulegen. Dies könnte bei GKSS geschehen. Dafür müssen die einzelnen Zentren eine Liste
ihrer einzubeziehenden Web-Seiten zur Verfuegung stellen. Diese Liste muß von den einzelnen Zentren in eigener Verantwortung
aktuell gehalten werden. Ein html-Formular dazu könnte geschrieben werden.
Eine ähnliche Suchmaschine mit etwas anderer Zielsetzung existiert bereits am DKRZ aus einem DFN-Projekt.
ML und HK machen Vorschlag zur Umsetzung.
TOP7: Uebertragbarkeit/zentrale Bereitstellung von www-Oberflaechen; Zusammenarbeit allgemein
7.1: Zusammenarbeit allgemein
Zur Vermeidung von Parallelentwicklungen wird die von den Zentren editierbare WebSeite am GFZ eingerichtet (s. TOP 3.3). Dort sollen die vorhandenen Thesauri, Programmodule und sonstiges mit Kurzbeschreibung klickbar sein. Dadurch koennen sich Institute mit gleichen Interessen zusammenfinden.
7.2: Erstellung eines Web-GUI zur Darstellung mehrdimensionaler Daten
Am DKRZ wird eine Mailgruppe eingerichtet (HT) zum Austausch in diesem Bereich. FL weist auf neuen Standard zur web-Uebertragung von Vektorgrafiken hin (ueber http://www.gfz-potsdam.de/~marco/bsp/standard). AWI, DKRZ, GFZ und PIK bemuehen sich bis zum naechsten Treffen um Abklaerung der evtl. verwendbaren PD-tools und um einen "Vorentwurf" zur Erstellung gemeinsamer WebTools. DLR und PZOe haben ebenfalls Interesse, jedoch z.Zt. noch weniger konkret.
7.3: Bestehendes Web-GUI zur DB-Abfrage am PIK
Das Grafische User Interface zur DB-Abfrage ist JAVA-basiert und dockt an JDBC an. Damit ist es fuer die meisten DB verwendbar. Es ist ueber eine Tabelle der entsprechenden DB konfigurierbar (Beschreibung siehe unter 5.2). Bei Interesse bitte Kontakt aufnehmen zu MW, PIK.
TOP8: Verschiedenes
8.1: Vorfuehrung von Thesauri und Thesaurus-Web-GUI
DLR (HL, schon vortags), siehe http://isis.dlr.de/thesaurus/index.html.
GFZ (FL und H.Palm), siehe http://dc.gfz-potsdam.de/thesaurus.
8.2: Partner-Institute
Da DKRZ, PIK und PZOe nicht zur HGF gehoeren, sollen sie im Rahmen der AG als "Partner-Institute" bezeichnet werden.
8.3: Naechstes Treffen
In Bonn bei der HGF am Montag, 23.11. 13:00-18:00 und Dienstag, 24.11. 09:00-12:00.
Adresse: Wissenschaftszentrum, HGF; Ahrstrasse 45; 53175 Bonn
Go to top of document.
Pages are optimized for NETSCAPE.
For comments and suggestions contact
Frank Toussaint
Last change: Thu Jun 4 15:02:53 NFT 1998