| deutscher Projekttitel | Big Earth Data für KI |
| englischer Projekttitel | Big Earth Data for AI |
| Name | Peter Baumann |
| Organisation | rasdaman GmbH |
| Adresse | Hans-Hermann-Sieling-Str. 17 |
| E-Mail (optional) | baumann@rasdaman.com |
| Telefon (optional) | 01735837882 |
| Website (falls vorhanden) | www.rasdaman.com |
Kurzfassung
Ziel des Vorhabens ist die Erstellung einer DIN-SPEC für die interoperable Repräsentation von „Big Earth Data“, insbesondere raum-zeitliche „Datenwürfel“ (Datacubes), als Grundlage für Web-basierte Geo-Dienste und besser skalierende KI-Methoden. Dies betrifft u.a. optische und radar-basierte Satellitendaten und Satellitenbild-Zeitreihen, Wetter- und Klimadaten, Höhenmodelle, und viele weitere.
Hierzu existiert bereits ISO 19123-2, die jedoch nicht mehr dem Stand der Technik entspricht. ISO TC211 WG6 plant daher eine Revision von 19123-2 und hat Peter Baumann, CEO der antragstellenden rasdaman GmbH, als Projektleiter bestellt.
Der vorliegende Antrag schlägt vor, daß rasdaman GmbH die entsprechende DIN-SPEC erstellt und diese dann vom DIN-Spiegelgremium als ISO IWD (Initial Working Draft) vorgeschlagen wird. Aufgrund der langjährigen internationalen Standardisierungs-Erfahrung, der einschlägigen Vorarbeiten sowie der engen Zusammenarbeit mit den ISO und OGC Experten kann davon ausgegangen werden, dass diese DIN-SPEC i.w. unverändert als ISO-Standard übernommen werden wird.
Zur Einreichung der DIN SPEC sollen noch zwei weitere Partner gewonnen werden, vorzugsweise aus dem Kreis der internationalen Coverage-Standardisierungs-Experten. Die konkrete Auswahl ergibt sich jedoch erst im Lauf des Projekts. Inoffiziell wird ein internationales Netzwerk konsultiert werden, bestehend aus ISO TC211, OGC und weiteren Experten. Daraus können später Projektpartner gewonnen werden, sowohl national als auch international. Kandidaten sind:
Graham Wilkes, ISO TC211 WG6 Convener, Canada
Douglas O’Brien, ISO TC211 WG6 Convener emeritus, Canada
Emmanuel Devys, IGN France und DGIWG, France
Vlad Merticariu, Jacobs University, Bremen, Germany
Bitte beschreiben Sie an dieser Stelle die Ausgangslage der von Ihnen eingereichten Idee. Stellen Sie bitte den Bedarf dar: Welche Situation liegt aktuell wie vor? Welche Lösungen existieren derzeit für welche Marktteilnehmer*innen? Welche Bedarfe liegen bei welchen Marktteilnehmern*innen vor? Weshalb sind diese Lösungen nicht hinreichend genug? Was ist der Stand der Technik? Welche themenverwandten Standards, technische Regeln, Normenausschüsse, Gremien, Foren und Konsortien sind Ihnen bekannt bzw. existieren bereits? Handelt es sich um eine Anschubförderung? (identisch zu OGC CIS 1.0)
Geodaten, insbesondere Geo-Rasterdaten, sind hochkomplex. Dies liegt einerseits an der großen Vielfalt (etwa 1D Sensordaten, 2D Satellitendaten, 3D Satellitenbild-Zeitreihen, 4D Klimadaten, etc.), andererseits aber auch an der Vielzahl unterschiedlicher "gewachsener" Lösungen, welche sehr verschieden und in aller Regel nicht interoperabel sind. Sehr oft wird für einen Datendienst gleichzeitig der zu benutzende Client mitgeliefert, und der Client von Dienst A kann nicht an Dienst B ankoppeln. Dies bringt eine hohe Hürde in der Nutzung mit sich, und selbst für Experten gestaltet sich die Auswertung langwierig und aufwändig. Dies bedeutet, daß viele Auswertungen derzeit nicht stattfinden, daß Auswertungen nur auf begrenzten Datenvolumina stattfinden können - beispielsweise auf einem einzigen Satellitenbild von 100x100 km statt auf einem ganzen Kontinent. Insbesondere Zeitreihenanalyse - die heutige Killer-Applikation insbesondere für Machine Learning - ist damit kaum möglich.
In der Standardisierung von Geodaten und –diensten bezeichnet "Coverage" eine geographische Datenstruktur für raum-zeitlich ausgedehnte Phänomene, i.w. reguläre und irreguläre Gitter, Punktwolken und allgemeine Netze (math.: Polytope) [1]. Damit sind Coverages wesentlich für die "Big Earth Data" verantwortlich, u.a. Satellitenbilder, Klimasimulationen, Laserscan-Daten. Coverages erschließen sowohl menschlichen als auch maschinellen Nutzern den einfachen Zugang zu "Big Earth Data" über das korrespondierende Dienste-Modell, Web Coverage Service (WCS). Das vorliegende Projekt erstellt, auf Wunsch von ISO, einen wesentlichen Baustein: eine klare, vereinfachte, und gleichzeitig mächtigere Daten-Modellierung für raum-zeitliche Datenwürfel, auf Grundlage des bestehenden OGC CIS 1.1 Standards. Ziel ist also, zwei unterschiedliche Coverage-Versionen in einem neuen Dokument zu vereinigen; die Konzepte beider Versionen an sich sind etabliert und stabil. Die Herausforderung besteht in der kohärenten Darstellung (aus 2 Standards mach 1) sowie der Integration in die ISO-spezifischen Mechanismen, z.B. das allgemeine Harmonisierte Modell von TC211.
Bitte beschreiben Sie an dieser Stelle den Nutzen der von Ihnen eingereichten Idee. Welches Ziel verfolgen Sie? Welchen Nutzen generiert Ihre Innovation für welche Zielgruppen? Beschreiben Sie bitte den Innovationsgrad Ihrer Projektidee gegenüber dem Stand der Technik. Beschreiben Sie hier bitte das Projekt anhand der angegebenen Kriterien .
ISO 19123-2 (identisch zu OGC CIS 1.0) in seiner jetzigen Form ist implementiert von einem Who's Who der Geoinformations-Technologie (sowohl open-source als auch proprietär), wie diese Übersicht von OGC zeigt. Die neuen Konzepte

Abb. 1: Schematische Darstellung der Arbeitsschritte: Vorarbeiten (schwarz) und der Erstellung der DIN-SPEC (rot)
Die jetzt einzubringenden Konzepte von OGC CIS 1.1 erlauben einfachere Handhabung, leichtere Implementierbarkeit bei gleichzeitig stark erweiterter Mächtigkeit. Es ist daher relativ sicher, dass die aktualisierte ISO 19123-2 ebenfalls breite Akzeptanz bei Implementierern finden wird; die OGC-Referenzimplementierung rasdaman hat General Grid Coverage bereits implementiert, und auch weitere Experten arbeiten bereits damit:
. Damit bleibt OGC CIS / ISO 19123-2 der bei weitem dominierende Geodaten-Standard. Der
Startups wie CropMaps bis zu nationalen Datenzentren wie CODE-DE / DLR bieten Dienste auf Basis der Coverage Standards.

Abb. 1: Kaleidoskop von Coverage-basierten Geodiensten
Referenzen:
[1] http://en.wikipedia.org/wiki/Coverage_data
[2] http://en.wikipedia.org/wiki/Web_Coverage_Service
[3] http://myogc.org/go/coveragesDWG
[4] http://www.opengeospatial.org/standards/wcs
Worin liegt das Optimierungspotential?
Der bisherige Coverage-Standard ISO 19123-2 hat eine wertvolle Vereinheitlichung und Interoperabilität gebracht, musste jedoch - aus historischen Gründen - einige Kompromisse machen. Mit modernisierten Konzepten und dem aktuellen Stand der Technik lassen sich wichtige Nachteile eliminieren:

Abb. 2: Beispiel regulärer und irregulärer Gitter, wie sie im neuen Standard vereinheitlicht modelliert werden können
Die neuen Konzepte, welche in OGC CIS 1.1 im Konzept der "General Grid Coverage" realisiert sind, sollen in ISO 19123-2 eingepflegt werden, so daß Nutzer (s.u.) einen One-Stop-Shop für tehnisch aktuelle, interoperable Coverage-Definitionen erhalten.
Wer profitiert von der Innovation und dem Standard?
Wie werden die Ergebnisse nach Projektabschluss verwertet?
Die DIN-SPEC wird als deutscher Input bei ISO TC211 WG6 eingereicht, um - möglichst direkt - als 19123-2:2020 übernommen zu werden.
Skizzieren Sie bitte die europäische/internationale Bedeutung
Coverages bilden die allgemein akzeptierte Grundlage für massive raum-zeitliche Daten über die Erde, sowohl als Beobachtungen (wie Satellitenbilder) als auch als generierte Daten (wie Wetterorhersagen). Das rasdaman-Team ist Editor des Coverage-Daten- und Dienstemodells, stelt die Referenzimplementierung und leitet die einschlägigen Arbeitsgruppen in OGC. Damit definiert Europa die Standards für "Big Earth Data". Mit der geplanten DIN-SPEC wird diese Führung fortgesetzt und ausgebaut.
Bestehen Einreichungsmöglichkeiten bei Europäischen und internationalen Normungsorganisationen (CEN/CENELEC/ISO/IEC)?
ja, siehe oben: ISO ist vorgesehen. Weitere Gremien (etwa CEN) wären zu diskutieren.
Skizzieren Sie bitte die Markt- und gesellschaftliche Relevanz
Bitte geben Sie an dieser Stelle an, welche Kompetenzen und Ressourcen Sie und Ihre Projektpartner*innen für die Umsetzung Ihrer Idee mitbringen. Beschreiben Sie hier bitte Qualität und Kompetenz, die Sie/Ihre Organisation und Ihre Partnerunternehmen für das Projekt einbringen werden. Die bewerbende Person muss darlegen, dass sie/ihre Organisation und ihre Partnerunternehmen über die notwendige Kompetenz verfügen, die vorgeschlagene Projektidee auch bearbeiten zu können. Ebenso müssen die zeitlichen, technologischen und sonstigen Ressourcen dafür vorhanden sein.
Der Projektleiter und Geschäftsführer der rasdaman GmbH, Peter Baumann, hat jahrzehntelange Erfahrung in diversen Standardisierungsgremien und ist Autor von mehr als einem Dutzend Standards, darunter der OGC WCS-Suite sowie der ISO SQL-Erweiterung um Datacubes. Derzeit ist er u.a. in folgenden Gremien aktiv tätig:
Für seine Beiträge zur Standardisierung von Daten und Diensten für raum-zeitliche Datenwürfeln wurde ihm von OGC der Gardels Award zugesprochen: "We wish to express our deep appreciation for the extraordinary contribution you have made to the OGC community and to people around the world who are the ultimate beneficiaries of improvements in the development, management and use of geoscientific data. Devoting your time and bringing your dedication, expertise, critical thinking and leadership to OGC working groups has resulted in significant and enduring advances in technical standards. The value you've created has been leveraged, and the OGC's work overall has been leveraged, through your active participation in other standards bodies, expert groups, councils and commissions".
Zusätzlich steht neben Peter Baumann erfahrene Team im Unternehmen sowie in seiner Universitäts-Forschungsgruppe bereit.
Da der Antragsteller Editor des ISO 19123-2 Projekts ist und langjährige Erfahrung in der internationalen Standardisierung hat, ist eine Übernahme der DIN-SPEC durch ISO – ggf. mit leichten Modifikationen – praktisch sicher. Unterstützt wird diese Sicht von der Die im letzten Jahr von Peter Baumann erstellte DIN-SPEC 18114, welche inzwischen Diskussionsgrundlage für ISO 19123-1 ist, das abstrakte Coverage-Modell; OGC hat angekündigt, dies ebenfalls zu übernehmen.
Bitte geben Sie an dieser Stelle an, welchen Bezug die von Ihnen eingereichte Idee zur Standardisierung besitzt. Bitte formulieren Sie den Anwendungsbereich Ihres geplanten Standards. Beispiel: Der geplante Standard definiert Anforderungen an [Merkmale/Eigenschaften/Kriterien] von [Produkten/Dienstleistungen/Verfahren/Systemen] für [Zielgruppen].
Der geplante DIN-SPEC / ISO 19123-2 Standard definiert Strukturen und Dateiformate für multi-dimensionale, raum-zeitliche Rasterdaten, Punktwolken und allgemeine Netze von Geodaten.Damit ist er die unabgdingbare Basis für Dienste-Standards wie Web Coverage Service (WCS) und andere Coverage-Dienste, hier ein Beispiel basierend auf dem Vorgänger-Standard. Zielgruppen sind (vgl. Abschnitt "Nutzen" weiter oben): Entwickler von Server - und CLient-Software; Datenanbieter, welche Dienste auf Basis des Standards betreiben; Nutzer dieser Dienste; Studenten und Ausbilder.
HINWEIS: Die nachfolgenden Inhalte sind nur für Sie sichtbar und können von anderen Nutzer*innen nicht eingesehen werden.Optionale AnhängeHier können Sie bei Bedarf Anhänge per Drag&Drop einfügen. Diese sind nur im Modus "Bearbeiten" für Sie und die Community Manager*in sichtbar. HINWEIS: Dokumente, die Sie außerhalb des Bereiches "Optionale Anhänge" anfügen, sind für jede/n Nutzer*in sichtbar.
ProjektplanBeschreibung des ProjektesBitte beschreiben Sie an dieser Stelle Ihre Projektidee und die zugehörigen Arbeitspakete (AP). Ziel des vorgeschlagenen DIN-CONNECT Vorhabens ist die Erstellung einer DIN SPEC, welche ISO 19123-2 um den Typ General Grid Coverage (und damit allgemeine „Datacubes“) aus OGC 1.1 erweitert. Dazu sind die zwei Spezifikationen ISO 19123-2 und OGC CIS 1.1 zu einer einzigen, kohärenten Spezifikation zu verschmelzen. Das Ergebnis soll zuerst als DIN-SPEC verabschiedet werden und dann als deutscher Beitrag in ISO eingebracht werden. Die Arbeitspakete ergeben sich wie folgt: AP1: Konzepterstellung Definition der Struktur zur Integration der zwei Spezifikationen CIS 1.0 und 1.1 in das künftige gemeinsame Dokument 19123-2, d.h. zur Integration von CIS 1.1 in das derzeitige ISO 19123-2. Abgleich mit der in Entwicklung befindlichen ISO WD 19123-1 (welche auf DIN-SPEC 1884 basiert). Dazu Konsultationen mit Geo-Experten und Implementierungs-Experten, insbesondere auch in ISO und OGC Technical Committee Treffen sowie Treffen des AK Geoinformation. AP2: Erstellung DIN SPEC Aufschreibung des Dokuments als DIN-SPEC unter Berücksichtigung aller Vorgaben von ISO und OGC, in Absprache mit DIN. Dazu aktive Diskussion der Fortschritte mit OGC und ISO auf den entsprechenden Projekttreffen der Gremien. AP3: Einbringen der DIN SPEC in ISO Die DIN-SPEC soll vom DIN-Spiegelgremium in ISO TC211 WG6 als Initial Working Draft (IWD) eingebracht werden. Bereits davor muss jedoch ISO in die Entwicklung eingebunden bleiben, um früh die Zustimmung der nationalen Delegationen zu erhalten und damit den Adoptionsprozess im Fluss zu halten. Auch OGC und DGIWG müssen frühzeitig an Bord genommen werden. AP4: DIN-Sitzungen und Berichtswesen Dieses AP beinhaltet Teilnahme an Sitzungen und Workshops von DIN sowie die Erstellung der periodischen Fortschrittsberichte. Aufwandsschätzung
FörderbetragBitte geben Sie an, in welcher Höhe der von Ihnen gewünschte Förderbetrag liegen soll.
Die Finanzierung für uns als KMU ist notwendig, um insbesondere bei folgenden Kosten zu unterstützen (in absteigendem Aufwand):
|