Projekttitel: Leitfaden für Daten- und Metadatenqualität



deutscher ProjekttitelLeitfaden für Daten- und Metadatenqualität
englischer ProjekttitelUser Guide for data and metadata quality



Ideengeber*in:


NameLina Bruns
OrganisationFraunhofer FOKUS
AdresseKaiserin-Augusta-Allee 31
E-Mail (optional)
Telefon (optional)


Website (falls vorhanden)https://www.fokus.fraunhofer.de/

Potenzielle Projektpartner*innen


  • Con Terra GmbH
  • DB Systel GmbH
  • TU Berlin


Ausgangslage


Daten sind die zentrale Ressource in Zeiten der Digitalisierung. Dabei ist die Qualität von Daten und Metadaten  entscheidend für ihre mehrwertbringende Weiterverwendung. Die nachträgliche Aufbereitung von Daten minderer Qualität ist meist mit einem hohen Ressourcenaufwand verbunden, sodass Daten von Anfang an in möglichst hoher Qualität und mit ausreichenden Metadaten vorliegen sollten. Bisher gibt es keine verbindlichen sektoren-übergreifende Standards, die auf Ebene einzelner Datenformate konkrete Empfehlungen zur Steigerung der Qualität von Daten in einfach verständlicher Sprache liefern.

Das Fraunhofer-Institut FOKUS hat im durch das Bundesministerium für Wirtschaft und Energie geförderten Projekt „Normentwurf zur Veröffentlichung qualitativ hochwertiger Daten und Metadaten“ (kurz NQDM, Förderkennzeichen 03TNG003A) eine praktische Hilfestellung für Datenbereitsteller zu qualitativ hochwertige Daten und Metadaten erstellt. Der Leitfaden enthält zahlreiche Empfehlungen, beispielweise zum Umgang mit verschiedenen Formaten, u.a. CSV, XML und JSON. Der Leitfaden richtet sich an alle, die tagtäglich mit Daten arbeiten und auf eine hohe Datenqualität angewiesen sind. Die Veröffentlichung des Leitfadens ist für Oktober 2019 geplant.

Um die Sichtbarkeit und Relevanz des Leitfadens zu steigern, soll in dem geplanten Projekt der bereits existierende Leitfaden in eine DIN-Spezifikation (DIN SPEC) überführt werden. Dies hat den Vorteil, dass die Inhalte standardisiert werden und mehr Akzeptanz erfahren können. Die Inhalte des Leitfadens sind bereits existent, sodass im geplanten Projekt ein besonderes Augenmerk auf die Standardisierung gerichtet werden kann. 

Nutzen


Worin liegt das Optimierungspotential?

Der Leitfaden greift häufig genutzte Datenformate auf und erklärt, was zu beachten ist, um möglichst qualitativ hochwertige Daten zu erzeugen. Bereits existierende technische Spezifikationen zu Datenformaten enthalten teilweise auch Hinweise in Bezug auf die Datenqualität, diese sind jedoch oftmals in sehr technischer Sprache geschrieben und nicht konsolidiert über verschiedene Formate hinweg an einer Stelle abrufbar. Der Leitfaden deckt diesen Bedarf. Er addressiert eine breite Zielgruppe, da die Empfehlungen in einfacher Sprache und mit anschaulichen Beispielen untermauert erklärt werden. Zudem enthält der Leitfaden neben allgemeinen Empfehlungen zum Umgang mit Daten (Personenbezug, Anonymisierung etc.) formatspezifische Empfehlungen zu gängigen Formaten wie CSV, JSON, XML, RDF, GEOJSON, und den Schnittstellen REST und WFS. In Zeiten der Digitalisierung ist die Qualität von Daten von zentraler Bedeutung, egal ob in Industrie 4.0, Smart Farming oder als Grundlage für Künstliche Intelligenz. Da der Leitfaden die zuvor genannten Formate aus allgemeiner Perspektive und nicht domänenspezifisch betrachtet, wird eine breite Zielgruppe adressiert und sichergestellt, dass der Leitfaden in vielen verschiedenen Bereichen Anwendung finden kann.

Die Standardisierung des Leitfadens verhilft zu einer größeren Sichtbarkeit der Inhalte und hilft, einen gemeinsamen Nenner in den verschiedenen Facetten der Daten- und Metadatenqualität zu schaffen


Wer profitiert von der Innovation und dem Standard?

Sowohl Datenbereitsteller als auch Datennutzer können von dem Standard profitieren. Qualitativ hochwertige Daten sind eine wertvolle Ressource und können Innovation und Mehrwerte erzielen. Datenbereitsteller profitieren von dem Leitfaden, indem sie eine einfach verständliche Anleitung erhalten, wie sie ihre Daten auf ein hohes Qualitätsniveau bringen können. Datennutzer wiederum profitieren indirekt von dem Leitfaden, da sie qualitativ hochwertige Daten vorfinden, die eine einfache Weiterverwendung ermöglichen.


Wie werden die Ergebnisse nach Projektabschluss verwertet?

Der standardisierte Leitfaden bietet große Transfer- und Verwertungschancen in vielen verschiedenen Bereichen, in denen mit Daten gearbeitet wird und wo Datenqualität von Bedeutung ist. Da der Leitfaden allgemeine Qualitätsempfehlungen enthält und der Öffentlichkeit zur Verfügung gestellt werden soll, kann er in unterschiedlichsten Bereichen Anwendung finden.


Skizzieren Sie bitte die europäische/internationale Bedeutung

Auch im europäischen Kontext ist die Qualität von Daten und Metadaten von großer Bedeutung. Erlangt der Leitfaden internationale Bedeutung und kann sich als allgemeingültiger Standard durchsetzen, so erleichtert er einen Datenaustausch über verschiedene Ländergrenzen hinweg und trägt zu einem gemeinsamen Qualitätsverständnis bei.


Bestehen Einreichungsmöglichkeiten bei Europäischen und internationalen Normungsorganisationen (CEN/CENELEC/ISO/IEC)?

Die Thematik des Leitfadens ist für eine europäische oder internationale Normungsaktivität von großer Relevanz.


Skizzieren Sie bitte die Markt- und gesellschaftliche Relevanz

Die gesellschaftliche Relevanz des Leitfadens spiegelt sich beispielweise im Kontext von Open Data wieder: Wird der Leitfaden von Behörden genutzt, um qualitativ hochwertige Daten zu veröffentlichen, können hieraus Anwendungen und Mehrwerte erzielt werden, von denen die breite Öffentlichkeit profitieren kann. Auch profitiert die Gesellschaft indirket durch den Leitfaden, wenn durch ihn bessere datenbasierte Anwendungen, bspw. im KI-Kontext, geschaffen werden können.

Auch die Marktrelevanz ist groß: Der DIN SPEC-standardisierte Leitfaden schafft ein einheitliches Verständnis von Daten- und Metadatenqualiät und enthält klare Qualitätsvorgaben, die in vielen Bereichen zu mehr Innovation und Mehrwert führen können.

Kompetenzen und Ressourcen


Die gelisteten Projektpartner waren alle Mitglieder im Projektbeirat von NQDM und haben die Erstellung des initalen Leitfadens zwei Jahre begleitet. Fraunhofer FOKUS leitete das Projekt und hat sich intensiv in die Thematik der  Daten- und Metadatenqualität eingearbeitet.

Fraunhofer FOKUS ist eines der international führenden Forschungsinstitute im Bereich der Informations- und Kommunikationstechnologie. Schwerpunkt ist die praxisorientierte Erforschung und Umsetzung der Digitalen Vernetzung. Seit 1988 unterstützt Fraunhofer FOKUS Wirtschaftsunternehmen und öffentliche Verwaltungen in der Gestaltung des digitalen Wandels durch Forschungsleistungen von der Anforderungsanalyse über Beratung, Machbarkeitsstudien, Technologieentwicklung bis hin zu Prototypen und Piloten. Fraunhofer FOKUS ist für Unternehmen und öffentliche Verwaltungen ein wichtiger neutraler Partner, der in vielen maßgeblichen internationalen Standardisierungsgremien aktiv ist und interoperable, domainspezifische, aber auch domainübergreifende Lösungen umsetzt.

Als einer der Pioniere von Open Data und Open Government hat Fraunhofer FOKUS den öffentlichen Sektor bereits in unzähligen Projekten unterstützt, Transparenz und Wirtschaftlichkeit auf Basis offener Daten zu verbessern sowie Partizipation und Kollaboration zu fördern. Eine Auswahl zahlreicher Projekte folgt:

  • Von 2017 bis 2019: Entwicklung eines Leitfadens für qualitativ hochwertige Daten und Metadaten. Fraunhofer FOKUS leitete dieses vom BMWi geförderte Projekte und erarbeitete zusammen mit einem Projektbeirat bestehend aus Datennutzern und Datenbereistellern aus verschiedenen Sektoren sowie politischen Entscheidern die Inhalte des Leitfadens. die Veröffentlichung des Leitfadens ist für Oktober 2019 geplant. Weitere Informationen unter: https://www.nqdm-projekt.de/
  • Von 2015 bis 2018: Entwicklung des European Data Portal; Fraunhofer FOKUS ist als Teil eines internationalen Konsortiums an der Entwicklung des weltweit wahrscheinlich ambitioniertesten Open Data-Portals beteiligt. Als einer der hauptverantwortlichen technischen Partner entwickelt FOKUS dabei Kernkomponenten wie bspw. das Datenregister und sogenannte Harvesting-Mechanismen.
  • Von 2015 bis 2018: Open.NRW; Fraunhofer FOKUS unterstützt gemeinsam mit den Unternehmen PwC, Accenture und regioIT das Land Nordrhein-Westfalen bei der Umsetzung der Open.NRW Strategie im Handlungsfeld Open Data.
  • Von 2013 bis 2016: Policy Compass; EU-geförderte Plattform mit der die Beobachtung von Politik vereinfacht werden soll.
  • Von 2012 bis 2014: GovData; GovData wurde im Rahmen der Open-Government-Projekte der Bundesregierung sowie des IT-Planungsrats entwickelt.



Standardisierungsscope


Das Projekt zielt auf die Standardisierung des bereits existierenden (derzeit noch nicht veröffentlichen) Leitfaden für qualitativ hochwertige Daten und Metadaten ab, der im Rahmen des Projektes NQDM erstellt wurde. Der geplante Standard definiert allgemeine Qualitätsanforderungen an Daten und Metadaten, die sektorenübergreifend Anwendung finden sollen.


Error rendering macro 'excerpt-include'

User 'null' does not have permission to view the page.