NQDM_Shutters_970x485
pixabay / psaudio

Normentwurf für qualitativ hochwertige Daten und Metadaten

Open Data schafft Zugang zu Informationen und liefert dadurch Mehrwerte für verschiedene Nutzergruppen. Diese reichen von Startups über Datenjournalistinnen und -journalisten sowie Hobby-Entwicklerinnen und -Entwicklern bis zu Unternehmen und der Verwaltung selbst. Open Data bedeutet vor allem, dass Daten uneingeschränkt nutzbar zur Verfügung stehen und ohne Einschränkung bearbeitet und weiterverwendet werden dürfen. Schaut man sich auf Open Data-Portalen um, so lässt sich feststellen, dass viele Datensätze nicht verfügbar, nicht offen lizenziert oder nicht maschinenlesbar sind. Oftmals fehlen auch vollständige Beschreibungen von Metadaten. Dabei hat die Qualität der Daten und Metadaten eine besondere Bedeutung. Denn eine niedrige Datenqualität hat einen negativen Einfluss auf den Mehrwert der Daten und erschwert ihre Nutzung. Das kann auch wirtschaftliche Nachteile mit sich bringen, wenn Daten im schlechtesten Fall unbrauchbar werden oder für eine mehrwertbringende Nutzung nicht geeignet sind. Selbstverständlich können Daten mangelnder Qualität händisch oder maschinengestützt für eine Weiterverarbeitung aufbereitet werden. Dies ist jedoch mit einem hohen Ressourcenaufwand verbunden. Daher gilt es, Daten von Anfang an in hoher Qualität und mit ausreichenden Metadaten versehen bereitzustellen. 

Die Erzeugung von Open Data geschieht in Deutschland derzeit hauptsächlich auf Ebene der Kommunen, Länder und des Bundes. Um sicherzustellen, dass Open Daten seinen Nutzen entfalten kann, brauchen die Verwaltungen Unterstützung, insbesondere bei der Auswahl von geeigneten Datensätzen und Formaten sowie der Zuordnung von Meta-Informationen.

Vor diesem Hintergrund erarbeiten Fraunhofer FOKUS und Pumacy Technologies AG eine Norm für die Bereitstellung von Daten und Metadaten. Neben konkreten Empfehlungen für den Einsatz geeigneter Datenformate werden auch Qualitätsmerkmale von Metadaten identifiziert. Etablierte Standards sowie bestehende Normen werden bei der Erstellung des Normentwurfs berücksichtigt.

Das Vorhaben beinhaltet im Rahmen einer Praxisevaluierung eine prototypische Implementierung und funktionale Tests. Dazu werden bereitgestellte Daten und Metadaten aus energiewirtschaftlichen Testdaten-Sets im Kontext eines konkreten Szenarios unter Anwendung der entwickelten Qualitätsmerkmale analysiert und auf ein höheres Qualitätsniveau gebracht.

Um eine hohe Akzeptanz und Anwendbarkeit des angestrebten Normentwurfs zu erreichen, begleitet ein Gremium aus Wissenschaft, Datenbereitstellern (Kommunen), Anwendern (KMUs, Startups) und politischen Amtsträgern das Vorhaben.