Wie man einen Datensatz richtig erstellt
Wie man einen Datensatz korrekt erstellt Bevor Ihre ersten Datensätze veröffentlicht werden, müssen die Daten für die Öffnung vorbereitet werden. Einige Datenformate schränken die Möglichkeiten der Weiterverarbeitung ein. Andere wiederum erleichtern die weitere automatisierte Nutzung erheblich. Um offene Daten zur Verfügung zu stellen, ist es wichtig, sie in möglichst offenen Formaten bereitzustellen. So sind beispielsweise tabellarische Daten im PDF-Format für Menschen leicht zu lesen, aber für Maschinen schwer zu interpretieren. Im Folgenden erfahren Sie, worauf Sie bei der Erstellung von Datensätzen achten müssen und wie Sie sie richtig bearbeiten.
Wir empfehlen Ihnen, das Thema der technischen Aufbereitung von Datensätzen in die Schulung der IT-Verantwortlichen in Ihrem Unternehmen aufzunehmen. Links zu weiteren Informationsquellen, die wir versuchen, im Text anzugeben, werden Ihnen ebenfalls helfen, das Thema besser zu verstehen.
Analyse des Datensatzes, Gestaltung der Veröffentlichungsmethode
Analyse des Datensatzes, Vorschlag der Veröffentlichungsmethode Vor der Veröffentlichung Ihrer Datensätze ist es wichtig, sich Gedanken über den Inhalt und die Struktur der Daten selbst zu machen. Natürlich ist es möglich, z. B. eine einfache CSV-Datei mit einer klaren Datenstruktur zu veröffentlichen, die dann eine brauchbare Ressource darstellt. Aber auch in diesem Fall sollte der Datensatz einer ersten Analyse unterzogen werden. Die Analyse erfolgt durch den Kurator, der in Zusammenarbeit mit dem IT-Spezialisten den Inhalt des Datensatzes prüft, den Grad der Offenheit wählt, in dem er veröffentlicht werden soll, und gegebenenfalls das Datenschema auswählt, das seine Struktur definiert.
Da eine Reihe von öffentlichen Einrichtungen ähnliche Datensätze veröffentlichen, werden auf nationaler Ebene einheitliche Datensysteme für bestimmte Bereiche entwickelt. Dies ist ein Versuch, den Ansatz der Datenanbieter zu vereinheitlichen und die veröffentlichten Datensätze für einen bestimmten Bereich zu standardisieren, was die spätere Nutzung durch die Datenverarbeiter erheblich vereinfacht. Wenn also für einen bestimmten Datensatz bereits ein offener formaler Standard existiert, kann dieser verwendet oder erweitert werden, um den Inhalt des Datensatzes zu definieren.
Die offenen formalen Standards im Sinne von § 3 Absatz 9 des Gesetzes Nr. 106/1999 Slg. über den freien Zugang zu Informationen sind für die Anbieter offener Daten, die Verpflichtete gemäß § 4b Absatz 1 des Gesetzes Nr. 106/1999 Slg. über den freien Zugang zu Informationen sind, verbindlich. Dabei handelt es sich um technische Empfehlungen, die sich auf ausgewählte Datensätze konzentrieren und sicherstellen, dass dieselben Daten, die von verschiedenen Anbietern veröffentlicht werden, interoperabel sind. Dies erleichtert die Nutzung solcher Daten, unabhängig davon, von welchem Anbieter sie stammen. Einen Überblick über Offene Formale Standards (OFNs), Informationen über ihre Bedeutung und Verwendbarkeit finden Sie hier.
Bedenken Sie, dass Datenkonsumenten die von Ihnen bereitgestellten Datensätze möglicherweise mit Daten anderer öffentlicher Stellen kombinieren möchten. Die Nutzungsbedingungen sollten daher so weit wie möglich mit den empfohlenen Standards vereinbar sein.
Wählen Sie den Grad der Offenheit
Wählen Sie den Grad der Offenheit Um wirklich brauchbar zu sein, sollten die von Ihnen veröffentlichten Daten die empfohlenen Grundstandards erfüllen. In der Praxis bedeutet dies, dass die Daten häufig bereinigt werden müssen. Prüfen Sie beispielsweise bei der Veröffentlichung einer Excel-Datei die Struktur und Integrität der Daten entsprechend dem in Ihrem Veröffentlichungsplan gewählten Grad der Offenheit. In der Tschechischen Republik wie auch in Deutschland wird zu diesem Zweck auf nationaler Ebene die Definition von 5 Offenheitsgraden verwendet. In beiden Ländern basiert dies auf dem Fünf-Sterne-Modell von Tim Berners-Lee2
- Stufe 1 – der Datensatz ist im WWW verfügbar, mit entsprechenden Bedingungen für die Nutzung offener Daten
- Stufe 2 – der Datensatz wird in einem maschinenlesbaren Format bereitgestellt, das eine automatische Verarbeitung ermöglicht
- Stufe 3 – der Datensatz wird in einem offenen Format bereitgestellt, d. h. in einem Format mit einer frei verfügbaren Spezifikation
- Ebene 4 – IRIs werden verwendet, um Entitäten im Datensatz zu identifizieren,
- Stufe 5 – der Datensatz entspricht dem Linked-Data-Standard.
Eine detaillierte Beschreibung der Offenheitsstufen, einschließlich empfohlener technischer Standards für jede Stufe, finden Sie unter opendata.gov.cz
Risikoanalyse
Risikoanalyse Bei der Ausarbeitung des Veröffentlichungsplans wählte der Koordinator in Zusammenarbeit mit den einzelnen Kuratoren bestimmte Datensätze aus und erstellte einen Veröffentlichungsplan. Dabei berücksichtigten sie eine Reihe von Aspekten, wie z. B. die Übereinstimmung der veröffentlichten Datensätze mit gesetzlichen Vorschriften und Veröffentlichungsstandards, die Bewertung der Notwendigkeit und der Methode der Datenumwandlung oder die Qualität der Datensätze.
Auf der Grundlage dieser Informationen muss vor der eigentlichen Veröffentlichung eine Risikoanalyse durchgeführt werden, und es muss ein Weg zur Behebung etwaiger Risiken vorgeschlagen werden. Wenn Sie die Musterveröffentlichungspläne verwenden, werden die Risiken in diesen Plänen identifiziert und können übernommen werden. Wenn Sie einen eigenen Veröffentlichungsplan erstellen, in dem Sie die Öffnung Ihrer eigenen Datensätze planen, empfehlen wir Ihnen, die vom Open Data Portal empfohlene Analyse zu befolgen: Identifizierung der Risiken der Öffnung von Datensätzen
- Weitergabe von Daten unter Verstoß gegen das Gesetz
- Verletzung des Schutzes von Geschäftsgeheimnissen
- Verstoß gegen den Schutz personenbezogener Daten
- Offenlegung von unangemessenen Daten oder Informationen
- Fehlinterpretation von Daten
- Abwesenheit von Datenkonsumenten
- Überschneidung von Daten.
- Bedrohung der Sicherheit von Staat / Eigentum / Personen
Weitere Informationen zur Risikoanalyse bei der Entscheidung über die Veröffentlichung von Datensätzen finden Sie hier.
Bestimmen Sie die Nutzungsbedingungen
Festlegung der Verwendungsbedingungen Bei der Erstellung Ihrer eigenen Datensätze ist es wichtig, dass Sie sich Gedanken über deren Verwendung machen. Zunächst ist zu klären, ob Ihre Organisation tatsächlich die Rechte an den betreffenden Daten besitzt und ob Sie die Weiterverwendung der Daten durch Dritte regeln können. Im Falle von Daten, die von einem Dienstleister im Auftrag Ihrer Organisation erhoben wurden, kann es beispielsweise vertragliche Regelungen geben, die die Übertragung und Wiederverwendung der Daten einschränken. Hier wären entsprechende Verhandlungen zwischen Ihrer Organisation und den Rechteinhabern erforderlich.
In der Tschechischen Republik können Sie den klar ausgearbeiteten Leitfaden zur Erstellung von Lizenzierungsgenehmigungen für die nahtlose Nutzung offener Daten verwenden, der unter opendata.gov.cz
veröffentlicht wurde. Im Falle Bayerns empfehlen wir die im Deutschen Nationalen Portal veröffentlichten Informationen, die sowohl die Möglichkeit bieten, Datensätze auf nationaler Ebene als auch im Open Data Portal Bayern zu veröffentlichen. Eine Liste der Lizenzen, die auf GovData.de akzeptiert werden, finden Sie hier.
Wenn Ihre Organisation die Rechte an den Datensätzen besitzt, können Sie sich auf Wiederverwendungsrichtlinien konzentrieren, um den Nutzern klar zu machen, wie sie Ihre Daten weiterverarbeiten können. Andere Einschränkungen bei der Wiederverwendung Ihrer Datensätze schränken die Möglichkeiten der Nutzer ein, Ihre Daten (sinnvoll) zu nutzen. Daher sollte die Politik die freie Wiederverwendung zulassen.