4 - Datenaufbereitung
Daten aufbereiten und zugänglich machen
Forschungsdaten sollen laut der GO FAIR-Initiative FAIR sein. Ziel ist es, Forschungsdaten für Mensch und Maschine optimal aufzubereiten und zugänglich zu machen. Dies bedeutet jedoch nicht, dass jeder Datensatz uneingeschränkt nachnutzbar ist. Vielmehr zielen die FAIR-Prinzipien darauf ab, Datenbestände im Rahmen des rechtlich und technisch Möglichen für neue Nutzungsszenarien zu öffnen. Durch die Anwendung der FAIR-Prinzipien soll die Nachnutzbarkeit von Datenbeständen verbessert werden. Das Motto lautet dabei: „As open as possible, as closed as necessary.“ Somit ist die Einhaltung der FAIR-Prinzipen ein wesentlicher Bestandteil der Guten wissenschaftlichen Praxis, dem DFG-Kodex zur Wissenschaftlichen Integrität.
Gute Wissenschaftliche Praxis (GWP) Leitlinie 13: "Herstellung von öffentlichem Zugang zu Forschungsergebnissen"
Wissenschaft lebt vom offenen Austausch. Daher ruft der Kodex GWP Forschende dazu auf, zusätzlich zu den Ergebnissen ihrer Forschung auch die zugrunde liegenden Forschungsdaten und den Code der Software, die zur Analyse verwendet wurde, anderen Forschenden zu Verfügung zu stellen. Hierbei sind insbesondere die FAIR-Prinzipien zu berücksichtigen, deren Ziel es ist, Forschungsdaten wieder verwendbar zu machen. Idealerweise sollen Forschungsdaten in öffentlichen Repositorien unter offenen Lizenzen veröffentlicht werden. Gründe, die in Ausnahmefällen gegen eine Veröffentlichung von Forschungsdaten sprechen, sind insbesondere Urheberrecht, Datenschutz und ethische Gründe.
Die Vorteile
- Die Auffindbarkeit der Datensätze nimmt zu.
- Die Sichtbarkeit erhöht sich, wenn Datensätze leicht auffindbar und zugänglich sind.
- Die Forschung wird effizienter, da Doppelerhebungen oder Mehrfacharbeit vermieden werden.
- Forschungsergebnisse werden nachvollziehbarer, wenn die Daten mit einer Publikation veröffentlicht werden.
- Neue Forschungsfragen entstehen, z.B. aus den Ergebnissen einer früheren Studie und dem dazugehörigen Datensatz.
- Die Zusammenarbeit wird erleichtert - sowohl innerhalb des Forschungsprojekts als auch weltweit.
Die FAIR-Prinzipien
Grafik von Paulina Halina Sieminska / CC BY S https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/
F - FindableBeschreiben Sie Ihre Forschungsdaten mit aussagekräftigen Metadaten, die in einer durchsuchbaren Datenbank verfügbar sind und referenzieren Sie sie mittels eines Persistent Identifier (PID). | |
A - AccessibleStellen Sie sicher, dass der Zugriff auf Daten und Metadaten technisch möglich ist, und definieren Sie den Authentifizierungs- und Authorisierungsprozess, der nötig ist. | |
I - InteroperableNutzen Sie etablierte Standards für die Formate Ihrer Forschungsdaten sowie für die Metadaten und Metadaten-Vokabulare. | |
R - Re-useableDie Metadaten zu Ihren Forschungsdaten sind ausführlich, relevant, domänenspezifisch und maschinenlesbar. Machen Sie deutlich, wie Ihre Daten entstanden sind und unter welchen Bedingungen / unter welcher Lizenz sie nachgenutzt werden |
Metadaten
Definition
Metadaten sind Daten, die andere Daten einordnen und beschreiben. Sie beschreiben und strukturieren Informationen, damit diese leichter gefunden, verwaltet und auch maschinell genutzt werden können. Sie geben also zusätzliche Informationen darüber, wie, wann und warum etwas erstellt wurde oder wie es genutzt werden kann. Je nach Disziplin gibt es bestimmte Metadatenschemata, die genutzt werden können.
Warum sind Metadaten wichtig?
- Auffindbarkeit: Die Suche nach Informationen in Repositorien oder Suchportalen wird vereinfacht.
- Nachvollziehbarkeit und Nachnutzung: Der Kontext wird hergestellt, um Daten korrekt zu interpretieren oder erneut zu nutzen.
- Dokumentation und Archivierung: Verlauf und Änderungen sind nachvollziehbar, z.B. wann und von wem eine Änderung vorgenommen wurde. Die langfristige Verständlichkeit der Daten (auch für die eigene Forschung) wird gewährleistet.
- Erfüllung von Anforderungen: Fördermittelgeber, Journale und Repositorien verlangen i.d.R. strukturierte Metadaten, um die FAIR-Prinzipien umzusetzen.
- Zitation und Persistenz: Persistente Identifikatoren (z.B. DOIs) ermöglichen eine eindeutige Referenzierbarkeit und Zitierbarkeit von Forschungsdaten.
Die Metadatentypen
Administrative Metadaten
- Definition: Administrative Metadaten unterstützen die Verwaltung eines Objekts. Sie geben Auskunft über technische Details, Rechte und erforderliche Maßnahmen zur Erhaltung. Sie geben einen ersten Überblick über die Zusammenhänge des Projekts, ohne die Daten selbst zu sichten.
- Beispiele: technische Metadaten wie Dateiformate, Dateigröße, Erstellungsdatum, rechtliche Metadaten wie Lizenz, Urheberrecht, Nutzungsbedingungen, erhaltende Metadaten wie Maßnahmen zur Archivierung, Konservierungsdaten
Deskriptive Metadaten
- Definition: Beschreibende Metadaten liefern Informationen über den Inhalt eines Objekts. Sie helfen dabei, das Objekt zu identifizieren, zu suchen und wiederzufinden.
- Beispiele: Titel, Autor/in, Zusammenfassung, Schlagworte, Erscheinungsjahr
Strukturelle Metadaten
- Definition: Strukturelle Metadaten beschreiben den Aufbau und die Beziehung zwischen einzelnen Teilen eines Objekts.
- Beispiele: Versionierungen, Referenzdaten (z.B. Verknüpfung von Kapiteln zu einem Buch), Inhaltsverzeichnisse, Hilfsmittel im Projekt (Kamera, Raumbedingungen, Applikationen)
Weiterführende Informationen
- Biernacka K, Dolzycka D, Buchholz P und K Helbig (2019): Wie FAIR sind Deine Forschungsdaten?. Informationsposter.Zenodo, http://doi.org/10.5281/zenodo.2547339
- Die FAIR Data Prinzipien für Forschungsdaten (TIB-Blog-Artikel: https://blog.tib.eu/2017/09/12/die-fair-data-prinzipien-fuer-forschungsdaten/#a)
- FAIR Aware Test: https://fairaware.dans.knaw.nl/
- .