3 - Datenaufbereitung

Version 22.7 von Gabriele Nicole Stiller am 2025/05/14 11:33

Daten aufbereiten und zugänglich machen

Forschungsdaten sollen laut der GO FAIR-Initiative FAIR sein. Ziel ist es, Forschungsdaten für Mensch und Maschine optimal aufzubereiten und zugänglich zu machen. Dies bedeutet jedoch nicht, dass jeder Datensatz uneingeschränkt nachnutzbar ist. Vielmehr zielen die FAIR-Prinzipien darauf ab, Datenbestände im Rahmen des rechtlich und technisch Möglichen für neue Nutzungsszenarien zu öffnen. Durch die Anwendung der FAIR-Prinzipien soll die Nachnutzbarkeit von Datenbeständen verbessert werden. Das Motto lautet dabei: „As open as possible, as closed as necessary.“ Somit ist die Einhaltung der FAIR-Prinzipen ein wesentlicher Bestandteil der Guten wissenschaftlichen Praxis, dem DFG-Kodex zur Wissenschaftlichen Integrität.

Gute Wissenschaftliche Praxis (GWP) - Leitlinie 13: Herstellung von öffentlichem Zugang zu Forschungsergebnissen

Wissenschaft lebt vom offenen Austausch. Daher ruft der Kodex GWP Forschende dazu auf, zusätzlich zu den Ergebnissen ihrer Forschung auch die zugrunde liegenden Forschungsdaten und den Code der Software, die zur Analyse verwendet wurde, anderen Forschenden zu Verfügung zu stellen. Hierbei sind insbesondere die FAIR-Prinzipien zu berücksichtigen, deren Ziel es ist, Forschungsdaten wieder verwendbar zu machen. Idealerweise sollen Forschungsdaten in öffentlichen Repositorien unter offenen Lizenzen veröffentlicht werden. Gründe, die in Ausnahmefällen gegen eine Veröffentlichung von Forschungsdaten sprechen, sind insbesondere Urheberrecht, Datenschutz und ethische Gründe.

Vorteile

  • Die Auffindbarkeit der Datensätze nimmt zu.
  • Die Sichtbarkeit erhöht sich, wenn Datensätze leicht auffindbar und zugänglich sind.
  • Die Forschung wird effizienter, da Doppelerhebungen oder Mehrfacharbeit vermieden werden.
  • Forschungsergebnisse werden nachvollziehbarer, wenn die Daten mit einer Publikation veröffentlicht werden.
  • Neue Forschungsfragen entstehen, z.B. aus den Ergebnissen einer früheren Studie und dem dazugehörigen Datensatz.
  • Die Zusammenarbeit wird erleichtert - sowohl innerhalb des Forschungsprojekts als auch weltweit.

FAIR-Prinzipien

FAIR.PNG

Grafik von Paulina Halina Sieminska / CC BY S  https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/ 

F - Findable

Beschreiben Sie Ihre Forschungsdaten mit aussagekräftigen Metadaten, die in einer durchsuchbaren Datenbank verfügbar sind und referenzieren Sie sie mittels eines Persistent Identifier (PID).

A - Accessible

Stellen Sie sicher, dass der Zugriff auf Daten und Metadaten technisch möglich ist, und definieren Sie den Authentifizierungs- und Authorisierungsprozess, der nötig ist.

I - Interoperable

Nutzen Sie etablierte Standards für die Formate Ihrer Forschungsdaten sowie für die Metadaten und Metadaten-Vokabulare.

R - Re-useable

Die Metadaten zu Ihren Forschungsdaten sind ausführlich, relevant, domänenspezifisch und maschinenlesbar. Machen Sie deutlich, wie Ihre Daten entstanden sind und unter welchen Bedingungen / unter welcher Lizenz sie nachgenutzt werden
können.

Warum Metadaten wichtig sind

Metadaten sind Daten, die andere Daten einordnen und beschreiben. Sie helfen bei der Strukturierung und verbessern die Auffindbarkeit. Je nach Disziplin gibt es bestimmte Metadatenschemata, die genutzt werden können. Falls Daten noch bereinigt oder normiert werden müssen, kann das Tool OpenRefine dabei hilfreich sein.

Weiterführende Informationen