Datenveröffentlichung

Version 13.2 von Gabriele Nicole Stiller am 2025/02/24 13:12

Welche Forschungsdaten sollen veröffentlicht werden? Wo sollen sie publiziert werden? Bei der Veröffentlichung und Archivierung sollten die Datensätze auf ihre Relevanz geprüft werden, damit die Daten, die zur Bewertung von Forschungsergebnissen oder zur Nachnutzung zur Verfügung gestellt werden, alle wesentlichen Informationen wiedergeben. Die Qualität und Einzigartigkeit der Daten sind besondere Gründe für die Auswahl und Aufbereitung. Dabei sind die Vorgaben von Forschungsförderern, Institutionen und Publikationsorganen zu berücksichtigen. Darüber hinaus ist eine Konvertierung und Sicherung der Daten in Formaten erforderlich, die für die Langzeitarchivierung geeignet sind.

Warum sollte man überhaupt Forschungsdaten publizieren?

Im Zentrum des wissenschaftlichen Forschungsprozesses steht ein Rohstoff, ohne den Forschung nicht denkbar wäre: Forschungsdaten. Forschungsdaten sind aber längst nicht mehr nur für die eigene Tätigkeit eines Forschenden oder einer Arbeitsgruppe relevant. Viele Förderer verlangen dies in ihren Bedingungen, auch die Richtlinien z.B. von Institutionen sehen zunehmend die Veröffentlichung von Daten vor - sofern keine triftigen Gründe dagegen sprechen. Die Daten sollten also keinesfalls auf dem USB-Stick gespeichert werden und in der Schublade verschwinden.  

Denn die offene Bereitstellung von Daten ermöglicht eine weltweite Arbeitsteilung. Forschende können einen Blick auf relevante Daten werfen und prüfen, ob diese einen Mehrwert für die eigene Studie bieten. Durch Integration und Re-Analyse können Forschungsergebnisse gewinnbringender genutzt werden. Der Rohstoff Forschungsdaten wird durch das Teilen also effizienter genutzt.

Aber auch Meta-Analysen sind ein wichtiger Grund für mehr Datenoffenheit. In einigen Disziplinen, in denen sich eine offene Datenkultur etabliert hat, wurden signifikante Analysefehler langjährig etablierter Verfahren oder Werkzeuge erst erkannt, als Meta-Analysen über viele Studiendaten hinweg Inkonsistenzen aufdeckten. Diese Analysefehler (z.B. Softwarefehler, falsche Standardannahmen) fallen in einer einzelnen Studie nicht immer auf, können aber zu Verzerrungen und damit zu falschen Ergebnissen führen. Dies kann durch Meta-Analysen vermieden werden.

Vorteile für Forschende

  • erweitere Publikationsliste
  • höherer Citation Impact
  • höhere Sichtbarkeit 
  • allg. wissenschaftlicher Fortschritt durch vereinfachtes Auffinden der Daten
  • neue Forschungsfragen
  • neue Kooperationsmöglichkeiten
  • Nachnutzbarkeit für die Lehre

Was spricht gegen eine Veröffentlichung?

  • Fehlende Erlaubnis in der Einverständniserklärung
  • Urheberrechtsverletzung
  • Fehlende Verwertungsrechte
  • Patenentwicklung
  • Datenschutz
  • Verträge mit Industriepartnern

Leitfragen für die Veröffentlichung

  • Zu welchem Zeitpunkt im Forschungsprozess sollen die Daten veröffentlicht werden?
  • Gibt es Anforderungen der Förderorganisation / der eigenen Einrichtung / …?
  • Welche Daten werden veröffentlicht? (Rohdaten / bearbeitete Daten / Metadaten)
  • Abgeschlossene Datenerhebung oder kumulativer Datensatz?
  • Wie muss ich die Daten beschreiben bzw. welche Dokumentation benötige ich, um den Anforderungen des Repositoriums zu genügen?
  • Wie soll der Zugang zu den Daten sein? (Open Access / eingeschränkter Zugriff / Embargofrist)
  • Lizenzvergabe – ja oder nein? Wenn ja, welche?

Berücksichtigung rechtlicher Aspekte

Bevor Daten öffentlich zugänglich gemacht werden können, gilt es, eine Vielzahl rechtlicher Aspekte zu beachten – denn nicht alle Daten können oder sollten veröffentlicht werden. Im Wesentlichen, jedoch nicht ausschließlich, sind vor Veröffentlichung Fragen des Datenschutzes und des Urheberrechts zu klären. Forscherinnen und Forscher und Infrastruktureinrichtungen äußern häufig Unsicherheiten bei diesem Thema. Geschuldet ist dies der Vielfalt der zu beachtenden Rechtsnormen und Gesetze sowie dem Mangel an rechtlicher Expertise.

Um hier Abhilfe zu schaffen, hat forschungsdaten.info eine Entscheidungshilfe zur Veröffentlichung von Forschungsdaten in Form eines Flussdiagramms erstellt. Das Beantworten der gestellten Fragen führt Sie durch den Entscheidungsprozess bis zu einer Empfehlung. Die Rechtsnormen, die den Fragen zugrunde liegen, sind zur Erleichterung der eigenen Recherche aufgeführt. Diese Entscheidungshilfe dient lediglich zur Information und Orientierung. Sie wurde mit größter Sorgfalt erstellt und von Rechtswissenschaftlerinnen und Rechtswissenschaftlern begutachtet. Dennoch sind die Informationen nicht rechtsverbindlich. Verträge, Richtlinien und Ordnungen können ergänzend weitere Einschränkungen aufzeigen und sind ebenfalls zu beachten. Lassen Sie sich daher im konkreten Fall rechtlich beraten, um Rechtssicherheit zu erreichen.

Möglichkeiten der Forschungsdatenpublikation

Supplement in Journal

Manche Verlage bieten Supplemente zu Veröffentlichungen an. Dies ist besonders dann sinnvoll, wenn die Forschungsdaten zentral für das Verständnis der Publikation ist. Die Anforderungen variieren je nach Journal. Einige Journals haben eigene Research Data, Data Sharing bzw. Data Availability Policies.

Datenjournal

Neben den klassischen wissenschaftlichen Zeitschriften für Artikel, in denen Forschungsergebnisse beschrieben und interpretiert werden, gibt es Datenjournale (data journals), in denen Artikel veröffentlicht werden, die Daten nur beschreiben, aber nicht interpretieren. Solche Artikel beschreiben z.B. Datensätze, die besonders aussagekräftig, umfangreich oder komplex sind. Der besondere Vorteil dieser Datenbeschreibungen ist, dass sie wie Forschungsartikel in klassischen Fachzeitschriften einem Peer-Review-Verfahren unterliegen und damit einem hohen Qualitätsstandard entsprechen.

Die im Artikel beschriebenen Daten sind nur mit dem Artikel verlinkt und werden separat, idealerweise in einem Datenrepositorium, veröffentlicht. Natürlich ist es ebenso wichtig, in dem Repositorium, in dem die Daten publiziert wurden, einen Link (bestenfalls inkl. DOI) zum Datenjournal-Artikel bereitzustellen.

Auf diese Weise kann eine Datenpublikation in einem Datenrepositorium verschiedene Artikel umfassen: einen Artikel in einem Datenjournal (detaillierte Beschreibung, ohne Interpretation) und einen Forschungsartikel in einem klassischen Fachjournal (mit Schwerpunkt auf der Interpretation der Daten). Eine Data Journal Übersicht gibt es unter: https://www.forschungsdaten.org/index.php/Data_Journals

Forschungsdatenrepositorien

Definition

Repositorien sind Speicherorte für digitale Objekte, die diese einem öffentlichen oder eingeschränkten Nutzerkreis zur Verfügung stellen. Repositorien können unterschieden werden

  • nach der Art der zu speichernden Objekte (Publikationen oder Forschungsdaten),
  • nach der Domäne der enthaltenen Daten (institutionell, disziplinär oder generisch)
  • nach der Dauer der Aufbewahrung der Daten (z.B. 10 Jahre, um den Regeln guter wissenschaftlicher Praxis zu entsprechen, oder dauerhaft) oder
  • nach den Richtlinien, nach denen die Daten abgerufen und weiterverwendet werden können.

Beispiele für Repositorien können der institutionelle Publikationsserver einer Universität, ein fachspezifisches Open-Access-Repositorium, ein fachspezifisches Datenrepositorium oder ein Langzeitarchiv für Daten und Publikationen sein.

Häufig prüfen Kuratorinnen und Kuratoren die Daten vor der Aufnahme in das Repositorium (Ingest) hinsichtlich ihrer inhaltlichen oder technischen Qualität, teilweise auch hinsichtlich rechtlicher Aspekte (Urheberrecht, Datenschutz). Damit stellen sie sicher, dass die Daten in der vorliegenden Form für Dritte nutzbar sind.

Funktionsweise

Ein Repositorium besteht im Wesentlichen aus einer Repositoriumssoftware und einer Datenbank. Datengeber können ihre Daten über eine webbasierte Benutzeroberfläche in das Repositorium übertragen oder der Repositorienbetreiber sammelt die Daten automatisiert über entsprechende Protokolle und Schnittstellen von anderen Plattformen ein (Harvesting).

Für die Nachnutzung durch Dritte werden neben den eigentlichen Daten auch deren Metadaten benötigt. Diese können vom Datengeber teilweise aus anderen Anwendungen übernommen oder manuell hinzugefügt werden. Metadaten beschreiben den Inhalt der Forschungsdaten und geben Auskunft über ihre Entstehung, die verwendete Software oder Methoden sowie rechtliche Aspekte. In den Metadaten sollten auch Nutzungsbedingungen in Form von Lizenzen festgelegt werden, die u.a. den Zugang zu den Daten regeln (Registrierung, Sperrfrist o.ä.).

Um die Daten dauerhaft referenzierbar und zitierfähig zu machen, vergeben die meisten Repositorien eindeutige persistente Identifikatoren. Sowohl über die persistenten Identifikatoren (häufig DOIs oder URNs) als auch über entsprechende Schnittstellen sind die Inhalte vieler Repositorien in Suchmaschinen und Fachdatenbanken (z.B. Google Scholar) indexiert. Darüber hinaus verfügen die Repositorien über eine Suchfunktion, mit der die Nutzerinnen und Nutzer die enthaltenen Daten finden, betrachten und herunterladen können.

Auswahl

Die Auswahl eines geeigneten Repositoriums sollte sich nach den Gepflogenheiten der jeweiligen Fachdisziplin bzw. den Vorgaben von Förderinstitutionen oder Verlagen richten. Sie hängt auch davon ab, ob die Daten für einen bestimmten Zeitraum (z.B. 10 Jahre) aufbewahrt oder langzeitarchiviert werden sollen.

Sofern keine Vorgaben bestehen, sollten zunächst fachspezifische Repositorien als Speicherorte in Erwägung gezogen werden. Es gibt verschiedene Verzeichnisse, die die Suche nach einem geeigneten Repositorium erleichtern. Einen weltweiten Überblick über Forschungsdatenrepositorien bietet z.B. der Service Registry of Research Data Repositories re3data.org. Mit ROAR und OPENDOAR stehen Verzeichnisse zur Verfügung, die Open-Access-Repositorien aus aller Welt auflisten. Über Such- und Filterfunktionen kann die Auswahl auf diesen Seiten angepasst und eingegrenzt werden.

Für die Speicherung und Veröffentlichung von Forschungsdaten, für die kein geeignetes fachliches Repositorium existiert, bieten sich institutionelle Repositorien an, die von einer wachsenden Zahl von Hochschulen und Forschungseinrichtungen angeboten werden, oder generische Repositorien (z.B. Zenodo oder figshare) die häufig von zentralen Einrichtungen oder Non-Profit-Organisationen bereitgestellt werden.

GRO.data Ostfalia

GRO.data bietet sich als neu eingerichtetes institutionelles Datenrepositorium als Fallback-Lösung an – falls den Forschenden kein anerkanntes fachspezifisches Repositorium bekannt ist. Das Datenrepositorium GRO.data wird erst relevant, wenn Daten zur Nachnutzung/ Weiterverwendung freigegeben werden sollen. Dieses Werkzeug wurde erst kürzlich über die Academic Cloud Services eingerichtet und sollte erst nach Rücksprache mit Herrn Norman Peitz genutzt werden.