1 - Datenmanagementplan (DMP)

Version 19.1 von Gabriele Nicole Stiller am 2025/05/12 11:18

Information

Der Inhalt dieser Seite spiegelt die Handreichung Datenmanagementplan.

1. Definition und Zweck

Ein Datenmanagementplan (DMP) ist ein Dokument, das den künftigen Umgang mit Forschungsdaten beschreibt. Er dokumentiert den Umgang mit Daten während des Forschungsprozesses, deren Archivierung und langfristige Verfügbarkeit nach Abschluss des Projekts sowie die Klärung von Verantwortlichkeiten und Pflichten. Die Erstellung eines DMP zu Beginn eines Projekts bietet den Vorteil, dass Herausforderungen frühzeitig erkannt und geeignete Strategien entwickelt werden können, um die Nachnutzbarkeit der Daten sicherzustellen und den Forschungsprozess effizienter zu gestalten. Datenmanagementpläne sind keine abgeschlossenen Dokumentationen, sie können auch noch im Laufe des Projektes noch aktualisiert und konkretisiert werden.

2. Vorgaben und Unterstützung

Viele Drittmittelgeber und Institutionen verlangen die Erstellung eines DMP und haben konkrete Anforderungen zum Umgang mit Forschungsdaten. Bitte informieren Sie sich über die für Sie geltenden Vorgaben und Besonderheiten Ihres wissenschaftlichen Fachgebiets.

Für die Ostfalia Hochschule gelten:

Die folgenden Bestandteile gehen allgemein auf die wesentlichen Bestandteile eines DMP ein und geben Hinweise und Beispiele, die Forschenden helfen sollen, den Umgang mit Forschungsdaten sorgfältig zu planen und die FAIR-Prinzipien (Daten sollen findable, accessible, interoperable, reusable sein.) zu erfüllen. Sie ist als Hilfestellung und nicht als verbindliche Vorgabe zu verstehen. Je nach Projekt kann es sinnvoll sein, die Reihenfolge der Informationen zu ändern oder nicht relevante Punkte wegzulassen.

3. Bestandteile des Datenmanagementplans

3.1 Administrative Informationen

  • Worum geht es in Ihrem Forschungsprojekt?

Nennen Sie Titel, Dauer, Ziel, die Rahmenbedingungen und den Kontext des Projekts.

  • Wer ist für das Forschungsdatenmanagement im gesamten Projekt verantwortlich?

Geben Sie die Verantwortlichen für Aufgaben wie Dokumentation, Qualitätskontrolle, Archivierung und Publikation der Daten an.

3.2 Beschreibung der Daten

3.2.1 Datenerhebung

Von Anfang an sollte geregelt werden, wo die Daten gespeichert werden und wer darauf zugreifen kann.

  • Wie werden die Daten während des Forschungsprojekts gespeichert und gesichert?
  • Wer hat während der aktiven Projektphase Zugriff auf die Daten?
    • Werden bereits vorhandene Daten nachgenutzt?
      Überprüfen Sie, ob bzw. in welchem Umfang die Nachnutzung der Daten gestattet ist und zitieren Sie die Datenquelle.
    • Welche unterschiedlichen Datentypen (z.B. Messdaten, Laborwerte, Umfragen, Beobachtungsdaten) fallen im Projekt an?
    • Wie werden die Daten erhoben und weiterverarbeitet? Werden Geräte oder eine bestimmte Software zur Erhebung oder Analyse der Daten verwendet?
    • In welchem Format liegen die Daten vor? Orientieren Sie sich bei der Wahl des Formats an fachspezifischen Standards. Für die langfristige Aufbewahrung von digitalen Forschungsdaten eignen sich insbesondere einfache, nicht-proprietäre und weit verbreitete Formate.
    • Mit welcher Datenmenge rechnen Sie im Projekt? Selbst eine ungefähre Schätzung ist hilfreich, um geeignete Speicherorte und voraussichtliche Kosten zu identifizieren.

3.2.2 Dokumentation

  • Wie werden Methoden und Vorgehensweisen bei der Erhebung und Verarbeitung der Daten dokumentiert? Verwenden Sie z.B. Laborbücher, Codebücher, README-Dateien, Logdateien, Annotationen innerhalb der Dateien?
  • Gibt es eine standardisierte Metadatenerfassung?
    Bedenken Sie dabei auch vorhandene Metadatenstandards Ihres Fachgebietes und die Interdisziplinarität der gewählten Metadaten. Eine Auflistung von Metadatenstandards finden Sie hier: https://nfdi.de, https://rd-alliance.github.io/metadata-directory/standards/https://www.dcc.ac.uk/guidance/standards/metadata
  • Sind Ihre Daten reproduzierbar?
    Beschreiben Sie, welche Voraussetzungen (z.B. Ausstattung, Aufwand, Kosten) für die Reproduzierbarkeit der Forschungsergebnisse nötig sind.
  • Wie strukturieren und benennen Sie Ihre Dateien?
    Sind die Dateien gemäß Unterprojekten, Methoden oder spezifischen Forschungsfragen angeordnet?
    Wählen Sie eine Konvention für die Dateibenennung, z.B. JJJJMMTT_Thema_Methode_Version
  • Wie gehen Sie mit verschiedenen Dateiversionen um?
    Erstellen Sie z.B. manuelle Kopien oder verwenden Sie Versionskontrollsoftware wie Git?
    Wie werden die Unterschiede der Versionen dokumentiert?

3.2.3 Qualitätskontrolle

  • Wie wird die Qualität der Daten sichergestellt? Werden z.B. Experimente wiederholt, Gegenproben mit anderen Daten gemacht oder automatische Plausibilitätsprüfungen durchgeführt?
  • Wie wird die Qualität der Metadaten sichergestellt? Wer vergibt oder prüft die Metadaten? Werden die Metadaten (halb-)automatisch erzeugt, z.B. durch Geräte oder Metadatentools?

3.3 Datensicherung

  • Wo werden die Daten während des Projekts gespeichert? Werden alle Daten des Projekts an einer Stelle zentral abgelegt oder werden sie lokal bei den Projektpartner:innen gespeichert und nur bei Bedarf ausgetauscht?
    Als Speicherlösungen für kollaboratives Arbeiten bietet das Rechenzentrum die Plattform Alfresco und Nextcloud an. Alle Daten werden DSGVO-konform lokal im Serverraum in Wolfenbüttel verarbeitet. 
  • Wie erlauben Sie den Projektmitgliedern den Zugang zu den Daten? Werden Berechtigungen und Rollen vergeben? Kann auch externen Projektpartner:innen Zugriff auf Daten gewährt werden?
  • Wie gehen Sie mit vertraulichen Daten um? Gibt es sichere Authentifizierungsmethoden, starke Passwörter und Verschlüsselungsmaßnahmen?
  • Welche Backup-Strategien wenden Sie an?
    Das Backupsystem des RZ, ermöglicht regelmäßige und automatisierte Datensicherung von Servern und Rechnern. Ein Backup wird dadurch sichergestellt, dass die Daten auf unterschiedliche Medien an unterschiedlichen Standorten verteilt versioniert gespeichert werden, so dass die Wiederherstellbarkeit im Falle eines ungewollten Datenverlustes für einen bestimmten Zeitraum gegeben ist.
  • Welche Daten werden nach Projektabschluss langfristig archiviert?
  • Falls Ihre Daten nicht in digitaler Form vorliegen, ist ebenfalls anzugeben, wo und wie lange die Daten aufbewahrt werden.

3.4 Datenpublikation

  • Welches Nachnutzungspotential haben Ihre Daten? Beschreiben Sie den Nutzen der Daten für Dritte. Überlegen Sie insbesondere, welche Daten nicht, schwer oder teuer zu reproduzieren sind, und deshalb veröffentlicht werden sollten.
  • Wo möchten Sie Ihre Daten publizieren? Im Register re3data sind über 2000 Repositorien für Forschungsdaten gelistet. Nennen Sie Gründe für die Wahl eines Repositoriums, z.B. Kosten, Vergabe persistenter Identifikatoren, Lizenzen, Verbreitung in der Community.
  • Welche Lizenzen werden vergeben? Sofern die Forschungsdaten die Schöpfungshöhe erreichen, können die Daten mit Lizenzen versehen werden. Diese legen fest, in welchem Umfang die Forschungsdaten nachgenutzt werden dürfen. Sofern keine Gründe dagegensprechen, sind im Sinne der Open-Access-Bewegung möglichst offene Lizenzen zu wählen, um die Nachnutzbarkeit der Daten zu erleichtern. Hier finden Sie detaillierte Informationen zur Wahl von Creative Commons- Lizenzen.
  • Werden bestimmte Forschungsdaten nicht oder mit Einschränkungen veröffentlicht? Geben Sie an, ob und wie der Zugriff auf die Daten beschränkt wird oder ob die Daten erst nach Ablauf einer Embargofrist veröffentlicht werden. Nennen Sie Gründe dafür, z.B. Schutz personenbezogener Daten oder vertraulicher Firmendaten, Patentansprüche o.ä.

3.5 Rechtliche und ethische Aspekte

  • Wird das Urheberrecht bei der Nachnutzung von Daten und bei der Lizenzvergabe beachtet? Prüfen Sie, in welchem Umfang Daten verarbeitet und weiterverbreitet werden dürfen. Beachten Sie auch vertragliche Vereinbarungen zwischen Ihnen und Ihrem Arbeitgeber, dem Forschungsförderer und Ihren Projektpartner:innen. Weiterführende Informationen finden Sie auch unter Erfindungsmeldungen und Patente.
  • Werden personenbezogene Daten erhoben? Beschreiben Sie, welche Maßnahmen Sie zur Erfüllung der gesetzlichen Vorgaben zu Datenschutz und Datensicherheit ergreifen. Wird beispielsweise die Einwilligungserklärung der betroffenen Personen eingeholt? Werden personenbezogene Daten anonymisiert oder pseudonymisiert? Wenden Sie sich bei Fragen an den Datenschutzbeauftragten.
  • Sind in Ihrem Projekt ethische Aspekte zu beachten? Legen Sie dar, ob die Datenerhebung negative gesundheitliche, soziale oder wirtschaftliche Auswirkungen auf Studienteilnehmende haben könnte. Prüfen Sie, ob ein Ethikvotum bei der Ethikkommission einzuholen ist.

3.6 Ressourcen und Verantwortlichkeiten

In der Anfangsphase eines Projekts ist es wichtig, die Verantwortlichkeiten und Rechte der beteiligten Personen / Institutionen zu klären. Die zu erwartenden Kosten sollten ebenfalls im Vorfeld abgeschätzt und direkt mit beantragt werden.

  • Wer hat die Rechte an den Daten?
  • Wer ist für das Datenmanagement verantwortlich und über die Projektdauer hinaus Ansprechpartner für den Datensatz?
  • Welche infrastrukturellen und personellen Ressourcen werden benötigt und welche Kosten werden erwartet?

4. Tools und Bespiele

4.1 GRO.plan

Göttingen Research Online Plan ist ein Dienst zur Erstellung von Datenmanagementplänen für Forschungsprojekte. Er wird von der Göttingen eResearch Alliance betrieben und basiert auf der Open-Source-Software RDMO. Der Dienst ermöglicht es Ihnen, alle relevanten Planungsinformationen (ggf. kollaborativ) zu erfassen und alle Datenmanagementaufgaben über den gesamten Datenlebenszyklus in einem anpassbaren Dokument inklusive Versionierung und Rechtemanagement zu verwalten. Mit dem GRO.plan können Sie einen neuen Datenmanagementplan (DMP) erstellen oder einen bestehenden importieren und anpassen. Dieser Service basiert auf der vom RDMO-Projekt zur Verfügung gestellten, freien Software. RDMO ist als freie Software unter GitHub verfügbar.

Zugang erhalten Sie über https://plan.goettingen-research-online.de/ bzw. besuchen Sie rdmorganiser.github.io 

Das zugehörige FAQ finden Sie unter https://www.forschungsdaten.org/index.php/RDMO_FAQ

4.2 Survival-Kit

Datenmanagementpläne (DMP) nach Förderern unter https://zenodo.org/records/13321170

4.3 Beispiele & Musterdatenmanagementpläne