Wiki-Quellcode von Datenorganisation

Version 28.1 von Gabriele Nicole Stiller am 2025/03/03 10:00

Verstecke letzte Bearbeiter
Gabriele Nicole Stiller 1.1 1 {{box cssClass="floatinginfobox" title="**Contents**"}}
2 {{toc/}}
3 {{/box}}
4
Gabriele Nicole Stiller 17.2 5
Gabriele Nicole Stiller 6.2 6 = Ordner- / Verzeichnisstruktur =
Gabriele Nicole Stiller 1.1 7
Gabriele Nicole Stiller 9.2 8 (% class="wikigeneratedid" %)
Gabriele Nicole Stiller 25.3 9 [[image:2025-02-11_Datenorganisation_Ordnerstruktur.jpg||data-xwiki-image-style-text-wrap="true" height="278" width="450"]]
Gabriele Nicole Stiller 6.3 10
Gabriele Nicole Stiller 17.2 11 (% class="wikigeneratedid" %)
Gabriele Nicole Stiller 17.5 12 Ein erster Schritt um effizient mit Daten umzugehen, ist die Erstellung und Nutzung einer klaren Struktur. Zu einer effizienten Datenorganisation gehören grundlegende Punkte wie die Verwendung einer Ordnerstruktur. Jeder Ordner enthält Daten, die strukturell oder inhaltlich zusammengehören und sollte entsprechend benannt werden. Eine Benennung der Ordner nach Mitarbeiterinnen und Mitarbeitern ist nicht zu empfehlen, da nicht sofort ersichtlich ist, was sich in einem solchen Ordner verbirgt. Am besten geeignet, weil am übersichtlichsten, ist eine Ordnerhierarchie mit nicht mehr als 2-3 Ebenen. Um die Anzahl der Ordner und Unterordner so gering wie möglich zu halten, empfiehlt es sich, nach jedem Projekt zu überprüfen, welche Daten und damit Ordner aufbewahrt werden müssen und welche gelöscht werden können.
Gabriele Nicole Stiller 17.2 13
Gabriele Nicole Stiller 3.6 14 == Readme-Template ==
Gabriele Nicole Stiller 1.1 15
Gabriele Nicole Stiller 2.3 16 ReadMe-Dateien enthalten in kompakter und strukturierter Form Informationen zu Forschungsdaten, Forschungsdatensätzen oder Forschungsdatensammlungen und liegen häufig als einfache Textdatei oder in TEI-xml (.txt; .md; .xml) vor. In diesem Zusammenhang können ReadMe-Dateien begleitend zu Forschungsdaten publiziert werden oder der strukturierten Ablage von Forschungsdaten am Ende eines Projektes dienen (z.B. auf einem Institutsserver oder einem Repositorium zur Archivierung). ReadMe-Dateien sammeln zentrale Metadaten zum Projekt, in dem die Daten entstanden sind (z.B. Projektname, beteiligte Personen, Förderung), geben Auskunft über verwendete Benennungsstandards, Ordnerstrukturen, Abkürzungen und Normdaten und protokollieren Änderungen und Versionierungen von Forschungsdaten.
Gabriele Nicole Stiller 1.1 17
Gabriele Nicole Stiller 26.2 18 == Benennungskonvention ==
19
Gabriele Nicole Stiller 26.3 20 * Einheitliches Schema
21 * Bezug zum Inhalt
Gabriele Nicole Stiller 26.4 22 * kurze Namen bevorzugen
Gabriele Nicole Stiller 26.3 23 * Leer- und Sonderzeichen sowie Umlaute vermeiden
Gabriele Nicole Stiller 26.4 24 * Namenskonventionen und verwendete Abkürzungen dokumentieren
Gabriele Nicole Stiller 26.2 25
Gabriele Nicole Stiller 26.8 26 === Mögliche Bestandteile ===
Gabriele Nicole Stiller 26.5 27
Gabriele Nicole Stiller 26.6 28 (% style="width:687px" %)
29 |(% style="width:299px" %)(((
Gabriele Nicole Stiller 26.5 30 Datum (z.B. ISO 8601 JJJJ-MM-TT)
Gabriele Nicole Stiller 26.6 31 )))|(% style="width:204px" %)Projektnummer|(% style="width:179px" %)(((
32 Kurztitel
33 )))
34 |(% style="width:299px" %)(((
35 Name oder Namenskürzel
36 )))|(% style="width:204px" %)(((
37 Forschungsgruppe
38 )))|(% style="width:179px" %)(((
39 Versionsnummer
40 )))
Gabriele Nicole Stiller 26.5 41
Gabriele Nicole Stiller 28.1 42 ==== **Beispiel** ====
Gabriele Nicole Stiller 26.7 43
Gabriele Nicole Stiller 28.1 44 (% class="wikigeneratedid" %)
45 [Datum]_[Titel]_[Namenskuerzel]_[Version].pdf => 2025-02-28_Quartalsbericht_GS_v1.pdf
Gabriele Nicole Stiller 26.7 46
Gabriele Nicole Stiller 28.1 47
Gabriele Nicole Stiller 23.2 48 == Versionierung ==
Gabriele Nicole Stiller 1.1 49
Gabriele Nicole Stiller 23.7 50 Bei der Arbeit mit Daten verändern sich diese zwangsläufig. Es empfiehlt sich, die jeweiligen Arbeitsstände mit Hilfe von Versionierungen zu kennzeichnen und so nachvollziehbar zu machen. Hierfür sollte ein vorher festgelegtes, einfach verständliches Versionierungsschema (z. B. Version 1.3 oder Version 2.1.4) genutzt werden. Die Versionierung von Daten kann dabei entweder händisch oder mittels [[Versionierungssoftware >>https://digitalconomics.de/versionsverwaltung-software-im-vergleich/]]wie git erfolgen. Versioniert werden sollte zum einen während des Forschungsprozesses selbst, etwa um verschiedene Arbeitsversionen von Daten zu kennzeichnen, zum anderen bei nachträglichen Veränderungen an bereits veröffentlichten Forschungsdatensätzen, um Nachnutzenden zu ermöglichen, die korrekte Version eines Forschungsdatensatzes zu zitieren.
Gabriele Nicole Stiller 2.3 51
Gabriele Nicole Stiller 23.1 52 * Sequentielle Nummerierung verwenden
53 * Datum und Versionsnummer in die Benennung einbeziehen
54 * Nutzung einer Versionskontrolltabelle
55 * Verantwortlichkeit für die Fertigstellung von Dateien festlegen
56 * Bei großen Datenmengen ggf. Versionsverwaltungs-Software verwenden
57 * Meilenstein-Versionen speichern
Gabriele Nicole Stiller 22.7 58
Gabriele Nicole Stiller 22.9 59 === Werkzeuge für gleichzeitige Umbenennung ===
Gabriele Nicole Stiller 22.3 60
Gabriele Nicole Stiller 22.7 61 |**Windows**|**Mac**|**Linux**|**Unix **
Gabriele Nicole Stiller 22.5 62 |(((
Gabriele Nicole Stiller 22.4 63 * Ant Renamer ([[www.antp.be/software/renamer>>url:http://www.antp.be/software/renamer]])
64 * RenameIT ([[sourceforge.net/prpjects/renameit>>url:http://sourceforge.net/projects/renameit/]])
65 * Bulk Rename Utility ([[www.bulkrenameutility.co.uk/>>url:http://www.bulkrenameutility.co.uk/]])
Gabriele Nicole Stiller 22.5 66 * Total Commander ([[https:~~/~~/www.ghisler.com/deutsch.htm>>url:https://www.ghisler.com/deutsch.htm]])
67 )))|(((
68 * Renamer 6 (for Mac) ([[renamer.com/>>url:http://renamer.com/]])
69 * Name Changer ([[mrrsoftware.com/namechanger/>>url:http://mrrsoftware.com/namechanger/]])
Gabriele Nicole Stiller 22.9 70 * ExifRenamer ([[https:~~/~~/www.qdev.de/?location=mac/exifrenamer>>url:https://www.qdev.de/?location=mac/exifrenamer]])
Gabriele Nicole Stiller 22.5 71 )))|(((
72 * GNOME Commander ([[www.nongnu.org/gcmd/>>url:http://gcmd.github.io/]])
73 * GPRename ([[http:~~/~~/gprename.sourceforge.net/>>url:http://gprename.sourceforge.net/]])
Gabriele Nicole Stiller 22.7 74 )))|Rename command (rename, mv)
Gabriele Nicole Stiller 22.4 75
Gabriele Nicole Stiller 23.1 76 = FDM-Workflow =
Gabriele Nicole Stiller 10.2 77
Gabriele Nicole Stiller 3.8 78 Ein FDM-Workflow ist eine Abfolge wiederholbarer Prozesse, die Forschungsdaten während ihres Lebenszyklus durchlaufen. Dazu gehören Aktivitäten, die bei der Erhebung, Kuratierung und Aufbewahrung sowie bei der Bereitstellung und einer möglichen späteren Entsorgung durchgeführt werden. Diese Definition kann auch auf Aktivitäten erweitert werden, die vor der Erstellung der Forschungsdaten stattfinden. Dazu gehören beispielsweise die FDM-Planung oder auch die Erstellung von Datenmanagementplänen für Förderanträge. Eine klar dokumentierte Workflowstruktur erleichtert die Übersicht, hilft Fehler, wie das Überspringen notwendiger Schritte, zu vermeiden und unterstützt die Datenverwertung insgesamt. Auch die Einarbeitung neuer Mitarbeiterinnen und Mitarbeiter wird erleichtert. Ein möglicher Workflow könnte so aussehen:
Gabriele Nicole Stiller 1.1 79
Gabriele Nicole Stiller 4.1 80 |(% style="width:266px" %)**Projektbeginn**|(% style="width:466px" %)**Projektlaufzeit**|(% style="width:437px" %)**Archivierung**|(% style="width:539px" %)**Veröffentlichung**|(% style="width:539px" %)**Nachnutzung**
Gabriele Nicole Stiller 3.10 81 |(% style="width:266px" %)(((
82 * Datenmanagementplan erstellen
83 * Datenmodellierung planen
Gabriele Nicole Stiller 3.9 84 * Daten zusammenstellen
Gabriele Nicole Stiller 3.13 85 )))|(% style="width:466px" %)(((
Gabriele Nicole Stiller 3.12 86 * Analyse der Daten in einen standardisierten Ablauf bringen
87 * Datendokumentation durch Vergabe von Metadaten (technische, bibliographische)
88 * Erstellung kollaborativer bzw. virtueller Forschungsumgebungen
89 * Visualisierung der Daten
90 * Datensicherung (z. B. durch Backups)
Gabriele Nicole Stiller 3.13 91 )))|(% style="width:437px" %)(((
92 * Festlegen, welche Daten archiviert werden
93 * Metadatenvergabe abschließen und dokumentieren
94 * nachhaltige Datenformate und -träger ermitteln
95 * Zuständigkeiten für die Überführung in das Archiv festlegen
Gabriele Nicole Stiller 3.14 96 )))|(% style="width:539px" %)(((
97 * Publikationsmedium festlegen: Möglichkeiten für Open-Access-Publikation abklären
98 * Forschungsprimärdaten abrufbar gestalten (z. B. in einem Repositorium)
99 * Zitierbarkeit der Daten durch Persistent Identifier gewährleisten
Gabriele Nicole Stiller 4.1 100 )))|(% style="width:539px" %)(((
101 * Langfristige Verfügbarkeit und Zitierbarkeit garantieren
102 * Abklären rechtlicher Aspekte (Urheberrecht, Datenschutz)
103 * mögliche Sperrfristen berücksichtigen
104 )))
Gabriele Nicole Stiller 3.9 105
Gabriele Nicole Stiller 17.7 106 Anstelle eines manuellen und arbeitsintensiven FDM kann der Workflow eines FDM mit Hilfe von Tools automatisiert werden.
Gabriele Nicole Stiller 4.2 107
Gabriele Nicole Stiller 21.2 108 = Werkzeuge und Tools =
109
110 == Academic Cloud Services ==
111
Gabriele Nicole Stiller 23.6 112 Über den individuellen Ostfalia-Account kann man Dienste und Tools in der Academic Cloud nutzen.
Gabriele Nicole Stiller 21.2 113
Gabriele Nicole Stiller 23.6 114 Nach Anmeldung unter  [[https:~~/~~/academiccloud.de/services/>>https://academiccloud.de/services/]] erscheint eine Übersicht über alle freigeschalteten Dienste:
Gabriele Nicole Stiller 21.2 115
Gabriele Nicole Stiller 23.6 116 [[image:250219_Academic_Cloud_Services.png||alt="Übersicht der Academic Cloud Dienste mit Ostfalia-Account" height="402" width="846"]]
117
Gabriele Nicole Stiller 22.1 118 (% class="wikigeneratedid" %)
Gabriele Nicole Stiller 22.2 119 //Screenshot mit Stand 19.02.2025//
Gabriele Nicole Stiller 1.1 120
Gabriele Nicole Stiller 23.5 121 == Rechenzentrum Ostfalia ==
Gabriele Nicole Stiller 1.1 122
Gabriele Nicole Stiller 21.6 123 (% class="wikigeneratedid" id="HPowerFolder" %)
124 Als Speicherlösungen für kollaboratives Arbeiten bietet das Rechenzentrum die Plattform [[Alfresco>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/Anwendungen%20f%C3%BCr%20die%20interdisziplin%C3%A4re%20Zusammenarbeit/Alfresco/]] und den Sync & Share Dienst [[PowerFolder>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/PowerFolder%20-%20Sync%26Share%20Dienst%20des%20Rechenzentrums/]] an.
125
Gabriele Nicole Stiller 23.3 126 Das [[Backupsystem des RZ>>url:https://www.ostfalia.de/cms/de/rz/servicekatalog/server/]], ermöglicht regelmäßige und automatisierte Datensicherung von Servern und Rechnern. Ein Backup wird dadurch sichergestellt, dass die Daten auf unterschiedliche Medien an unterschiedlichen Standorten verteilt versioniert gespeichert werden, so dass die Wiederherstellbarkeit im Falle eines ungewollten Datenverlustes für einen bestimmten Zeitraum gegeben ist.