Datenorganisation

= Ordner- / Verzeichnisstruktur =

(% class="wikigeneratedid" %)

[[image:2025-02-11_Datenorganisation_Ordnerstruktur.jpg||data-xwiki-image-style-text-wrap="true" height="278" width="450"]]

10

11

(% class="wikigeneratedid" %)

12

Ein erster Schritt um effizient mit Daten umzugehen, ist die Erstellung und Nutzung einer klaren Struktur. Zu einer effizienten Datenorganisation gehören grundlegende Punkte wie die Verwendung einer Ordnerstruktur. Jeder Ordner enthält Daten, die strukturell oder inhaltlich zusammengehören und sollte entsprechend benannt werden. Eine Benennung der Ordner nach Mitarbeiterinnen und Mitarbeitern ist nicht zu empfehlen, da nicht sofort ersichtlich ist, was sich in einem solchen Ordner verbirgt. Am besten geeignet, weil am übersichtlichsten, ist eine Ordnerhierarchie mit nicht mehr als 2-3 Ebenen. Um die Anzahl der Ordner und Unterordner so gering wie möglich zu halten, empfiehlt es sich, nach jedem Projekt zu überprüfen, welche Daten und damit Ordner aufbewahrt werden müssen und welche gelöscht werden können.

13

14

== Readme-Template ==

15

16

ReadMe-Dateien enthalten in kompakter und strukturierter Form Informationen zu Forschungsdaten, Forschungsdatensätzen oder Forschungsdatensammlungen und liegen häufig als einfache Textdatei oder in TEI-xml (.txt; .md; .xml) vor. In diesem Zusammenhang können ReadMe-Dateien begleitend zu Forschungsdaten publiziert werden oder der strukturierten Ablage von Forschungsdaten am Ende eines Projektes dienen (z.B. auf einem Institutsserver oder einem Repositorium zur Archivierung). ReadMe-Dateien sammeln zentrale Metadaten zum Projekt, in dem die Daten entstanden sind (z.B. Projektname, beteiligte Personen, Förderung), geben Auskunft über verwendete Benennungsstandards, Ordnerstrukturen, Abkürzungen und Normdaten und protokollieren Änderungen und Versionierungen von Forschungsdaten.

17

18

== Benennungskonvention ==

19

20

* Einheitliches Schema

21

* Bezug zum Inhalt

22

* kurze Namen bevorzugen

23

* Leer- und Sonderzeichen sowie Umlaute vermeiden

24

* Namenskonventionen und verwendete Abkürzungen dokumentieren

25

26

Mögliche Bestandteile

27

28

|(((

29

Datum (z.B. ISO 8601 JJJJ-MM-TT)

)))|Projektnummer| |

| | | |

== Versionierung ==

Bei der Arbeit mit Daten verändern sich diese zwangsläufig. Es empfiehlt sich, die jeweiligen Arbeitsstände mit Hilfe von Versionierungen zu kennzeichnen und so nachvollziehbar zu machen. Hierfür sollte ein vorher festgelegtes, einfach verständliches Versionierungsschema (z. B. Version 1.3 oder Version 2.1.4) genutzt werden. Die Versionierung von Daten kann dabei entweder händisch oder mittels [[Versionierungssoftware >>https://digitalconomics.de/versionsverwaltung-software-im-vergleich/]]wie git erfolgen. Versioniert werden sollte zum einen während des Forschungsprozesses selbst, etwa um verschiedene Arbeitsversionen von Daten zu kennzeichnen, zum anderen bei nachträglichen Veränderungen an bereits veröffentlichten Forschungsdatensätzen, um Nachnutzenden zu ermöglichen, die korrekte Version eines Forschungsdatensatzes zu zitieren.

36

37

* Sequentielle Nummerierung verwenden

38

* Datum und Versionsnummer in die Benennung einbeziehen

39

* Nutzung einer Versionskontrolltabelle

40

* Verantwortlichkeit für die Fertigstellung von Dateien festlegen

41

* Bei großen Datenmengen ggf. Versionsverwaltungs-Software verwenden

42

* Meilenstein-Versionen speichern

43

44

=== Werkzeuge für gleichzeitige Umbenennung ===

45

46

|**Windows**|**Mac**|**Linux**|**Unix **

47

|(((

48

* Ant Renamer ([[www.antp.be/software/renamer>>url:http://www.antp.be/software/renamer]])

49

* RenameIT ([[sourceforge.net/prpjects/renameit>>url:http://sourceforge.net/projects/renameit/]])

50

* Bulk Rename Utility ([[www.bulkrenameutility.co.uk/>>url:http://www.bulkrenameutility.co.uk/]])

51

* Total Commander ([[https:~~/~~/www.ghisler.com/deutsch.htm>>url:https://www.ghisler.com/deutsch.htm]])

52

)))|(((

53

* Renamer 6 (for Mac) ([[renamer.com/>>url:http://renamer.com/]])

54

* Name Changer ([[mrrsoftware.com/namechanger/>>url:http://mrrsoftware.com/namechanger/]])

55

* ExifRenamer ([[https:~~/~~/www.qdev.de/?location=mac/exifrenamer>>url:https://www.qdev.de/?location=mac/exifrenamer]])

56

)))|(((

57

* GNOME Commander ([[www.nongnu.org/gcmd/>>url:http://gcmd.github.io/]])

58

* GPRename ([[http:~~/~~/gprename.sourceforge.net/>>url:http://gprename.sourceforge.net/]])

59

)))|Rename command (rename, mv)

= FDM-Workflow =

Ein FDM-Workflow ist eine Abfolge wiederholbarer Prozesse, die Forschungsdaten während ihres Lebenszyklus durchlaufen. Dazu gehören Aktivitäten, die bei der Erhebung, Kuratierung und Aufbewahrung sowie bei der Bereitstellung und einer möglichen späteren Entsorgung durchgeführt werden. Diese Definition kann auch auf Aktivitäten erweitert werden, die vor der Erstellung der Forschungsdaten stattfinden. Dazu gehören beispielsweise die FDM-Planung oder auch die Erstellung von Datenmanagementplänen für Förderanträge. Eine klar dokumentierte Workflowstruktur erleichtert die Übersicht, hilft Fehler, wie das Überspringen notwendiger Schritte, zu vermeiden und unterstützt die Datenverwertung insgesamt. Auch die Einarbeitung neuer Mitarbeiterinnen und Mitarbeiter wird erleichtert. Ein möglicher Workflow könnte so aussehen:

64

65

|(% style="width:266px" %)**Projektbeginn**|(% style="width:466px" %)**Projektlaufzeit**|(% style="width:437px" %)**Archivierung**|(% style="width:539px" %)**Veröffentlichung**|(% style="width:539px" %)**Nachnutzung**

66

|(% style="width:266px" %)(((

67

* Datenmanagementplan erstellen

68

* Datenmodellierung planen

69

* Daten zusammenstellen

70

)))|(% style="width:466px" %)(((

71

* Analyse der Daten in einen standardisierten Ablauf bringen

72

* Datendokumentation durch Vergabe von Metadaten (technische, bibliographische)

73

* Erstellung kollaborativer bzw. virtueller Forschungsumgebungen

74

* Visualisierung der Daten

75

* Datensicherung (z. B. durch Backups)

76

)))|(% style="width:437px" %)(((

77

* Festlegen, welche Daten archiviert werden

78

* Metadatenvergabe abschließen und dokumentieren

79

* nachhaltige Datenformate und -träger ermitteln

80

* Zuständigkeiten für die Überführung in das Archiv festlegen

81

)))|(% style="width:539px" %)(((

82

* Publikationsmedium festlegen: Möglichkeiten für Open-Access-Publikation abklären

83

* Forschungsprimärdaten abrufbar gestalten (z. B. in einem Repositorium)

84

* Zitierbarkeit der Daten durch Persistent Identifier gewährleisten

85

)))|(% style="width:539px" %)(((

86

* Langfristige Verfügbarkeit und Zitierbarkeit garantieren

87

* Abklären rechtlicher Aspekte (Urheberrecht, Datenschutz)

88

* mögliche Sperrfristen berücksichtigen

89

)))

90

91

Anstelle eines manuellen und arbeitsintensiven FDM kann der Workflow eines FDM mit Hilfe von Tools automatisiert werden.

92

93

= Werkzeuge und Tools =

94

95

== Academic Cloud Services ==

96

97

Über den individuellen Ostfalia-Account kann man Dienste und Tools in der Academic Cloud nutzen.

98

99

Nach Anmeldung unter [[https:~~/~~/academiccloud.de/services/>>https://academiccloud.de/services/]] erscheint eine Übersicht über alle freigeschalteten Dienste:

100

101

[[image:250219_Academic_Cloud_Services.png||alt="Übersicht der Academic Cloud Dienste mit Ostfalia-Account" height="402" width="846"]]

102

103

(% class="wikigeneratedid" %)

104

//Screenshot mit Stand 19.02.2025//

105

106

== Rechenzentrum Ostfalia ==

107

108

(% class="wikigeneratedid" id="HPowerFolder" %)

109

Als Speicherlösungen für kollaboratives Arbeiten bietet das Rechenzentrum die Plattform [[Alfresco>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/Anwendungen%20f%C3%BCr%20die%20interdisziplin%C3%A4re%20Zusammenarbeit/Alfresco/]] und den Sync & Share Dienst [[PowerFolder>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/PowerFolder%20-%20Sync%26Share%20Dienst%20des%20Rechenzentrums/]] an.

110

111

Das [[Backupsystem des RZ>>url:https://www.ostfalia.de/cms/de/rz/servicekatalog/server/]], ermöglicht regelmäßige und automatisierte Datensicherung von Servern und Rechnern. Ein Backup wird dadurch sichergestellt, dass die Daten auf unterschiedliche Medien an unterschiedlichen Standorten verteilt versioniert gespeichert werden, so dass die Wiederherstellbarkeit im Falle eines ungewollten Datenverlustes für einen bestimmten Zeitraum gegeben ist.

Wiki-Quellcode von Datenorganisation

Suchen

Navigation

author	version	line-number	content
		1	{{box cssClass="floatinginfobox" title="Contents"}}
		2	{{toc/}}
		3	{{/box}}
		4
		5
		6	= Ordner- / Verzeichnisstruktur =
		7
		8	(% class="wikigeneratedid" %)
		9	[[image:2025-02-11_Datenorganisation_Ordnerstruktur.jpg\|\|data-xwiki-image-style-text-wrap="true" height="278" width="450"]]
		10
		11	(% class="wikigeneratedid" %)
		12	Ein erster Schritt um effizient mit Daten umzugehen, ist die Erstellung und Nutzung einer klaren Struktur. Zu einer effizienten Datenorganisation gehören grundlegende Punkte wie die Verwendung einer Ordnerstruktur. Jeder Ordner enthält Daten, die strukturell oder inhaltlich zusammengehören und sollte entsprechend benannt werden. Eine Benennung der Ordner nach Mitarbeiterinnen und Mitarbeitern ist nicht zu empfehlen, da nicht sofort ersichtlich ist, was sich in einem solchen Ordner verbirgt. Am besten geeignet, weil am übersichtlichsten, ist eine Ordnerhierarchie mit nicht mehr als 2-3 Ebenen. Um die Anzahl der Ordner und Unterordner so gering wie möglich zu halten, empfiehlt es sich, nach jedem Projekt zu überprüfen, welche Daten und damit Ordner aufbewahrt werden müssen und welche gelöscht werden können.
		13
		14	== Readme-Template ==
		15
		16	ReadMe-Dateien enthalten in kompakter und strukturierter Form Informationen zu Forschungsdaten, Forschungsdatensätzen oder Forschungsdatensammlungen und liegen häufig als einfache Textdatei oder in TEI-xml (.txt; .md; .xml) vor. In diesem Zusammenhang können ReadMe-Dateien begleitend zu Forschungsdaten publiziert werden oder der strukturierten Ablage von Forschungsdaten am Ende eines Projektes dienen (z.B. auf einem Institutsserver oder einem Repositorium zur Archivierung). ReadMe-Dateien sammeln zentrale Metadaten zum Projekt, in dem die Daten entstanden sind (z.B. Projektname, beteiligte Personen, Förderung), geben Auskunft über verwendete Benennungsstandards, Ordnerstrukturen, Abkürzungen und Normdaten und protokollieren Änderungen und Versionierungen von Forschungsdaten.
		17
		18	== Benennungskonvention ==
		19
		20	* Einheitliches Schema
		21	* Bezug zum Inhalt
		22	* kurze Namen bevorzugen
		23	* Leer- und Sonderzeichen sowie Umlaute vermeiden
		24	* Namenskonventionen und verwendete Abkürzungen dokumentieren
		25
		26	Mögliche Bestandteile
		27
		28	\|(((
		29	Datum (z.B. ISO 8601 JJJJ-MM-TT)
		30	)))\|Projektnummer\| \|
		31	\| \| \| \|
		32
		33	== Versionierung ==
		34
		35	Bei der Arbeit mit Daten verändern sich diese zwangsläufig. Es empfiehlt sich, die jeweiligen Arbeitsstände mit Hilfe von Versionierungen zu kennzeichnen und so nachvollziehbar zu machen. Hierfür sollte ein vorher festgelegtes, einfach verständliches Versionierungsschema (z. B. Version 1.3 oder Version 2.1.4) genutzt werden. Die Versionierung von Daten kann dabei entweder händisch oder mittels [[Versionierungssoftware >>https://digitalconomics.de/versionsverwaltung-software-im-vergleich/]]wie git erfolgen. Versioniert werden sollte zum einen während des Forschungsprozesses selbst, etwa um verschiedene Arbeitsversionen von Daten zu kennzeichnen, zum anderen bei nachträglichen Veränderungen an bereits veröffentlichten Forschungsdatensätzen, um Nachnutzenden zu ermöglichen, die korrekte Version eines Forschungsdatensatzes zu zitieren.
		36
		37	* Sequentielle Nummerierung verwenden
		38	* Datum und Versionsnummer in die Benennung einbeziehen
		39	* Nutzung einer Versionskontrolltabelle
		40	* Verantwortlichkeit für die Fertigstellung von Dateien festlegen
		41	* Bei großen Datenmengen ggf. Versionsverwaltungs-Software verwenden
		42	* Meilenstein-Versionen speichern
		43
		44	=== Werkzeuge für gleichzeitige Umbenennung ===
		45
		46	\|Windows\|Mac\|Linux\|Unix
		47	\|(((
		48	* Ant Renamer ([[www.antp.be/software/renamer>>url:http://www.antp.be/software/renamer]])
		49	* RenameIT ([[sourceforge.net/prpjects/renameit>>url:http://sourceforge.net/projects/renameit/]])
		50	* Bulk Rename Utility ([[www.bulkrenameutility.co.uk/>>url:http://www.bulkrenameutility.co.uk/]])
		51	* Total Commander ([[https:~~/~~/www.ghisler.com/deutsch.htm>>url:https://www.ghisler.com/deutsch.htm]])
		52	)))\|(((
		53	* Renamer 6 (for Mac) ([[renamer.com/>>url:http://renamer.com/]])
		54	* Name Changer ([[mrrsoftware.com/namechanger/>>url:http://mrrsoftware.com/namechanger/]])
		55	* ExifRenamer ([[https:~~/~~/www.qdev.de/?location=mac/exifrenamer>>url:https://www.qdev.de/?location=mac/exifrenamer]])
		56	)))\|(((
		57	* GNOME Commander ([[www.nongnu.org/gcmd/>>url:http://gcmd.github.io/]])
		58	* GPRename ([[http:~~/~~/gprename.sourceforge.net/>>url:http://gprename.sourceforge.net/]])
		59	)))\|Rename command (rename, mv)
		60
		61	= FDM-Workflow =
		62
		63	Ein FDM-Workflow ist eine Abfolge wiederholbarer Prozesse, die Forschungsdaten während ihres Lebenszyklus durchlaufen. Dazu gehören Aktivitäten, die bei der Erhebung, Kuratierung und Aufbewahrung sowie bei der Bereitstellung und einer möglichen späteren Entsorgung durchgeführt werden. Diese Definition kann auch auf Aktivitäten erweitert werden, die vor der Erstellung der Forschungsdaten stattfinden. Dazu gehören beispielsweise die FDM-Planung oder auch die Erstellung von Datenmanagementplänen für Förderanträge. Eine klar dokumentierte Workflowstruktur erleichtert die Übersicht, hilft Fehler, wie das Überspringen notwendiger Schritte, zu vermeiden und unterstützt die Datenverwertung insgesamt. Auch die Einarbeitung neuer Mitarbeiterinnen und Mitarbeiter wird erleichtert. Ein möglicher Workflow könnte so aussehen:
		64
		65	\|(% style="width:266px" %)Projektbeginn\|(% style="width:466px" %)Projektlaufzeit\|(% style="width:437px" %)Archivierung\|(% style="width:539px" %)Veröffentlichung\|(% style="width:539px" %)Nachnutzung
		66	\|(% style="width:266px" %)(((
		67	* Datenmanagementplan erstellen
		68	* Datenmodellierung planen
		69	* Daten zusammenstellen
		70	)))\|(% style="width:466px" %)(((
		71	* Analyse der Daten in einen standardisierten Ablauf bringen
		72	* Datendokumentation durch Vergabe von Metadaten (technische, bibliographische)
		73	* Erstellung kollaborativer bzw. virtueller Forschungsumgebungen
		74	* Visualisierung der Daten
		75	* Datensicherung (z. B. durch Backups)
		76	)))\|(% style="width:437px" %)(((
		77	* Festlegen, welche Daten archiviert werden
		78	* Metadatenvergabe abschließen und dokumentieren
		79	* nachhaltige Datenformate und -träger ermitteln
		80	* Zuständigkeiten für die Überführung in das Archiv festlegen
		81	)))\|(% style="width:539px" %)(((
		82	* Publikationsmedium festlegen: Möglichkeiten für Open-Access-Publikation abklären
		83	* Forschungsprimärdaten abrufbar gestalten (z. B. in einem Repositorium)
		84	* Zitierbarkeit der Daten durch Persistent Identifier gewährleisten
		85	)))\|(% style="width:539px" %)(((
		86	* Langfristige Verfügbarkeit und Zitierbarkeit garantieren
		87	* Abklären rechtlicher Aspekte (Urheberrecht, Datenschutz)
		88	* mögliche Sperrfristen berücksichtigen
		89	)))
		90
		91	Anstelle eines manuellen und arbeitsintensiven FDM kann der Workflow eines FDM mit Hilfe von Tools automatisiert werden.
		92
		93	= Werkzeuge und Tools =
		94
		95	== Academic Cloud Services ==
		96
		97	Über den individuellen Ostfalia-Account kann man Dienste und Tools in der Academic Cloud nutzen.
		98
		99	Nach Anmeldung unter [[https:~~/~~/academiccloud.de/services/>>https://academiccloud.de/services/]] erscheint eine Übersicht über alle freigeschalteten Dienste:
		100
		101	[[image:250219_Academic_Cloud_Services.png\|\|alt="Übersicht der Academic Cloud Dienste mit Ostfalia-Account" height="402" width="846"]]
		102
		103	(% class="wikigeneratedid" %)
		104	//Screenshot mit Stand 19.02.2025//
		105
		106	== Rechenzentrum Ostfalia ==
		107
		108	(% class="wikigeneratedid" id="HPowerFolder" %)
		109	Als Speicherlösungen für kollaboratives Arbeiten bietet das Rechenzentrum die Plattform [[Alfresco>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/Anwendungen%20f%C3%BCr%20die%20interdisziplin%C3%A4re%20Zusammenarbeit/Alfresco/]] und den Sync & Share Dienst [[PowerFolder>>url:https://xwiki.sonia.de/wiki/rechenzentrum/view/Anleitungen%20und%20Dokumentationen%20zur%20Nutzung%20der%20IT-Infrastruktur/PowerFolder%20-%20Sync%26Share%20Dienst%20des%20Rechenzentrums/]] an.
		110
		111	Das [[Backupsystem des RZ>>url:https://www.ostfalia.de/cms/de/rz/servicekatalog/server/]], ermöglicht regelmäßige und automatisierte Datensicherung von Servern und Rechnern. Ein Backup wird dadurch sichergestellt, dass die Daten auf unterschiedliche Medien an unterschiedlichen Standorten verteilt versioniert gespeichert werden, so dass die Wiederherstellbarkeit im Falle eines ungewollten Datenverlustes für einen bestimmten Zeitraum gegeben ist.