Dokumentation und Metadaten
Um die Nachnutzung zu erleichtern und somit die Zitation ihrer Forschungsdaten zu erhöhen, sollten die Daten gut beschrieben und dokumentiert werden. Hierzu sollten wenn möglich standardisierte Metadatenstandards genutzt werden. Darüber hinaus kann eine weitere Dokumentation mittels separater Datei sinnvoll sein. Eine Dokumentation geht über die Beschreibung durch Metadaten hinaus und ist wesentlich ausführlicher (bspw. Beschreibung des Projekts, der Variablen, des Messinstruments). Metadaten sind dagegen eine spezifische Untermenge der Dokumentationsangaben und dienen in erster Linie der Findbarkeit der Daten (z. B. Primärforscher, Zeitraum, Ort). Ebenso sollten Normdaten und kontrollierte Vokabulare zur Beschreibung der Daten genutzt werden.
Eine Dokumentation kann beispielweise in Form einer Readme-Datei erstellt werden (siehe Vorlage und Beispiel). Zugehörige Dokumentationsdateien wie ein Codebook oder ein elektronisches Laborbuch können darin benannt und ggf. beschrieben werden.
Eine Übersicht zu disziplinspezifischen und fachübergreifenden Metadatenstandards finden Sie auf den Seiten des britischen Digital Curation Center sowie bei der Research Data Alliance.
Beratung: Fachreferenten der Universitätsbibliothek
Beispiele für disziplinspezifische Metadatenstandards:
Biologie und Biomedizin: Minimum Information for Biological and Biomedical Investigations (MIBBI)
Geisteswissenschaften: Text Encoding Intitiative (TEI)
Geowissenschaften: ISO 19115, Darwin Core
Informatik: CodeMeta
Musikwissenschaft: Music Encoding Initiative (MEI)
Naturwissenschaften: ICAT Schema, Cristallographic Information Framework
Sozial- und Wirtschaftswissenschaften: Digital Documentation Initiative (DDI)
Fachübergreifende Metadatenstandards: DataCite, Dublin Core, MARC21
Folgende Informationen können sowohl über ein Metadatenschema als auch via Dokumentation wichtig für die Beschreibung der Daten sein:
Titel: Name des Datensatzes oder Forschungsprojekts, worin die Daten produziert wurden
Autor/Primärforscher: Namen und Adressen der Organisation und/oder Personen, die die Daten erstellt haben (siehe auch Normdaten)
Mitwirkende: Personen, die nicht primär an der Datenerstellung beteiligt waren (bspw. Datenkuratoren, Forschungsförderer; siehe auch Normdaten)
Identifier: Die Identifikationsnummer, welche zur Identifizierung der Daten herangezogen werden kann, auch wenn es nur eine interne Projektreferenznummer ist
Daten: Tage oder Zeiträume, die mit den Daten in Verbindung stehen (z. B. Projektstart, -ende, Beobachtungszeitraum, Veröffentlichungsdatum)
Thema: Schlagwörter oder Phrasen, die das Thema oder den Inhalt der Daten beschreiben (siehe auch Kontrollierte Vokabulare)
Ort: sofern die Daten einen Bezug zu einem physischen Ort haben oder eine räumliche Abdeckung angeben (z. B. Koordinaten)
Rechte: falls rechtliche Ansprüche an den Daten bestehen (siehe auch Lizenz wählen)
Dateinamen: Liste aller digitalen Dateien (mit Name und File-Erweiterung; siehe auch Dateien strukturieren)
Formate: Format der Dateien, z. B. CSV, HTML, JPEG (siehe auch Dateiformat wählen)
Methodik: Beschreibung der Methode zur Datenerhebung und -verarbeitung (Methodik, Versuchsprotokoll, Geräte, Software, Laborbuch)
Sprache: Sprache(n) des Inhalts der Forschungsdaten, falls erforderlich
Quellen: Referenzen zu Quellenmaterial, falls Daten aus anderen Quellen übernommen wurden (siehe auch Persistente Identifikation)
Relationen: Referenzen zu anderen Ressourcen (Daten, Literatur), die mit den Daten in Verbindung stehen (siehe auch Persistente Identifikation)
Falls viele Angaben gleich sind, können mehrere Datensätze in einer Dokumentationsdatei zusammengefasst werden (z. B. eine Studie oder ein Experiment mit mehreren Dateien).