Erhalt der Interpretierbarkeit

Maßnahmen zum Erhalt der Interpretierbarkeit (Content Preservation)

Zum Erhalt langzeitarchivierter digitaler Daten werden zwei parallele Ansätze verfolgt. Die Bitstream Preservation konzentriert sich auf die exakte physische Bewahrung der Daten auf dem Datenträger. Die Content Preservation gewährleistet die Interpretierbarkeit der gespeicherten Dateien. Die Interpretierbarkeit eines digitalen Dokumentes hängt vom verwendeten Dateiformat ab. Dateiformate veralten. Ein Dateiformat gilt als "riskant", wenn es nur noch wenige Programme gibt, die es darstellen oder abspielen können. Wenn ein Dateiformat als "riskant" bewertet wird, ist es nötig, Maßnahmen zur Formatmigration einzuleiten und sicherzustellen, dass die betroffenen Dateien auch in Zukunft benutzbar bleiben. Die Langzeitarchivsoftware Rosetta von ExLibris enthält ein Modul, das es ermöglicht, Formatkonvertierungen zu planen, zu testen und durchzuführen. Das Vorgehen dazu soll im Folgenden beschrieben werden.

Durchführung

Schritt 0: Risikoerkennung

Bei der Einlieferung von Dateien in Rosetta wird eine Formaterkennung mit Hilfe von DROID durchgeführt. Die Rosetta Format Library basiert auf der PRONOM-Datenbank. Mit den Softwareupdates von Rosetta werden regelmäßig auch die neuen Versionen der PRONOM-Datenbank in die Format Library integriert. Die Daten der Format Library bilden die Grundlage für die Erkennung und Bewertung von Risiken. Neben den Risiken, die die Datenbank bereits enthält, können durch die Benutzer manuell eigene Risiken, wie z. B. fehlende Anzeigeprogramme, konfiguriert werden. Dazu ist es nötig, dass die Mitarbeiter des Langzeitarchivs Kompetenzen bzgl. der verwendeten Dateiformate besitzen und die technische Entwicklung der Formate ständig beobachten.

Schritt 1: Regelmäßige Überwachung

In Rosetta können regelmäßige Jobs konfiguriert werden, die basierend auf der Format Library die Risikoanalyse durchführen und einen Risikoreport generieren. Dieser Report ist die Grundlage für Erhaltungsmaßnahmen gefährdeter Dokumente. Im SLUBArchiv.digital wird dieser Job einmal wöchentlich automatisiert ausgeführt.

Schritt 2: Lösungsverfahren entwickeln

Ist ein Risiko erkannt, entwickeln die Mitarbeiter ein oder mehrerer Verfahren, um die betroffenen Dateien vom risikobehafteten in ein sicheres Format zu migrieren. Rosetta unterstützt interne und externe Formatmigrationen. Bei der internen Formatmigration werden die Dateien in Rosetta über Plugins konvertiert. Bei der externen Formatmigration werden die Dateien exportiert und außerhalb von Rosetta (ggf. von einem Drittanbieter) umgewandelt. Die neu entstandenen Dateien werden wieder in Rosetta importiert. Die logische Zuordnung zum ursprünglichen Archivpaket erfolgt über CSV-Dateien, die beim Export erstellt und für den Import aktualisiert werden. Die älteren Versionen bleiben im System erhalten.

Das wichtigste Kriterium zur Bewertung der Alternativen ist die Bewahrung der signifikanten Eigenschaften. Sie werden in Rosetta vorgehalten (in den sogenannten Classification Groups, denen die verschiedenen Dateitypen zugeordnet sind). Bei der Erstellung der Alternativen kann konfiguriert werden, welchesignifikanten Eigenschaften erhalten bleiben sollen. Weitere Kriterien wie Kosten oder zeitlicher Aufwand können hinzugefügt werden und somit in die Bewertung einfließen.

Schritt 3: Auswahl eines Verfahrens

Die entwickelten Verfahren werden anhand einer Testdokumentmenge praktisch geprüft und bewertet. Das Verfahren, das den Anforderungen genügt und die beste Bewertung erhält, wird als Bewahrungsplan (engl. "preservation plan") deklariert.

Schritt 4: Konvertierung durchführen

Der Bewahrungsplan ist die Grundlage für die Bewahrungsmaßnahme (engl. "preservation action"), mit der die Menge der mit diesem Risiko behafteten Dateien konvertiert wird. Nach der Konvertierung liegen die Dateien in Rosetta mit einer neuen Versionsnummer vor. Die ursprünglichen Dateien bleiben zum Zweck der lückenlosen Nachverfolgung erhalten.