Umgang mit Prüfsummenfehlern

Vor dem Ingest

Wir teilen Prüfsummenfehler (engl. "checksum violations") nach den Zeitpunkten ihres Auftretens ein, für die jeweils andere Verfahren der Behandlung zum Einsatz kommen.

Prüfsummenfehler, die vor dem Ingest auftreten, werden nicht vom Langzeitarchiv behandelt. Die Fehlerbehebung passiert stattdessen im Quellsystem (z. B. Kitodo), wo bereits während des Produktionsprozesses Prüfsummen erzeugt und geprüft werden. Das Quellsystem überprüft die Prüfsummen nach dem Kopieren der Daten in das Übergabeverzeichnis.

Submission Application

Die Submission Application prüft ebenfalls die Prüfsummen. Werden von der Submission Application Fehler erkannt, müssen die fehlerhaften Daten erneut aus dem Quellsystem exportiert werden.

Ingestverarbeitung im Langzeitarchiv

Während der Ingestverarbeitung in der Langzeitzeitarchivsoftware Rosetta werden die Prüfsummen im Deposit-Modul geprüft. Ein fehlerhaftes Einlieferungspaket (engl. "Submission Information Package", SIP) wird von der Software in einen gesonderten Bereich verschoben, wo ein technischer Mitarbeiter (engl. "technical analyst", TA) den Fehler eingrenzt und entweder selbst behebt (z.B. durch Ersetzen der Datei mit dem Prüfsummenfehler) oder das SIP zurückweist (engl. "reject") und an das Quellsystem zur Fehlerbehebung zurückgibt. Das reparierte SIP wird nach der Fehlerbehandlung erneut ingestiert. Sollte die Fehlerbehandlung endgültig fehlschlagen, so kann der TA das SIP abweisen (engl. "decline").

Im Permanent Repository

Teil der technischen Infrastruktur des Langzeitarchivs zu entnehmen ist, der Permanentspeicher (engl. "permanent repository"). In ihm befinden sich die Daten auf verschiedenen Speichermedien. Die Prüfsummen werden gemäß dem hier beschriebenen Verfahren kontrolliert. Bei einer fehlerhaften Datei, die sich ganz oder teilweise auf einem Festplattenspeicher befindet, wird die Datei aus der Sicherung, die sich auf Bandspeichern befindet, wiederhergestellt. Bei einer fehlerhaften Datei im Backup auf einem Bandspeicher wird das Band aus dem Backup-Copypool restauriert.