Schlagwort-Archive: #auds2016

Archivierung von Unterlagen aus Digitalen Systemen – ein Rückblick auf #auds2016

Am 1. und 2. März 2016 fand an der Fachhochschule Potsdam die 20. Tagung des Arbeitskreises „Archivierung von Unterlagen aus digitalen Systemen (AudS)“ statt. Die Veranstaltung war mit über 150 Teilnehmerinnen und Teilnehmern sehr erfolgreich. Unser großer Dank geht an dieser Stelle an Tobias Schröter-Karin (LWL-Archivamt) und Michaela Schmitz (Staatsarchiv Hamburg), die für unser Blog eine Zusammenfassung zur Tagung geschrieben haben. Der Kurzbericht zur Tagung „Digitale Archivierung in der Praxis: Zwischen Standardisierung und Pragmatismus“ kann hier eingesehen werden. Hier geht es zum Twitter-Archiv (#auds2016).

Themenblock 1: Archivierung von Unterlagen mit besonderen               Strukturen

Taylor, Isabel: Eine hydraartige Matrjoschka: Wie wir die Fileablage eines staatlichen Schulamtes bewertet und erschlossen haben

Der erste Themenblock der Tagung widmete sich der Bewertung, Ordnung und Übernahme von Fileablagen und unstrukturierten Dateisammlungen. Schon im ersten Vortrag von Isabel Taylor (Landesarchiv Baden-Württemberg) wurden die neuen Herausforderungen für die Archive deutlich. Taylor berichtete über die Bewertung und Erschließung der Fileablage eines staatlichen Schulamtes mit einem Gesamtvolumen von 57.061 Dateien, 6.701 Ordnern und 18 GB. Neben den Strukturproblemen der angebotenen Aufzeichnungen, die durch die Zusammenlegung zweier Schulämter und die Fusion der beiden Fileablagen entstanden sind, wies Taylor u. a. auf inhaltliche und technische Probleme, wie fehlende Geschäftsgangvermerke, falsch betitelte Ordner, Dubletten, exotische Dateiformate und komprimierte Unterordner hin. Der Bearbeitungsprozess sah zunächst die Erstellung einer Sicherheitskopie und anschließend die Entfernung von Dubletten und leeren Ordnern mit den Tools Fast Duplicate File Finder und Remove Empty Directory vor. Bei der folgenden Bewertung der Aufzeichnungen orientierte sich das Landesarchiv am Bewertungsmodell Schule und erweiterte dies um neu identifizierte Aufgabenbereiche. Aufgrund der mangelnden Übersichtlichkeit fand die Bewertung bei diesem Pilotprojekt auf Dateiebene statt. Insgesamt wurde so 68 Prozent des Bestandes kassiert, so dass am Ende anstatt 57.061 Dateien nur noch 10.884 Dateien übernommen wurden. Im Rahmen der Erschließung wurde die Ordnerstruktur bis zur 4. Unterebene in „scopeArchive“ übernommen. Im Fazit führte

Gruppenfoto - TeilnehmerInnen bei der AUdS-Tagung

Gruppenfoto – TeilnehmerInnen bei der AUdS-Tagung

Taylor an, dass der gesamte Bewertungs- und Übernahmeprozess aufgrund der enormen Dauer (8 Monate) für die Praxis zu unwirtschaftlich sei und eine Aufwandsreduzierung angestrebt werden muss. Außerdem wies sie auf den drohenden Verlust der Authentizität der Daten hin, da die Löschung der Daten in Folge der fehlenden Skalierbarkeit nicht dokumentiert werden konnte.

Simon, Heike: Herausforderungen bei der Übernahme von Unterlagen aus Fileablagen – Zum Einsatz des Pre Ingest Toolset (PIT) im Bundesarchiv

Auch dem Bundesarchiv wurden in den letzten Jahren vermehrt unstrukturierte Fileablagen angeboten, denen kein Aktenplan zu Grunde lag, die keine Aktenstruktur aufwiesen und keine ausreichenden Metadaten enthielten.
Um diesem „Wildwuchs“ Herr zu werden, hat das Bundesarchiv zusammen mit den Firmen „HP“ und „SER“ ein Tool zur Erstellung von Submission Information Packages (SIPs) entwickelt. Das Pre Ingest Toolset, kurz PIT, dient der protokollierten Verarbeitung von Fileablagen und umfasst alle archivischen Prozesse, die notwendig sind, um unstrukturierte Aufzeichnungen zu übernehmen. Während der Vorprozessierung werden inhaltliche und technische Metadaten (Formatanalyse, -validierung) erhoben und ergänzt, Aufzeichnungen kassiert, strukturiert und abschließend paketiert. Die Strukturierung folgt dabei definierten Regeln, um aktenähnliche Strukturen zu erzeugen, bspw. eine Vorgang entspricht einer Informationseinheit, welche dem Informationsobjekt sowie der Verzeichnungseinheit entspricht.
Abschließend benannte Heike Simon einige Herausforderungen, die mit der Übernahme von Aufzeichnungen aus Fileablagen einhergehen. Besonders hob sie dabei die zunehmende Bedeutung der Behördenberatung hervor. Ebenso wie Taylor warf auch Simon Fragen nach der Authentizität der Aufzeichnungen und der Wirtschaftlichkeit des Bewertungs- und Übernahmeprozesses auf. Erzeugt der Archivar durch die Strukturierung der Aufzeichnung einen Zustand der noch nie dagewesen ist? Ist der Aufwand für diesen Eingriff überhaupt gerechtfertigt?

Herschung, Alexander: Ordnen, Bewerten und Übernehmen unstrukturierter Dateisammlungen – ein neues Werkzeug für eine schwierige Aufgabe

Im Anschluss an den Vortrag von Heike Simon stellte Alexander Herschung den in der Entwicklung befindlichen Übernahmeeditor der Firma „startext GmbH“ vor, welcher der protokollierten Aufbereitung unstrukturierter Dateisammlungen für die Übernahme dient. Die plattformunabhängige Java-Anwendung unterstützt neben der Ordnung und Gruppierung der Dateien, die Erhebung von technischen Metadaten, die Indexierung sowie die Beschreibung und Bildung von Übernahmepaketen (SIP). Verschiedene Filter- und Sortierfunktionen ermöglichen dem Anwender die unstrukturierten Dateien zu ordnen. Nicht zu übernehmende Dateien können verworfen werden. In diesem Fall wird der Status der Datei geändert, eine Löschung findet zu diesem Zeitpunkt noch nicht statt. Im abschließenden SIP (zip-Datei) findet sich neben den Primärdaten eine METS-Datei mit dem Protokoll für alle Dateien sowie der Beschreibung der anfänglichen und finalen Ordnerstruktur.
Zurzeit sind noch nicht alle Funktionen, bspw. Dokumentation der Bewertungsentscheidung, Anreicherung der beschreibenden Metadaten, umgesetzt.

Huth, Karsten; Bayer, Peter: Eigenentwicklung von Werkzeugen in einem elektronischen Archiv – Programmieren nach Bedarf

Der erste Themenblock endete mit einem Vortrag von Peter Bayer und Karsten Huth (Sächsisches Staatsarchiv) in dem die Vorzüge einer Programmierung nach Bedarf vorgehoben wurden. Huth betonte in seinen Ausführungen die zunehmende Vielfalt der Form und Struktur der angebotenen Daten. Viele OAIS-konforme Archive sehen fest definierte Prozesse zur Übernahme der Daten vor, was zwangsläufig eine strickte Abarbeitung der festgelegten technische Arbeitsschritte nach sich zieht. Werden die Daten in der falschen Form und Struktur abgeliefert, ist ein Scheitern der Übernahme absehbar. Um die Daten dennoch übernehmen zu können, müsste entweder der Übernahmeprozess im Archiv angepasst oder die Ablieferung an den Registraturbildner zur Korrektur zurückgesendet werden. Beide Maßnahmen verlagern die Übernahme der Daten auf unbestimmte Zeit. Laut Huth gewinnt ein elektronisches Archiv an Wert, wenn es auch technisch komplexe Daten übernehmen kann, die neue/andere Lösungswege erfordern. Das Sächsische Staatsarchiv hat dafür auf die im Haus vorhandenen Programmierkenntnisse zurückgegriffen und eigene Tools, wie das vorgestellte Tool „ByteBarn“, entwickelt. „ByteBarn“ dient der Strukturierung von Fileablagen. Damit werden die Primärdaten und Metadaten in Form einer Tabelle dargestellt. Als Grundlage für das Tool nutzt das Staatsarchiv das Datenbankmanagementsystem (DBMS) „SQLite„, das die Daten sortierbar und abfragbar macht. „SQLite“ ist ein gemeinfreies, unabhängiges und serverloses DBMS, das weltweit angewandt wird, bspw. „Android“. Aufgrund seiner Eigenschaft als DBMS dokumentiert sich das sächsische Tool von selbst, die Wiederherstellung der ursprünglichen Struktur der Ablieferung ist jederzeit möglich.

Sektion 1: „Kleine“ Archive

Im Anschluss an die Mittagspause erwarteten die Teilnehmer der Sektion I: „Kleine“ Archive, in der es vor allem um den möglichen Einstieg kleinerer Einrichtungen in den Bereich Elektronische Langzeitarchivierung ging, interessante Vorträge. Tessa Neumann, Inhaberin des deutschen Archivdienstleisters „ArchivInForm“ und Andreas Steigmeier von der Schweizer Firma „docuteam“ machten in einem interessanten vergleichenden Überblick die Situation kleinerer Archive in Deutschland und in der Schweiz deutlich. Ihr Fazit, dass das Thema digitale Archivierung zwar in der Fachwelt angekommen, aber noch längst nicht als archivarische Daueraufgabe akzeptiert und etabliert ist, konnte wohl jeder Zuhörer unterschreiben.

Hauptgebäude der Fachhochschule Potsdam als Tagungsort

Hauptgebäude der Fachhochschule Potsdam als Tagungsort

Fortgeführt wurde die Diskussion durch Michael Hansmann vom Archiv für christlich-demokratische Politik der Konrad-Adenauer-Stiftung, der anschaulich beschrieb, wie das Archiv sich seit 2008 langsam aber stetig immer weiter in den Bereich Digitale Archivierung einarbeitet und dabei mit einer strategischen und überlegten Herangehensweise sehr erfolgreich arbeitet. Inzwischen ist das Archiv dabei, die Vielfalt der in der Stiftung eingesetzten Erschließungs-, Archivierungs- und Präsentationstools gezielt zu vereinheitlichen. Der etwas plakative Titel „Es begann mit einem Scanner“ hatte dabei durchaus einen ganz reellen Kern, da das gesamte, bis ca. 2020 angelegte Projekt mit dem Anliegen begann, einen Auflichtscanner zu beschaffen.

Zum Abschluss stellte Meike Zepf aus dem Kreisarchiv Esslingen einen ähnlichen Ansatz vor. Aus dem Anliegen heraus, möglichst früh Praxiserfahrung in der digitalen Archivierung zu sammeln, begann man bereits vor einigen Jahren mit kleinen digitalen Übernahmeprojekten. Inzwischen hat das Archiv einen reichen Erfahrungsschatz aufgebaut, als besonders erfreulich darf wohl gelten, dass sogar die Verantwortung für das DMS der Landkreisverwaltung beim Kreisarchiv liegt. Zwar gibt es selbstverständlich offene Baustellen, Meike Zepf schloss aber mit dem Fazit, dass sich ein früher Einstieg in das Thema lohnt, allein schon um eigene Ängste abzubauen.

Auch in der angeregten anschließenden Diskussion kamen die Teilnehmer zu dem Fazit, dass es besser ist, einfach mal anzufangen und möglicherweise Fehler in Kauf zu nehmen, als gar nichts zu tun (und damit z.B. Überlieferungslücken in Kauf zu nehmen). Dies erleichtert schließlich auch eine kritische Einschätzung der zahlreich vorhandenen Empfehlungen, die ohne Fach- und Praxiswissen faktisch nicht möglich ist.

Themenblock 2: Daten – Übernehmen und Verarbeiten

Der Themenblock II: „Daten – Übernehmen und Verarbeiten“ begann mit einem Vortrag von Peter Worm (LWL-Archivamt für Westfalen) und Julia Krämer-Riedel (Historisches Archiv der Stadt Köln – HAStK), die die Umsetzung der Vorgaben des XPSR-Standards zur Archivierung von Personenstandsregistern im Digitalen Archiv NRW vorstellten. Einleitend wurde hier

Musikalische Kaffeepause :-)

Musikalische Kaffeepause 🙂

deutlich gemacht, dass die Implementation entsprechender Übernahmeschnittstellen durchaus zeitkritisch ist, da bereits 2017 die ersten Übernahmen anstehen könnten.

Es folgten Lambert Kansy vom Staatsarchiv Basel-Stadt und Martin Lüthi vom Staatsarchiv St. Gallen, die Ideen zur Entwicklung eines Standards für Archivinformationssysteme darstellten. Bereits die Begriffsbestimmung stellt hier ein großes Problem dar, da der Begriff „Archivinformationssystem“ in verschiedenen Kontexten Verwendung findet. Aufgrund der Heterogenität der Anwendungsbereiche und der Anforderungen bezeichnete bereits 2005 Andreas Berger ein entsprechendes Vorhaben als „Quadratur des Kreises“. Projektziel soll ein generisches Prozess-, Informations- und Datenmodell sein, dass zu geringeren proprietären Abhängigkeiten und besseren Vergleichsmaßstäben führt. Sobald das Projekt abgeschlossen ist, wird um rege Beteiligung am Review-Prozess gebeten!

Den Themenblock und damit auch den ersten Tagungstag beschloss Zbysek Skodulka vom Tschechischen Nationalarchiv in Prag, der die Planungen für ein tschechisches Archivportal vorstellte. Das interessante Konzept stellte gleichzeitig auch einen großen Unterschied zum deutschen Archivwesen dar. Da die tschechische Republik ein zentralistisch organisiertes Archivwesen besitzt und die Nutzung des Portals und der angebundenen Werkzeuge für die meisten tschechischen Archive verpflichtend ist, kann das Projekt viel klarer umrissen und mit weniger Aufwand besser geplant werden, als es in Deutschland möglich wäre.

Themenblock 3: Preservation Planning und OAIS-konforme                    Archivierung

Der zweite Tagungstag begann mit dem Themenblock „Preservation Planning und OAIS-konforme Archivierung“. Zuerst stellte Veronika Krauß, Studentin der Bauhaus-Universität Weimar, das überaus interessante Projekt „Authentizität digitaler Objekte unter Formattransformationen“ vor. Dabei entwickelt die Bauhaus-Universität verschiedene Tests bzw. Tools, mit denen sich z.B. die Authentizität von Bilddateien nach einer Formattransformation anhand festgelegter signifikanter Eigenschaften sicherstellen lässt, indem eine Art digitale SIgnatur aus verschiedenen Messwerten ermittelt wird. Da es sich um ein Lehrprojekt handelt, gibt es leider keinen festen Projektplan, insbesondere aus dem archivfachlichen Bereich freut sich das Projekt jedoch über Ansprechpartner und Feedback bzgl. der fachlichen Anforderungen an die Datenmigration!

Anschließend berichtete Andreas Romeyke von der Staats- und Universitätsbibliothek (SLUB) Dresden über „TIFF“ im allgemeinen sowie darüber, welche Probleme bei der Arbeit mit „TIFF“-Dateien üblicherweise auftreten können und wie man diese beheben kann. Dabei stellte er an der „SLUB“ entstandene, teilweise auch frei verfügbare Tools vor, mit deren Hilfe zumindest einige der klassischen Probleme bei der Arbeit mit TIFF auf einfache Weise behoben werden können, was auch für Archive die digitale Bestandserhaltung erleichtern kann.

Vor welche Probleme einen die Archivierung von Software stellt, machte Winfried Bergmeyer am Beispiel des Computerspielemuseums deutlich, das inzwischen eine Sammlung aus über 40 Jahren Computerspielgeschichte verwaltet und zu erhalten versucht. Dabei stellen sich vielfältige Probleme, angefangen von fehlenden Metadatenschemata und Datenstandards über Fragen der Emulation bis hin zu teilweise nach wie vor ungeklärten Fragen des Copyrights und der Nutzungsrechte.

Im vierten Vortrag stellte Professor Dr. Rolf Däßler von der Fachhochschule Potsdam die auf der Open-Source-Lösung „Archivematica“ basierende Berlin-Brandenburgische Verbundlösung zur Langzeitarchivierung von Digitalem Archivgut vor, die derzeit durch die Koordinierungsstelle Brandenburg Digital (KBD), der Servicestelle Digitalisierung Berlin (digiS) und das Digitalisierungslabor der FH Potsdam am Zuse-Institut Berlin (ZIB) erarbeitet wird. Er betonte dabei die bereits in anderen Vorträgen getroffene Feststellung, dass gerade für kleinere Institutionen aus finanziellen und fachlichen Gründen kein Weg an der Beteiligung an einer Verbundlösung vorbei führt.

Zoltán Lux beendete den Themenblock mit einem Bericht zur OAIS-konformen Archivierung von Datenbanken. Das Ungarische Nationalarchiv nimmt derzeit am EU-Projekt „E-ARK“ teil. Das „E-ARK“-Projekt versucht, eine europaweit nutzbare Methodologie zur Elektronischen Archivierung aufzubauen. Im Rahmen des Projekts führt das Ungarische Nationalarchiv ein Pilotprojekt zur Archivierung von Datenbanken durch.

Themenblock 4: Aus- und Weiterbildung

Nachdem während der Tagung in zahlreichen Redebeiträgen auf die Bedeutung der IT-Inhalte in der archivarischen Ausbildung hingewiesen worden war, schloss #auds2016 mit einem Themenblock zur Aus- und Weiterbildung. Dabei nutzte Ulf Preuß (Koordinierungsstelle Brandenburg Digital) die Gelegenheit, um auf die enge Verflechtung von Forschung und Lehre an der FH Potsdam hinzuweisen. Gerade im regionalen, Berlin-Brandenburgischen Kontext konnte sich der Fachbereich Informationswissenschaften an der Fachhochschule Potsdam kulturspartenübergreifend als neutrale Beratungsinstitution im Bereich Kulturgutpräsentation, -digitalisierung und -bewahrung etablieren.

Zu guter Letzt endete die Tagung mit einem Beitrag von Claudia Engelhardt, Mitarbeiterin der Niedersächsischen Staats- und Universitätsbibliothek (SUB) Göttingen, die in ihrer Master-Arbeit die Anteile der Digitalen Langzeitarchivierung in einschlägigen Studiengängen untersucht. Obwohl die Archivwissenschaften den zweithöchsten Anteil an Themen der Elektronischen Langzeitarchivierung in der Ausbildung beinhaltet – 9 -14 Prozent –  (einen höheren Anteil erreichen nur Studiengänge im Bereich Konservierung neuer Medien und digitaler Information [21-42%]), waren sich in der Abschlussdiskussion alle Anwesenden einig, dass hier in Zukunft noch viel Arbeit auf die Archivcommunity wartet.

Abschlussdiskussion

In der Abschlussdiskussion wurde unter dem Stichwort „Wie pragmatisch dürfen wir eigentlich sein?“  der schmale Grat zwischen der strengen, aber vielleicht praxisfernen Einhaltung von Normen auf der einen Seite und dem Pragmatischen, aber vielleicht fachlich Falschem und der allzu individuellen Handhabung auf der anderen Seite, hervorgehoben.

Zu guter Letzt und vielleicht als Ausblick auf zukünftige Tagungen wurde daran erinnert, dass man bei Fragen der Langzeitarchivierung vor allem die Nutzer nicht aus dem Auge verlieren darf!

Damit schloss die gelungene und interessante Tagung, die zukünftig wohl alljährlich zum Tagungsprogramm der Berichtenden gehören wird.