PDF Association logo

Discover pdfa.org

Key resources

Get involved

How do you find the right PDF technology vendor?
Use the Solution Agent to ask the entire PDF communuity!
The PDF Association celebrates its members’ public statements
of support
for ISO-standardized PDF technology.

Member Area

PDF/A erzeugt Mehrwert bei Archiv-Migrationen

Die einheitliche Konvertierung eines Altarchivs nach PDF/A ist in der Theorie lediglich ein Task während der Migration. Die Praxis sieht jedoch häufig anders aus. PDF/A bietet Mehrwerte durch ISO-Standardisierung, Kompression, Volltextsuche und die Möglichkeit Originaldokumente einzubetten.
About the author: The PDF Association staff delivers a vendor-neutral platform for PDF’s stakeholders, facilitating the development of open specifications and ISO standards for PDF technology. Staff members include: Alexandra Oettler (Editor), Betsy Fanning … Read more

Migrationsprojekte im Archivumfeld weisen in der Regel eine nicht zu unterschätzende Komplexität auf, da nebst dem Kopieren der Dokumente zusätzliche Aspekte zu berücksichtigen sind. In diesem Beitrag betrachten wir den Teilbereich der Dokumenten-Konvertierung ausführlicher.

Muss ein gewachsenes Dokumentenarchiv migriert werden, ist dies generell ein idealer Zeitpunkt, den entstandenen (unkontrollierten) Formatzoo in ein einheitliches und zukunftsfähiges Format zu konsolidieren. Dabei ist das PDF/A Format aus Compliance- und Records-Management-Sicht erste Wahl. Als modernes und langzeitsicheres ISO-Format stellt es ein stabiles Fundament für das neue Archiv- oder ECM-System dar.

Erfahrung ist ungemein wichtig
In der Konzeptphase sollten Projektverantwortliche analysieren, ob die vorhandenen Dokumentbestände nach PDF/A konvertierbar sind. Digitale Signaturen, die aus rechtlichen Gründen nicht geändert werden dürfen, schließen dies beispielsweise aus. Deshalb empfiehlt es sich in der Regel einen externen Berater mit entsprechender Erfahrung, beispielsweise ein Mitglied der PDF Association, mit ins Boot zu holen.
Ist das Projekt durchführbar, erfolgt im nächsten Schritt die Ist-Aufnahme der im Archiv vorhandenen Datei-Typen. In Alt-Archiven finden sich sehr oft AFP Dateien aus dem Output- Bereich, TIFF und JPEG aus dem Scanning. Darüber hinhaus werden immer öfter Textdateien (Logdaten etc.) und Office Formate archiviert. Für Office Formate und E-Mails eignet sich die Konvertierung nach PDF/A-3 besonders, da dieses Format die Einbettung der Quelldateien erlaubt. PDF/A als anerkanntes Langzeitarchivformat unterstützt u. a. die Einbettung von Textobjekten (OCR) für die Volltextsuche und ist daher im Zuge der Migration inhaltlich im neuen System besser erschlossen.

Vor der eigentlichen Migration geht es um die Auswahl geeigneter Konvertierungslösungen. Typischerweise wird die Vorgehensweise und die Konformität zum PDF/A Format in einem Proof-of- Concept getestet und verifiziert. Oft zeigt sich dabei, dass in den Archiven zahlreiche technisch fehlerhafte Dokumente „schlummern“. Diese ungültigen Dokumente sollten im Zuge der Migration ermittelt und bereinigt werden, selbst wenn deren manuelle Korrektur in der Regel sehr aufwändig ist. Auch hier kann PDF/A-3 helfen, falls beispielsweise für eine Revision die Originaldokumente eingebettet werden sollen oder müssen.

Effiziente Lösung – stabiles Fundament
Die eigentliche Migration und Konvertierung erfordert, abhängig von der Archivgröße, leistungsfähige Hardware und Zeit, mitunter Wochen oder Monate. Klassische Ansätze sind – neben der Komplettmigration – die Migration an einem bestimmten Stichtag oder „on demand“. Bei letzterem werden die Original-Dokumente migriert und erst bei Abruf nach PDF/A konvertiert.

Fazit
Theoretisch betrachtet, ist die einheitliche Konvertierung eines Altarchivs mit TIFF-, AFP- und anderen Dateiformaten nach PDF/A lediglich ein Task während der Migration. In der Praxis jedoch zeigen sich zahlreiche Herausforderungen, deren effiziente Lösung entsprechendes Know-How oder individuelle Anpassungen erfordern. PDF/A empfiehlt sich als Zielformat und schafft Mehrwerte durch ISO-Standardisierung, Kompression, Volltextsuche und die Möglichkeit Originaldokumente einzubetten.

WordPress Cookie Notice by Real Cookie Banner