Die technische Seite des PDF/A-Standards

Aus: „PDF/A kompakt 2.0 – PDF für die Langzeitarchivierung“

Nach dem Erscheinen des ersten Normteils von PDF/A kamen zwei weitere Normteile hinzu. Sie ersetzen den ersten Normteil jedoch nicht, sondern bieten erweiterte Möglichkeiten für die Archivierung von PDF-Dokumenten. Alle bereits existierenden PDF/A-Dateien behalten stets ihre volle Gültigkeit.

Der erste Archivstandard PDF/A-1

PDF/A-1 basiert auf der bereits 2001 erschienenen PDF-Version 1.4. Sämtliche Ressourcen (Bilder, Grafiken, verwendete Schriftzeichen) müssen im PDF/A-Dokument selbst eingebettet sein. Erforderlich sind präzise, plattformunabhängig kodierte Farbangaben mittels ICC-Profilen sowie die Verwendung von XMP für Dokument-Metadaten. Es ist untersagt, transparente (durchscheinende) Elemente, einige Kompressionsarten (LZW, JPEG2000), PDF-Ebenen sowie Aktionen und JavaScript zu verwenden. Auch darf eine PDF/A-Datei nicht durch ein Passwort geschützt sein. PDF/A-1 unterstützt ausdrücklich die Einbettung von digitalen Signaturen sowie die Verwendung von Verweisen (Hyperlinks).

PDF/A-2 basiert auf PDF 1.7

Als „ISO 19005-2“ wurde PDF/A-2 im Jahr 2011 veröffentlicht. Es basiert auf der PDF-Version 1.7, die inzwischen selbst als „ISO 32000-1“ standardisiert ist, und greift deren Neuerungen auf. So erlaubt PDF/A-2 die Kompression mit JPEG2000, transparente Elemente und PDF-Ebenen. PDF/A-2 ermöglicht außerdem das Einbetten von OpenType-Fonts und unterstützt digitale Signaturen in Übereinstimmung mit den PAdES (PDF Advanced Electronic Signatures). Eine bedeutende Neuerung ist die Container-Funktion: In ein PDF/A-2-Dokument lassen sich PDF/A-Dateien einbetten.

Eine einzige Erweiterung in PDF/A-3

Seit Oktober 2012 ist PDF/A-3 verfügbar. In ein PDF/A-3-Dokument lassen sich nicht nur PDF/A-, sondern auch beliebige Dateien einbetten. Zum Beispiel besteht die Möglichkeit, einer PDF/A-3-Datei ihre Ursprungsdatei beizufügen, also mit der sie erstellt wurde. Die Archivtauglichkeit solcher eingebetteten Dateien, die nicht selbst PDF/A-konform sind, regelt der PDF/A-Standard nicht.

Konformitätsstufen: A, B, U

Die verschiedenen Konformitätsstufen spiegeln die Qualität der archivierten Dokumente wider und richten sich nach dem Eingangsmaterial und dem Verwendungszweck.

  • Stufe A (Accessible/Zugänglich) umfasst sämtliche Anforderungen des Standards inklusive Abbildung der inhaltlichen Struktur und korrekter Lesereihenfolge des Dokumentinhalts. Textinhalte müssen extrahierbar sein und die Struktur muss die natürliche Leseabfolge abbilden. Es werden hohe Anforderungen an die verwendeten Schriftzeichen gestellt. Diese PDF/A-Stufe lässt sich in der Regel nur bei der Konvertierung aus digitalen Ursprungsdokumenten erreichen.
  • Stufe B (Basic) garantiert eine eindeutige visuelle Reproduzierbarkeit der Inhalte. Stufe B lässt sich meist einfacher generieren als Stufe A, gewährleistet aber nicht zu 100 Prozent Textextraktion oder -durchsuchbarkeit. Eine problemlose Wiederverwendung des Inhalts ist nicht unbedingt gegeben. Gescannte Papiervorlagen lassen sich normalerweise ohne Weiteres in PDF/A der Konformitätsstufe B wandeln.
  • Stufe U (Unicode) wurde mit PDF/A-2 eingeführt. Es handelt sich um eine Erweiterung der Konformitätsstufe B dahin gehend, dass der gesamte Text im Schriftzeichenstandard Unicode abgebildet ist.

Nomenklatur: PDF/A-Version und -Level werden einfach hintereinander genannt. So handelt es sich bei PDF/A-1b um eine PDF-Datei für die Langzeitarchivierung der ersten Generation für eine visuelle Reproduzierbarkeit der Inhalte.

voriges Kapitelnächstes Kapitel

Zur Kapitelübersicht

About Alexandra Oettler

Alexandra Oettler ist (Co-) Autorin der Bücher PDF/A kompakt und PDF/A kompakt 2.0.

Hinterlasse eine Antwort