PDF/A Competence Center Newsletter Ausgabe 10: Mai 2009

PDF/A-Konferenz mit Ausblick auf PDF/A-2

Die Themenübersicht

 


 

Robert ReichmuthSehr geehrte Leser,

die technologische Entwicklung der letzten Jahre hat uns einen bisher unbekannten Zugriff auf eine gigantische „Informationsflut“ ermöglicht. Die Digitalisierung der Dokumente leistete und leistet immer noch einen wichtigen Beitrag für die Entwicklung der Informationsgesellschaft. Auch im privaten Bereich ist es für uns selbstverständlich geworden, Dokumente elektronisch abzulegen. Mit dieser Feststellung werde ich Sie wohl nicht sonderlich überraschen. Die Konsequenzen, die hingegen daraus entstehen, Dokumente über einen längeren Zeitraum verfügbar zu machen, haben schon viele mehr als überrascht.

Für Unternehmen liegt es auf der Hand, dass die Verfügbarkeit der Dokumente nur mit konsequenter Einhaltung von Standards in der Ablage, wie auch im Dokumentformat gelöst werden kann. Verfolgen wir die Entwicklung der letzten Jahre, kommen wir jedoch zu sonderbaren Erkenntnissen. Was ist geschehen? Mit der Einführung der Microfiches sind uns in erster Linie Herstellerstandards durch technologische Vorgaben aufgezwungen worden, ähnliche Effekte konnten bei der Einführung der ersten elektronischen Archive festgestellt werden. Technisch konzentrierte man sich auf die optimale Nutzung des dazumal enorm kostspieligen Speicherplatzes. Nur bedingt verfügbare Viewer hatten automatisch zur Reduktion von Dokumentenformaten geführt und nicht zuletzt sind Indexinformationen sprich Metadaten wegen eingeschränkten und aufwendigen Administrationsmöglichkeiten starr geführt worden.

Dieser Umstand bescherte dem Markt höchst proprietäre Lösungen. Altsysteme welche durch höhere Ansprüche oder aus welchen Gründen auch immer migriert werden haben uns schon einige Knacknüsse beschert. Nach Überwindung diverser und immer unterschiedlicher Hürden konnte hingegen mit einfachen gezielten Rezepten die Dokumente in neue Lösungen überführt werden.

Wo stehen wir heute: Moderne und flexible ECM-Architekturen ermöglichen die Speicherung von beinahe beliebigen Objekten. Strukturen wie wir auf Objekte zugreifen, können schnell und flexibel eingerichtet oder angepasst werden. Es wird sich nicht vermeiden lassen, dass wir auch diese Systeme schon bald einmal in noch bessere und noch flexiblere Systeme überführen müssen. Damit werden wir nicht nur mit größeren Volumen konfrontiert, sondern auch mit weniger überschaubaren Datenmodellen.

Eine Archivmigration ist nichts anderen als ein zweites Archivieren von Objekten im Zeitraffer. Es ist daher absehbar, dass die gegenwärtige Entwicklung zwangsläufig zu extrem hohen Kosten und Aufwand für die Erhaltung der Information und Dokumente führen kann. Die Durchsetzung von PDF/A als Archivformat und nicht nur ein gutes PDF in Version XY ist daher ein absolut entscheidender Faktor für einen langfristigen Investitionsschutz geworden.

Das PDF/A Competence Center hat in unseren Breiten einen erheblichen Beitrag geleistet, dieses Denken in den Anbietern und Kunden zu schärfen. Die nächste internationale PDF/A Konferenz steht vor der Tür und trägt zur Information und weiteren Verbreitung des PDF/A Standards bei. Gerne lade ich auch Sie dazu herzlich ein.

Robert Reichmuth
PDF/A Competence Center, GeschäftsführerDocucom AG


 

AKTUELL

PDF/A-Konferenz mit Ausblick auf PDF/A-2

Mit Erscheinen dieses Newsletters hat sich Ende April 2009 das weltweite ISO-Komitee in Hamburg getroffen. Hier sind alle aktiven Länder über die nationalen Standardisierungsgremien wie in Deutschland der DIN vertreten. Das PDF/A Competence Center hat den Status einer Kategorie-A-Liaison, die neben der Teilnahme an den Normungssitzungen beratende Beiträge und Kommentare ermöglicht, und ist durch Vorstände und technische Mitarbeiter seiner Mitglieder persönlich vertreten.

Im Anschluss an das Hamburger ISO-Meeting wird ein CD (Committee Draft) des PDF/A-2-Normentwurfs zur Kommentierung verteilt. Im darauf folgenden ISO-Meeting im Oktober 2009 in Orlando wird darauf aufbauend der DIS (Draft International Standard) erarbeitet und zur abschließenden, fünf Monate währenden Abstimmung verteilt. Mit dem DIS ist die technische Spezifikationsarbeit abgeschlossen. Die nationalen Mitglieder stimmen über die Norm ab, und es folgen formale Schritte, die allerdings auch ihre Zeit brauchen. Aus heutiger Sicht ist mit der Veröffentlichung von PDF/A-2 (ISO 19005-2) Ende 2010 zu rechnen. Kurz gesagt: PDF/A-2 wird auf dem jetzt selbständigen ISO-Standard 32000-1 basieren, der PDF 1.7 normiert hat, und somit auch jene Funktionen von PDF 1.7 übernehmen, die aus Sicht der Langzeitarchivierung sinnvoll und realisierbar sind. Dazu gehören z.B. JPEG2000, Ebenen, Transparenz und Collections.

Die PDF/A-Konferenz bietet eine hervorragende Gelegenheit, die Experten in Vorträgen zu PDF/A-2 zu hören und persönlich zu treffen. Aber das ist noch ein bißchen „Zukunftsmusik“ und natürlich steht der aktuelle Standard PDF/A-1 und seine Nutzung im Mittelpunkt. Der Anzeigentext bringt es sehr schön auf den Punkt mit: “Anwender berichten, Experten informieren, Aussteller präsentieren”. Mit über zehn Anwendervorträgen aus allen Branchen wird es viele praktische Erfahrungsberichte geben, wie und wo heute schon PDF/A in den Unternehmen eingesetzt wird. Es gibt auch Vorträge zu allen Anwendungsbereichen und neue Themen im Umfeld von PDF/A wie Metadaten oder E-Mail-Archivierung werden intensiv im Programm präsentiert. Wenn eine Migration in der Organisation ansteht, kann PDF/A ein nutzbringender Teil dieses Projekts sein, wie im folgenden Fachthema beschrieben wird.

FACHTHEMA

Hürden in Archivmigrationen

Unsere Kunden durchlaufen im Rahmen einer Neubeschaffung eines DMS Systems in der Regel einen interessanten Erfahrungsprozess. Sie stellen Eigenschaften bezüglich ihrer Daten und der Datenhaltung im Archiv fest, welche ihnen bisher nicht bekannt waren. In vielen Fällen entsprechen diese festgestellten Eigenschaften nicht den Anforderungen der neuen Systemumgebungen. Aufgrund fehlender Standards im Alt-Archiv bezüglich Datenhaltung, Datenmedien und Schnittstellen kommt es immer wieder zu Situationen bzw. Überraschungen, welche beim Projektstart im Vorfeld nicht bekannt gewesen waren. Im Verlauf der Projekte führt dies zu einem massiven Bereinigungsaufwand.

Der Ursprung dieser Probleme lässt sich wie folgt zusammenfassen:

  • proprietäre Datenhaltung
  • fehlende Schnittstellen
  • fehlende oder unvollständige Dokumentation
  • veraltete Datenträger
  • hohe Wartungskosten

In diesem Beitrag gehen wir näher auf einige Hürden einer Migration ein, wie z.B. heterogene Datenhaltung, Bereinigung und Konsolidierung der Datenformate.

Dokumente müssen druckbar bleiben

Hierzu ein Kundenbeispiel einer Bank mittlerer Größe. Der Kunde archivierte Dokumente sowohl aus verschiedenen Applikationen als auch in verschiedenen Formaten in seinem Archiv. Dieses Archiv beinhaltete ca. 11 Millionen Objekte in den Formaten TIFF, AFPDS, PDF und Text (Listen). Im Laufe der Zeit und im guten Glauben an PDF archivierte der Kunde aus vier Applikationen PDF-Dokumente in sein Archiv. Im Zuge einer IT-Optimierung sollten die archivierten Dokumente auf ein neues zentrales DMS System migriert werden. Das neue DMS beinhaltete erweiterte Workflow-Möglichkeiten, unter anderem Holdmail-Funktionen (Bleibepost-Dokumente werden nicht an Kunden ausgeliefert, sondern verbleiben bei der Bank, bis der Kunde sie abholt.), die auch für den migrierten Datenbestand zur Verfügung stehen sollten. Die Holdmail-Funktion ermöglicht das Ausliefern aller Belege eines Kunden an einem Stichtag. Diese Kundenbelege wurden an eine Outputmanagement- Software übergeben, welche die einzelnen Belege zusammenfasste und für die Print- und Versand- Strasse aufbereitete und codierte.

Im Laufe der Migration wurde festgestellt, dass die migrierten PDF Dokumente des Alt-Archivs mit den zentralen Postscript Druckern nicht druckbar waren und zu Postscriptfehlern führten. Ursache für dieses Problem war, dass der Kunde vor dem Laden der exportierten PDF-Dokumente nur einen visuellen Test an Hand einer Stichprobe unter Verwendung des Adobe Reader durchgeführt hat. Diese Tests waren zwar erfolgreich, jedoch wurde das direkte Drucken vom Kunden nicht berücksichtigt. Das Zusammenfassen und Codieren der Dokumente aus der oben genannten Holdmail-Applikation erwies sich als weiteres Problem. Dieser Ablauf war nicht realisierbar, da die archivierten PDF-Dokumente aus den unterschiedlichen PDF-Applikationen für die Outputmanagement-Software nicht lesbar waren. Fazit: Unterschiedliche PDF-Applikationen liefern unterschiedliche ‚PDF-Qualitäten’.

Hilfe, ich kann meine alten PDFs nicht mehr drucken!

Die Ergebnisse im Druckbereich verhielten sich unterschiedlich, da sich gewisse PDFs vom Printer nur noch als schwarze Seiten präsentierten, andere jedoch als Punktwolken, bis hin zum Abbruch des Druckers durch einen Postscript-Fehler. Die Problemanalyse der PDF-Dokumente erstreckte sich über verschiedene Bereiche, die in drei Hauptfehlern zusammengefasst werden konnten.

  • Es wurden aus verschiedenen PDF-Genrierungstools Dokumente erzeugt mit unterschiedlichen Qualitäten.
  • Die Schriften waren in den PDF-Dokumenten nicht eingebettet.
  • Einige Dokumente enthielten ein nicht konsistentes PDF-Format.

In Archivmigrationen erleben wir immer wieder solche Überraschungen, welche aus Nichtwissen oder unsachgemässer Handhabung zu teurem und zeitraubendem Analyse-, Bereinigungs-Aufwand und zu komplexen Konversionen führen. Unsere bisherigen Erfahrungen zeigen, dass diese Kundenfälle keine Einzelfälle sind. Die Unternehmen wiegen sich zum Teil in falscher Sicherheit.

Sichert PDF/A die Reproduzierbarkeit?

Der ISO Standard 19005-1 beinhaltet die notwendigen Voraussetzungen, um eine verlässliche Wiedergabe von Farben, Texten, Bildern oder grafischen Elementen am Bildschirm und auf dem Drucker zu gewährleisten.

Privatbanken setzen in Kundendokumenten (Belege, Portfolios) vermehrt auf Farbe. Diese Dokumente werden unter strengen Auflagen firmeneigener CI/CD Richtlinien erstellt. Hier gilt primär nur eins:

Willkommen in der Welt der Farben und dem individuellen Farbverständnis.

Diese „farbigen” Anforderungen an PDF/A fallen, abhängig vom Umfeld und der Aufgabenstellung extrem unterschiedlich aus. Der eine Anwender fokussiert ausschließlich PDF/A Dateien, die eine hohe Auflösung haben. Damit können die Dokumente auf einem Drucker optimal wiedergegeben werden. Der andere Anwender legt Wert auf eine möglichst geringe Auflösung, damit die PDF/A-Dateien, welche im Extranet für Downloads zu Verfügung gestellt werden, schlank bleiben. Was aber bei beiden Anwendern gleich bleibt, sind die Farben, die durch das CI /CD vorgegeben werden.

Zunächst zum Thema Auflösung. Die Auflösung der Dokumente ist nicht Teil der PDF/A Norm, da es keine allgemeingültige „richtige” Bildauflösung gibt. Damit liegt die Entscheidung, welche Auflösung für welches Dokument die richtige ist, beim Unternehmen selbst. Ob am Bildschirm oder als Ausdruck; die Farben sollten aber immer gleich aussehen. PDF/A bedient sich hier aus einem Fundus von Farbprofilen die den Bilddateien, Grafiken oder PDF-Dokumenten beigefügt werden. Zum Beispiel eignet sich das ISO Coated Farbprofil für einen CMYK Farbprinter besonders gut. Die Erfahrung zeigt, dass zentrale Outputmanagement-Plattformen bei der Erstellung der Dokumente oder deren Konversion vermehrt verschiedene PDF/A-Dateien erzeugen müssen. Das oben aufgeführte Beispiel zeigt, dass die PDF/A-Dateien für die unterschiedlichsten Anforderungen gezielt bereitgestellt werden müssen.

Sonderfall Transparenz

Bislang waren transparente Objekte im PDF/A-1 unzulässig. Zu dem Zeitpunkt, als PDF/A verabschiedet wurde, waren die Algorithmen zur Transparenzberechnung nicht ganz eindeutig formuliert und sind bislang nicht erlaubt. Ein einfaches Beispiel: Viele Banken legen ihre Dokumente mit einem Wasserzeichen im Archiv ab. Bei der Konvertierung dieser Dokumente in PDF/A ohne Validierung kann es vorkommen, dass das Wasserzeichen im Reprint wichtige Inhalte überdeckt. Die zukünftige Definition des PDF/A-2 wird diesem Sachverhalt gerecht.

Jedes Archiv hat ein Ende, die darin enthaltenen Dokumente jedoch nicht

Wir sind der Überzeugung, dass sich das PDF/A-Format für die Langzeitarchivierung durchsetzen wird. Viele neue Lösungen basieren von Beginn an auf PDF/A und erzeugen keine TIFF-Dateien mehr. Unsere jahrelange Erfahrung zeigt, dass Archivmigrationen nie einfach sein werden. Das Entladen von Massendokumenten zum Beispiel ist in den meisten Archiven nicht vorgesehen, obwohl es technisch möglich ist. Viel Zeit in den Migrationsprojekten geht auch bei der Konversion verloren. Konversionen sind aufwendig und dies nicht nur wegen der Laufzeit sondern auch wegen der Konversion der einzelnen Objekte, wie z.B. Single Page TIFF zu Multipage TIFF, PDF zu PDF/A nach Gruppen (fehlende Fonts etc.). Standardisierung der Formate gerade mit PDF/A-Umfeld ist und bleibt der wichtigste Investitionsschutz in der Archivierung.

Die konsequente Verwendung von PDF/A bei allen Lieferapplikationen, sei es aus einer Outputmanagement-Plattform oder auch aus einem Scannprozess, sichert die Reproduzierbarkeit eines Dokumentes über Jahre und wird so zum wichtigsten Faktor für einen nachhaltigen Langzeitarchivierung.

PDF/A COMPETENCE CENTER MITGLIEDER VORSTELLUNG

Docucom AG:

Docucom gegründet im Jahre 1997 mit Sitz in Rapperswil-Jona, Schweiz, positioniert sich als erste Adresse in der Informatik, für Systemlösungen in den Themen des Outputmanagement und den Archivmigrationen. Als führender Schweizer Anbieter in der Migration von Dokumentenarchiven, haben wir unsere Dienstleistungen und Produkte stetig weiterentwickelt und verfügen heute unter anderem über eines der schnellsten Produkte zum Entladen von Archiven, deren Datenhaltung auf optischen Datenträgern basiert.

Unsere Kunden bewegen sich in sämtlichen Marktsegmenten, wie Banken, Versicherungen, Informatik, Logistik, Telekommunikation, Dienstleistungen und Behörden. Dabei konzentrieren wir uns auf mittelständische bis große Unternehmen.

In vielen Projekten haben wir mit unserer Migrationsplattform eine Lösung und Methode für das Migrieren von Archiven entwickelt, welche ein sicheres und protokolliertes Entladen der Alt-Archive ermöglicht. Die Migrationsplattform besteht aus Hardware und Software, die speziell an die Archivmigration des Kunden angepasst wird und einen Datenexport unabhängig von Tools des Archivherstellers garantiert. Unter Verwendung der Migrationsplattform garantieren diese Verfahren den ungestörten produktiven Betrieb des abzulösenden Archivs.

Über Archivmigrationen hinaus bieten wir Gesamtlösungen für den Bereich Outputmanagement an. Wir sind spezialisiert, Daten wie auch Dokumente von verschiedensten Applikationen entgegen zu nehmen und zentral nach kundenspezifischen Standards einheitlich zu verarbeiten.

Als Schweizer Marktführer in der Beratung und Umsetzung von Archivmigrationen, unterstützen wir unsere Kunden, bei der Umsetzung von unternehmensweiten Strategien, PDF/A einzusetzen. Die Erfahrungen und Erkenntnisse aus dem Bereich der Archivmigration legitimieren uns in spezieller Weise, unsere Kunden auf die Wichtigkeit von PDF/A in der Langzeitarchivierung aufmerksam zu machen.

Mehr Informationen unter www.docucom.ch

 


 

EVENTS

4. Webinar: Archivierung von digitalen Dokumenten und E-Mails in PDF/A

Dr. Hans Bärfuss, Dr. Hans-Rudolf Aschmann, PDF Tools AG

  • (Deutsch – DACH): Di 26.5., 11.00 Uhr, MESZ/CEST (mitteleuropäische Sommerzeit)

Anmeldung

  • (Englisch – Asien und Europa): Mi 27.5., 10.00 Uhr, MESZ/CEST, 08.00 Uhr UTC

Anmeldung

  • (Englisch – Nord- und Südamerika): Mi 27.5., 11.00 Uhr PDT (PST+1), 14.00 Uhr EDT (EST+1), 20:00 Uhr MESZ/CEST, 18:00 Uhr UTC

Anmeldung

10. 6. 2009: nestor Abschlussveranstaltung in Berlin

In der Staatsbibliothek zu Berlin findet am 10. Juni 2009 die nestor-Abschlussveranstaltung statt. Neben dem offiziellen Programm, zu dem politisch Verantwortliche und LZA-Experten aus verschiedenen Institutionen geladen sind, plant der Veranstalter einen Markt der Möglichkeiten: Langzeitarchivierung, auf dem sich die vielfältigen Projekte und Aktivitäten zum Thema Langzeitarchivierung präsentieren können.

nestor Website

18.–19. 6. 2009: Internationale PDF/A Konferenz in Berlin

Das PDF/A Competence Center veranstaltet seine zweite internationale PDF/A Konferenz vom 18. bis 19. Juni 2009 in Berlin. Die Konferenz bietet Fachvorträge internationaler Experten, Tracks für unterschiedliche PDF/A-Schwerpunkte und Interessensgebiete sowie Workshops zum praktischen Einsatz von PDF/A. Mitglieder des PDF/A Competence Centers präsentieren ihre Lösungen in einer begleitenden Ausstellung.
Weitere Informationen, Programm und eine Anmeldemöglichkeit

 

 


 

NEUE MITGLIEDER IM PDF/A COMPETENCE CENTER

Wir begrüßen drei weitere führende Unternehmen der Branche als Mitglied im PDF/A Competence Center:

 


 

Über das PDF/A Competence Center

Das PDF/A Competence Center wurde 2006 als internationaler Verband gegründet. Ziel des Verbandes ist die Förderung des Informations- und Erfahrungsaustausches auf dem Gebiet der Langzeitarchivierung gemäß ISO 19005: PDF/A. Der Vorstand setzt sich aus Führungskräften der Unternehmen callas software GmbH, Compart AG, intarsys consulting GmbH, LuraTech Europe GmbH, PDF Tools AG (CH), PDFlib GmbH und der SEAL Systems AG zusammen. Innerhalb von weniger als zwei Jahren traten über 85 Unternehmen und diverse Experten aus mehr als 20 Ländern dem PDF/A Competence Center als Mitglied bei. Vorstandsvorsitzender ist Harald Grumser, Geschäftsführer der Compart AG. Hans Bärfuss, CEO der PDF Tools AG, Schweiz ist stellvertretender Vorstandsvorsitzender.

Kontakt

Association for Digital Document Standards e.V.

c/o Compart AG
Rainer Lemke
Otto-Lilienthal-Straße 38
D-71034 Böblingen

Telefon: +49 7031 6205 – 700

info@pdfa.org
www.pdfa.org

About PDF Association

Founded in 2006 as the PDF/A Competence Center, the PDF Association exists to promote the adoption and implementation of International Standards for PDF technology.

Hinterlasse eine Antwort