Interview mit Richard Cohn

PDF Association staff // August 10, 2018

PDF in general Interview


Richard Cohn, Principal Scientist bei Adobe und Co-Autor der ersten PDF-Spezifikation, reflektierte in einer Keynote auf den PDF Days Europe 2018 die Geschichte von PDF.

PDF Association: Sie waren an der Entwicklung von PDF beteiligt. Konnten Sie sich vorstellen, dass das Format einen solch dauerhaften Erfolg haben würde?

Richard Cohn: Ich hätte nie gedacht, dass PDF so erfolgreich sein würde, wie es ist. Die einzige Person, die nicht überrascht war, ist wahrscheinlich John Warnock. [Anmerkung: John Warnock ist einer der Gründer von Adobe Inc.]

PDF Association: Welche spannenden Elemente des PDF-Formats haben Sie persönlich in ihren Bann gezogen, sodass Sie sich seit 25 Jahren damit beschäftigen?

Richard Cohn: Im Laufe der Jahre habe ich an anderen Projekten gearbeitet und Adobe sogar für ein paar Jahre verlassen, aber irgendwie bin ich immer wieder ins Team zurückgekehrt. Was mein Interesse gehalten hat? Ich konnte neue Technologien in PDF-Workflows wie Web-Technologien und maschinelles Lernen integrieren. Was mich aber am meisten motiviert, ist der Einfluss von PDF auf die Welt. Für mich kann die Verbesserung von PDF oder die Erweiterung seiner Möglichkeiten sich auf mehr Menschen auswirken als die Arbeit an den meisten anderen Dingen.

PDF Association: Wie sehen Sie die Zukunft von PDF?

Richard Cohn: Es scheint, dass sich PDF von Jahr zu Jahr mehr durchsetzt. Im Laufe der Zeit sind viele Alternativen entwickelt worden, aber keine hat die Bedeutung von PDF erreicht, insbesondere bei der Darstellung von Dokumenten in der „Endfassung“. Allerdings hat sich die Computerlandschaft verändert, insbesondere durch die Allgegenwart der mobilen Geräte. Für viele Menschen ist ihr Smartphone ihr einziger Computer und kein zweites Gerät. Ich erwartet, dass sich PDF noch mehr an diese neue Computerumgebung anpasst.

PDF Association: Sie arbeiten derzeit an der „Anwendung des maschinellen Lernens auf das 25 Jahre alte Problem der Extraktion von Dokumentenstrukturen aus PDF“. Was bedeutet das?

Richard Cohn: Ich bin zum so genannten Adobe-Document-Cloud-Team zurückgekehrt, um einige der neuesten Technologien wie maschinelles Lernen auf einen Bereich von PDF anzuwenden, der nicht immer die Aufmerksamkeit erhält, die er verdient – die Dokumentenstruktur. Bevor es das ursprüngliche Acrobat-Team überhaupt gab, arbeitete ich an etwas, das wir Interchange PostScript nannten, ein Format, das sowohl die Struktur als auch die visuelle Darstellung eines Dokuments repräsentierte. Um die erste Version von PDF und Acrobat herauszubringen, konzentrierten wir uns auf die visuelle Darstellung. Ein paar Jahre später haben wir Struktur hinzugefügt, aber es ist nicht erforderlich, und viele PDFs enthalten wenige Strukturinformationen. Mein derzeitiges Team arbeitet daran, die Struktur eines PDF-Dokuments mithilfe maschinellen Lernens zu extrahieren, auch wenn der Originalautor diese nicht bereitstellt. Dies verbessert die Zugänglichkeit und erhöht die Wiederverwendung von Dokumenten.


ABOUT THE AUTHORS

PDF Association staff

The PDF Association is the meeting-place of the PDF industry. The staff of the PDF Association are dedicated to delivering the information, services and value the members have come to expect. Staff members of the PDF Association include: Duff Johnson (Executive Director) Thomas Zellmann (Managing Director) Matthias Wagner (Operations Director) Alexandra Oettler (Editor) Nicole Gauger (Editor)

ABOUT THE AUTHORS

PDF Association staff

The PDF Association is the meeting-place of the PDF industry. The staff of the PDF Association are dedicated to delivering …

© 2019 Assosiation for Digital Document Standards e.V. | Privacy Policy | Imprint