PDF/UA-2 vs. Well-tagged PDF
Fast zeitgleich sind zwei neue Standards erschienen, welche die Barrierefreiheit von PDF-Dateien definieren: ISO-Standard 14289-2:2024, kurz PDF/UA-2 am 15. März 2024 und Well-Tagged PDF bereits Ende Februar. Wir versuchen eine erste Einordnung vorzunehmen.
Welcher Standard gilt nun für die PDF-Barrierefreiheit?
Um die beiden neuen Standards für PDF-Barrierefreiheit besser zu verstehen, lassen wir uns von folgenden Fragen leiten:
- Worin unterscheiden sich PDF/UA-2 und Well-Tagged PDF?
- Ist PDF/UA-2 der Nachfolger zu PDF/UA-1?
- Was musst du zu PDF/UA-2 jetzt schon wissen?
- Welche Vorteile bietet PDF/UA-2?
- Ab wann lohnt es sich auf PDF/UA-2 umzusteigen?
Bevor wir die Fragen beantworten, klären wir erst einmal ein paar zentrale Begriffe.
Tagged PDF, der Ursprung
Tagged PDF ist ein Mechanismus, der 2001 im Rahmen von PDF 1.4 eingeführt wurde, um PDF fit zu machen für Anforderungen an zeitgemäße Inhaltsformate. Dazu zählen das Extrahieren und Wiederverwenden der Inhalte ebenso wie eine umfassende Barrierefreiheit. Dieser Mechanismus entwickelte sich über die verschiedenen PDF-Versionen hin bis zur aktuellen Form, wie sie in der 2017 veröffentlichten Spezifikation zu PDF 2.0 beschrieben ist.
PDF/UA-1, der Platzhirsch
PDF/UA-1 ist der zur Zeit vorherrschende Standard, der die Anforderungen an ein barrierefreies PDF auf Grundlage spezifischer PDF-Funktionalitäten und -Mechanismen aus der PDF-Spezifikation ISO-32000-1 (PDF 1.7) festlegt. Er ist in seiner ursprünglichen Form im August 2012 als ISO-Standard 14289-1:2012 erschienen und inzwischen ebenso ein DIN-Standard.
Wichtig zu merken: die jeweilige PDF-Spezifikation gibt vor, welches Set an PDF-Standard-Tags und weitere Funktionalitäten zur Verfügung stehen. Der dazugehörige UA-Standard regelt nur noch deren Verwendung.
Von Anfang an war PDF/UA-1 als komplementär zu anderen Standards konzipiert – beispielsweise zu den WCAG, den Web Content Accessibility Guidelines – und referenziert für Anforderungen, die keine PDF-spezifische Umsetzung erfordern auf diese. Ein Beispiel sind hier die Kontrastanforderungen.
Hervorzuheben ist, dass PDF/UA nicht nur Vorgaben macht, wie ein barrierefreies PDF technisch umgesetzt sein muss, sondern mitdenkt, dass dazu ein verlässliches Zusammenspiel zwischen Autorenwerkzeugen, dem Dokument selbst, der Viewer Software und der Assistiven Software erforderlich ist.
Die Entstehungsgeschichte von PDF/UA-1 ist eng mit dem Ausarbeiten des Standards für archivierbare PDFs, PDF/A, verknüpft, weshalb PDF/UA aus der Perspektive Barrierefreiheit einige nicht leicht nachzuvollziehende Anforderungen aufweist.
PDF/UA-2, der Newcomer
Genau die Mängel von PDF/UA-1 bügelt der Newcomer PDF/UA-2 aus. Für sein Ausarbeiten lag der Fokus komplett auf der Barrierefreiheit. Ein weiteres Ziel war es, den Standard konsequent auf die PDF-spezifische Anforderungen zu begrenzen und alle inhaltlichen Erfordernisse wie beispielsweise die Verständlichkeit an andere Standards auszulagern.
PDF/UA-2 regelt die Verwendung von Konzepten und Mechanismen aus der PDF-Spezifikation ISO 32000-2 (PDF 2.0). Dazu zählen:
- Die Einführung des Namespace-Konzeptes: Ein PDF/UA-Dokument kann nun verschiedene Tag-Sets enthalten, um semantische Auszeichnungsmöglichkeiten anderer strukturierter Formate für PDF nutzbar zu machen: beispielsweise MathML oder EPUB.
- Erweiterung des Standard-Tag-Sets beispielsweise durch Title, Aside, Sub, oder DocumentFragment, um eine reichere Semantik zu ermöglichen.
- Erweiterte Möglichkeit des Kennzeichnen als Artefakte: beispielsweise auch für Annotations oder auch mit Hilfe des neuen Artefakt-Tags.
- Zusätzliche Attribute, die Layoutinformationen mit semantischem Gehalt in maschinenlesbarer Form zugänglich machen.
Zumindest auf dem Papier bietet PDF/UA-2 damit die Möglichkeit, eine noch reichere, zuverlässigere User Experience für Menschen zu bieten, die auf barrierefreie Dokumente angewiesen sind.
Well-Tagged PDF, der Zwilling
Barrierefreiheit ist jedoch nicht der einzige Anwendungsfall für die Konzepte und Mechanismen, die PDF/UA-2 aufgreift. Bereits im Ursprung zielte der Tagged PDF-Mechanismus auf das Extrahieren und Wiederverwenden von Inhalten. Aber selbst dafür muss ein PDF mit Tags bestimmte Qualitätskriterien erfüllen. Dazu entwickelte eine internationale Arbeitsgruppe der PDF Association einen Standard mit dem Namen Well-Tagged PDF mit zwei Konformitätslevels:
- Konformitätslevel: Für das Wiederverwenden
- Konformitätslevel: Für die Barrierefreiheit
Das Konformitätslevel 2 des Well-Tagged PDF-Standards ist identisch mit den PDF/UA-2-Anforderungen. Ein Großteil der Inhalte – beispielsweise die Beschreibungen zu den einzelnen Tagtypen – entsprechen sich 1:1.
Worin unterscheiden sich PDF/UA-2 und Well-Tagged PDF?
Auch wenn sich PDF/UA-2 und Well-Tagged PDF mit dem Konformitätslevel „Für die Barrierefreiheit“ inhaltlich gleichen, gibt es doch Unterschiede:
- PDF/UA-2 ist ein offizieller ISO-Standard, während Well-Tagged PDF ein reiner Standard der PDF Association ist.
- Die Well-Tagged PDF-Spezifikation steht kostenfrei über die Internetseite der PDF Association zur Verfügung, während PDF/UA-2 kostenpflichtig erworben werden muss. Das ist ein großer Vorteil. Denn: Wer sich PDF/UA-2 aneignen will, kann einfach Well-Tagged PDF mit dem Konformitätslevel „Für die Barrierefreiheit“ durcharbeiten.
Update: Seit 12. August 2024 sind alle PDF/UA-Standards als "No cost"-Versionen auf der Internetseite der PDF Association verfügbar. Möglich ist dies, weil vier Firmen, darunter wir als axes4, dieses Projekt gesponsort haben: https://pdfa.org/announcing-no-cost-access-to-pdfs-accessibility-standards/
Ist PDF/UA-2 der Nachfolger zu PDF/UA-1?
Nein. PDF/UA-2 ist völlig neu geschrieben auf Grundlage der PDF-Spezifikation 32000-2. PDF/UA-1 hingegen basiert auf PDF 32000-1. Es handelt sich also um zwei komplett unterschiedliche Welten, auch wenn der Newcomer einiges vom Platzhirsch übernommen hat.
Was musst du zu PDF/UA-2 jetzt schon wissen?
Mit PDF/UA-2 geht ein sogenannter „Breaking change“ einher: eine konzeptionelle Änderung eines Standards, die Abwärtskompatibilität unmöglich macht. Zwar kann ein PDF/UA-2-konformes Dokument auch den PDF/UA-1 Namespace enthalten.
Ab wann lohnt es sich auf PDF/UA-2 umzusteigen?
Der Schlüssel zum Etablieren eines neuen Standards sind die PDF-Viewer: Ein Umstieg lohnt sich erst, sobald PDF-Viewer nicht nur das Lesen von PDF/UA-2-Dateien sondern auch das Potenzial der neuen Features unterstützen. Dies hängt auch damit zusammen, dass Assistive Software auf die Daten angewiesen ist, die sie vom PDF-Viewer erhalten. Erst wenn diese Wirkungskette gewährleistet ist, können die Verbesserungen für die barrierefreie User Experience bei den Nutzer:innen ankommen.
Fazit
Im Hinblick auf den Standard für PDF-Barrierefreiheit ist weniger die Frage, ob du dich an PDF/UA-2 oder an Well-Tagged PDF halten sollst. Beide Standards entsprechen sich, wenn es um die Barrierefreiheit geht.
Entscheidender ist die Frage, wann du auf PDF/UA-2 statt auf PDF/UA-1 setzt, denn eine Abwärtskompatibilität ist nicht möglich. Für eine optimierte barrierefreie User Experience bietet PDF/UA-2 ein Riesenpotenzial, nicht allein durch das Namespace-Konzept. Damit dies jedoch bei den Nutzer:innen ankommen kann, muss es PDF-Viewer geben, die dies unterstützen und die Daten an die Assistive Software weitergeben.
Besonders für Software-Entwickler, aber auch für Remediator lohnt es sich bereits jetzt, sich in die PDF/UA-2-Welt einzuarbeiten und einen Implementierungsplan zu erstellen. Dafür eignet sich die kostenfrei zur Verfügung stehende Well-Tagged PDF-Spezifikation ideal.
Wir werden in den nächsten Monaten einzelne Aspekte von PDF/UA-2 in der Tiefe vorstellen.
Nützliche Links
Wer sich selbst einlesen möchte, kann dies über die folgenden Links tun. Alle Dokumente zu den PDF-Barrierefreiheits-Standards sind kostenfrei verfügbar, teilweise als gesponsorte "No Cost"-Versionen. Alle Inhalte sind ausschließlich auf Englisch verfasst:
- PDF 32000-1: https://opensource.adobe.com/dc-acrobat-sdk-docs/pdfstandards/PDF32000_2008.pdf
- PDF/UA-1: https://pdfa.org/announcing-no-cost-access-to-pdfs-accessibility-standards/
- Tagged PDF Best Practice Guide (gemäß PDF/UA-1): https://pdfa.org/wp-content/uploads/2023/07/Tagged-PDF-Best-Practice-Guide.pdf
- Techniken für PDF-Barrierefreiheit (gemäß PDF/UA-1): https://pdfa.org/pdf-techniques-for-accessibility-a-new-model/
- PDF 32000-2: https://www.pdfa-inc.org/product/iso-32000-2-pdf-2-0-bundle-sponsored-access/
- PDF 32005: https://pdfa.org/resource/iso-32005/
- PDF/UA-2: https://pdfa.org/announcing-no-cost-access-to-pdfs-accessibility-standards/
- Well Tagged PDF: https://pdfa.org/wtpdf/
- Tagged PDF: Q&A: https://pdfa.org/resource/tagged-pdf-q-a/