Ooit gehoord van PDF/A-1a?
Profource is een dienstverlenende kennispartner, een Oracle-autoriteit met bijna 300 betrokken professionals. Vanuit onze specialistische kennis en ruime ervaring adviseren en ondersteunen wij bij het optimaal inrichten, beheren en gebruiken van Oracle Applicaties. Onze medewerkers vertellen graag hoe zij onze klanten hierbij helpen en wat hen bezighoudt.
— — — — —
Ik in ieder geval niet, toen ik door een van onze klanten, de gemeente Rotterdam, werd gevraagd om een koppeling te ontwerpen (technisch) en te bouwen tussen hun E-Business Suite systeem en de berichtenbox van MijnOverheid. Maar de specificaties waren overduidelijk, we moesten PDF/A-1a documenten opleveren.
Daarmee begon een grote zoektocht naar de internals van PDF bestanden, wat best de nodige moeite heeft gekost. Natuurlijk is er eerst het zoeken op Google en Oracle Support hoe we XML Publisher moeten inrichten. Dit bleek een verkeerde weg te zijn. Oracle EBS R12 maakt namelijk gebruik van XML Publisher 5.6.3 en die versie is niet in staat om een bestand in PDF/A-1a formaat op te leveren. Het is ons niet gelukt om een ander softwarepakket te vinden dat de gewenste conversie geautomatiseerd kan uitvoeren.
Een extern bedrijf gaf aan dat ze de conversie naar PDF/A-1a formaat wél uit kunnen voeren en dat ze deze conversie als webservice kunnen opleveren. Erg interessant omdat andere onderdelen van de gemeente Rotterdam dan ook van deze conversie gebruik zouden kunnen maken. Daarom werd hen de opdracht gegund. Ze kwamen ver, maar helaas: het lukte niet en de opdracht werd uiteindelijk teruggegeven.
Mijn fascinatie groeide voor PDF/A-1a
Ik had van dichtbij gevolgd dat het moeizaam ging met de conversie en dit probleem begon me te fascineren. Ook al behoorde het niet tot mijn taak om de oplossing te vinden (want de projectleider wilde graag binnen de budgetten blijven wat een redelijk argument was gezien mijn ervaring met PDF). Diverse forums op internet gaven het beeld dat een conversie erg moeilijk en lang niet altijd mogelijk is. Tenslotte zijn de eisen voor een PDF/A-1a bestand strenger dan de eisen voor een regulier PDF bestand.
Een proefversie van Adobe Acrobat Pro DC maakte duidelijk dat een conversie voor de PDF bestanden wél degelijk mogelijk is. Ook ontdekte ik dat het open source tool Ghostscript in staat is om PDF bestanden naar de PDF/A-1b standaard te converteren. Bijna het gewenste doel.
Gaandeweg werd ik steeds meer getriggerd en na heel wat puzzeluurtjes ‘s avonds en op regenachtige middagen was het zo ver: ik had de oplossing gevonden. Met behulp van wat aanpassingen in de setup van XML Publisher, Apache PDFBox en Ghostscript is het mogelijk om de PDF bestanden te converteren. Uiteraard heb ik ook allerlei andere PDF bestanden getest en heel vaak gaat het goed, ook al zijn niet alle PDF bestanden te converteren. Yes!
Inmiddels draait deze oplossing probleemloos bij de gemeente Rotterdam, helemaal ingebed in de bulk generatie van de PDF bestanden.
Achtergrondinformatie
“PDF/A (Portable Document Format Archivable), ook bekend als ISO 19005-1, is een speciale variant van het gewone PDF-formaat die specifiek ontwikkeld is voor archivering. PDF/A is daarom geschikt voor het opslaan van digitale documenten … PDF/A is een van de weinige documenttypes die op lange termijn eenzelfde weergave van het document kunnen garanderen. Documenttypes zoals .doc (van Microsoft Word) zijn vaak zelfs niet in staat gedurende één software”generatie dezelfde weergave te garanderen”. (bron: Wikipedia)
Die PDF/A standaarden worden dus voornamelijk bij archieven gebruikt, zowel bij de overheid als bij bedrijven. En er zijn verschillende varianten van de PDF/A standaard, maar de “zwaarste” is PDF/A-1a. Een bestand dat daaraan voldoet, voldoet ook aan alle andere PDF/A standaards.
Een PDF/A document is redelijk eenvoudig te herkennen. Wanneer men het opent in Adobe Acrobat Reader, het meest gebruikte programma voor het weergeven van PDF bestanden, ziet men gelijk een blauwe balk in het bovenste gedeelte van het beeld. En links in beeld staat dan een informatietoolbar die meer details geeft.
—– —– —–
Dit artikel is geschreven door Edward, sinds 2012 werkzaam bij Profource als technisch consultant voor de Oracle E-Business Suite en de Oracle SOA Suite. Hij heeft een ruime ervaring in het ontwerpen en bouwen van software en is de afgelopen jaren werkzaam geweest o.a. voor de ANWB, Economische Zaken en de gemeente Rotterdam.