Perché il PDF è il formato di file più importante del mondo

La storia del PDF, il formato di file che è diventato uno degli strumenti di informazione distintivi di internet, l'unico che rimarrà qui anche dopo che saremo scomparsi.
26.4.18
Immagine: myfra/Pixabay 

Una versione di questo articolo è originariamente apparsa su Tedium, una newsletter bi-settimanale.

Il Portable Document Format, o PDF, è dappertutto. Ma rimane un formato ancora in grado di causare fastidio all’uomo medio.

Prendiamo ad esempio Paul Manafort, l’ex manager della campagna di Trump, che potrà non essere un uomo comune, ma che ha problemi con i PDF esattamente come succede anche ai migliori di noi.

Pubblicità

La recente imputazione a carico di Manafort da parte del procuratore speciale del Dipartimento di Giustizia Robert Mueller ha osservato come il lobbista, e il suo collega Richard Gates, hanno collaborato nel modificare un documento PDF, convertendolo in formato Word per cambiarne alcune parti, per poi riconvertirlo in PDF.

Tutto questo ha creato una sorta di traccia cartacea capace di supportare il caso di Mueller contro Manafort. In realtà, non succede così spesso che il PDF salga alla ribalta mediatica. La storia dell’origine del PDF è leggermente più noiosa di quella del MP3, che fu ideato utilizzando la voce solista di Suzanne Vega in “Tom’s Diner”, o del file ZIP, che nacque all’interno di una violenta battaglia legale.

Tuttavia il PDF ha comunque una sua storia, di quelle che promettono di diventare ancora più importanti nei decenni a venire. Ecco perché.

“Quello di cui l’industria ha disperatamente bisogno è un modo universale per trasmettere documenti che siano compatibili con diverse configurazioni di macchine, sistemi operativi e reti di comunicazione. Questi documenti dovrebbero essere visualizzabili su qualsiasi schermo e dovrebbero essere stampabili dalle moderne stampanti. Se questo problema può essere risolto, allora il modo in cui la gente lavora cambierà.

— Sono le parole di John E. Warnock, il co-fondatore di Adobe, in un saggio che rivela l’esistenza del The Camelot Project (che, ovviamente, è in formato PDF) e in cui discute i ragionamenti che fece per pensare ad un formato compatibile con computer diversi. Warnock, che fu responsabile anche di aver aiutato lo sviluppo del fondamentale linguaggio di programmazione per documenti Adobe PostScript, ha osservato che PostScript e il suo linguaggio fratello Display PostScript fossero troppo pesanti per molti dei computer che venivano costruiti intorno al 1990, quando scrisse il suo saggio. “Le soluzioni che Display PostScript e Post Script propongono sono corrette nel lungo termine, dal momento che la potenza delle macchine aumenta nel tempo, ma questa soluzione offre ben poco aiuto alla grande maggioranza degli utenti attuali, dotati di macchine prodotte oggi,” spiegò.

Per il PDF la vera svolta potrebbe essere stata la dichiarazione dei redditi.

Quando Warnock e i suoi colleghi all’Adobe provavano a risolvere il difficile problema del creare un formato di file semplice che avrebbe potuto essere usato per leggere documenti sui computer delle persone comuni, l’IRS (l’Agenzia delle Entrate statunitense) stava avendo a che fare con il suo annuale mal di testa dato dal lavorare con il servizio postale nazionale.

Regolarmente, ogni anno, appena prima della stagione delle tasse, l’IRS inviava i moduli per le tasse a centinaia di persone negli Stati Uniti. Questa spedizione annuale era, durante gli anni in cui non avveniva il censimento nazionale, la più grande spedizione che il servizio postale doveva affrontare — su base annuale circa 110 milioni di spedizioni individuali, secondo un articolo del 1991 apparso sul New York Times. L’IRS, dovendo fare i conti con un complicato codice tributario, doveva gestire e affrontare una grande varietà di eccezioni e forme differenti, sia per le attività che per il singolo contribuente.

Pubblicità

Questo non era solo incredibilmente dispendioso — mai una gioia quando sei l’Agenzia delle Entrate — ma rappresentava una sorta di incubo logistico, come era suggerito dal fatto che la carta interferiva con il lavoro del governo federale.

Una situazione del genere è esattamente una di quelle in cui il PDF sarebbe stato utilissimo. Certo, c’erano già sul mercato delle soluzioni software a quel tempo — tra le altre, TurboTax su PC e MacInTax su Mac — ma l’utente americano medio non era per forza abbastanza a suo agio con la tecnologia da far compilare le tasse al proprio computer. Però, avrebbe potuto essere interessante stampare moduli.

Per fortuna, Adobe era pronta. Alla fine del 1992, la compagnia mostrò per la prima volta la sua tecnologia PDF e il nuovo marchio Acrobat alla fiera commerciale COMDEX. La stampa di settore del tempo scrisse di Acrobat in maniera esuberante, dato che l'arrivo di quel formato significava poter avere a computer un file che era esattamente identico a come sarebbe apparso una volta stampato — sempre che ci fosse stato effettivamente il bisogno di stamparlo. Acrobat fu addirittura nominato “Best of the Show” di quell’anno.

Tuttavia, Warnock ammise presto che l'intero progetto aveva ancora bisogno di una direzione chiara.

“Quando Acrobat fu annunciato, il mondo non lo capì. Non capirono quanto sarebbe stato importante inviare documenti in formato elettronico,” disse Warnock in un’intervista del 2010 con Knowledge@Wharton.

Pubblicità

Ma il fulcro del discorso era che Adobe aveva già il perfetto caso d’utilizzo grazie all’IRS, senza dimenticare il resto del mondo aziendale americano.

Una pubblicità di Adobe Acrobat 1.0

Adobe aveva in potenza una soluzione per eliminare le montagne di carta che venivano prodotte dagli uffici di tutto il mondo. E siccome Adobe aveva de facto lo standard di mercato già con PostScript, prese la corsia interna; facile vedere dove si stava andando a parare.

Secondo NetworkWorld, l’IRS stava distribuendo moduli per la dichiarazione dei redditi in formato PDF già all’inizio del 1994, una mossa che contribuì molto all’inerzia dietro la diffusione del formato.

Ma mancava un elemento e quell’elemento era la rete, che aveva reso relativamente facile il concetto di accesso ai documenti tributari. Per la stagione delle tasse 1996 Internet era pronto per partire, esattamente come l’Agenzia delle Entrate statunitense che avviava i suoi server web — completi di più di 600 documenti scaricabili in formato PDF, come afferma una rubrica del 1996 del guru della tecnologia Kim Komando.

Un caso studio sul sito di Adobe mostra come l’IRS andò all-in sul PDF, dando copie del software a più di 100.000 impiegati fino al 2001, e risparmiando milioni di dollari di costi per il processo di stampa.

A parte risparmiare la spedizione postale di molti di questi moduli, aiutò anche le aziende a evitarsi molti mal di testa, rendendo più facile trovare i materiali durante le revisioni. Al posto di doversi infilare in oscuri schedari, per gli ispettori contabili e i revisori dei conti sarebbe stato possibile accedere ai documenti in via digitale.

Pubblicità

“In termini di mera soddisfazione impiegatizia, Acrobat parla da solo,” disse ad Adobe un funzionario dell’IRS. “Aggiungete a questo il beneficio di una gestione dei documenti più agile e di un minore stoccaggio di carta, ed è chiaro che Acrobat e Adobe PDF hanno garantito un ottimo rientro all’Agenzia e alle persone che serve.”

Ovviamente questa citazione è un po' un'iprtbolr, ma l’IRS era davvero una finestra sul microcosmo del mondo aziendale globale. Il PDF, in poco tempo, divenne uno dei più importanti metodi usati dai businessman per condividere documenti. (Il mondo accademico, inoltre, seguì rapidamente a ruota.)

Il PDF rendeva più facile anche andare in copisteria, poiché il formato del file era capace di incorporare elementi come i font e le immagini, semplificando una delle parti più difficili nella stampa di un file. (Ovviamente, di base non è possibile apportare cambiamenti a un modulo PDF.). Col tempo sarebbe arrivata la possibilità di cercare all'interno di un PDF, e poi anche di modificarlo.

Inoltre, più avanti sarebbe diventato anche “riempibile”. L’IRS creò subito delle versioni dei suoi moduli delle tasse che permettevano all’utente finale di inserire i propri numeri, e, poi, persino le loro firme.

Anche se nulla di tutto questo era leggero come, ad esempio, un file di testo, nè flessibile come un HTML, sicuramente batteva PostScript per la persona media.

E Il PDF divenne la soluzione a lungo termine.

“Il PDF è diventato de facto lo standard globale per uno scambio di informazioni più sicuro e tutelato, da quando Adobe pubblicò le specifiche complete del PDF nel 1993. Sia i governi che l’industria privata devono fare affidamento sul PDF per il volume di documenti elettronici che necessitano di essere condivisi, gestiti, e talvolta conservati per generazioni, in modo più sicuro e affidabile.”

— Un estratto dalla prefazione dello standard ISO 32000-1, la prima versione standardizzata del 2008 delle specifiche complete del PDF. Sebbene Adobe creò per prima il PDF nel 1993, lasciò il formato aperto, così da permettere alle altre aziende di poterlo usare, consentendogli di diventare de facto uno standard. (Adobe ha fatto pagare parecchio i suoi strumenti creativi). Ma nel 2007, Adobe ha lavorato con l’Organizzazione internazionale per la normazione (ISO) per creare uno standard aperto per la tecnologia. La mossa ha perfettamente sottolineato quanto questo standard sia diventato comune.

Forse il più importante compito del PDF in tempi moderni è l’archiviazione.

Ammettiamolo tranquillamente: la normazione è noiosa.

È un argomento noioso, ma che in qualche modo è incredibilmente importante per il mondo dell’archiviazione. La ragione è presto ovvia: se uno cambia casualmente il modo in cui produce e conserva i microfilm, ad esempio, quei microfilm diventeranno difficilissimi da riutilizzare.

Pubblicità

Ma la standardizzazione è anche un’arma a doppio taglio. Ci sono cose per le quali uno standard non è obbligatoriamente necessario. Mettiamo che non ci interessi l’interattività, magari perchè stiamo provando a digitalizzare documenti datati secoli fa.

Ci potrebbero anche essere delle minuzie che ci interessano, come l’abilità di rendere cercabile al suo interno un testo. E probabilmente vorremmo garantire la massima compatibilità, lavorando con tutte le varianti di uno strumento.

Tutte queste ragioni, e qualcuna in più, sono il perchè il formato PDF/A fu creato nel 2005. Diversamente dal PDF standard, che fu progettato per avvantaggiarsi dal fatto che era costruito per un computer, il PDF/A è progettato per essere riproducibile al massimo, fino al punto in cui potrebbe sostituire un documento stampato nel caso l’originale cartaceo fosse perso.

“Tutto quello che è richiesto per trasporre un documento nello stesso identico modo, ogni volta, è contenuto nel file PDF/A: font, profili colore, immagini, etc.. Anche il PDF/A è diventato uno standard ISO, garantendo che le future generazioni di software sappiano aprire e visualizzare i file PDF/A,” spiega Shawna McAlearney, un’esperta di marketing di Appligent Document Solutions, nelle FAQ sul sito dell’Associazione PDF.

Questo è utile per organizzazioni come l’Internet Archive e la Biblioteca del Congresso, che stanno conservando informazioni sulla lunga durata che necessitano di essere leggibili in 30 anni da ora. Ma a volte arriva qualche controversia nel mondo archivistico, come quando il formato fu ampliato nel 2012 per permettere l’inclusione di file come quelli di calcolo e di documenti in HTML.

Pubblicità

Ci sono alcuni critici della rapida diffusione del PDF/A. In un saggio sull’argomento, Marco Klindt dell’Istituto Zuse di Berlino espone da una prospettiva archivistica una serie di problemi, tra cui, oltre ad altre cose, il fatto che possa essere scomodo da usare.

(Curiosamente, l’esperto di fruibilità Jakob Nielsen si è scagliato contro l’uso dei PDF per la stessa ragione, dichiarando sul suo sito di consulenza: “Il PDF è buono per stampare, ma finisce qui. Non usatelo per le presentazioni online.”).

Klindt, che mostra anche problemi legali e di integrità del formato, suggerisce che il desiderio per un formato di conservazione appropriato limiti la discussione sul fatto se il formato abbia senso sul lungo periodo.

“La familiarità con il PDF ha portato a una veloce e ampia adozione del PDF come soluzione nel campo dell’archiviazione digitale, “scrive. “Questo fatto può aver zittito le profetiche voci che richiedevano la ricerca e lo sviluppo di contenitori di creatori più adatti per il lavoro di ricerca (testi e dati) basati sul riutilizzo.”

Anche se questo è il caso - di certo ho caricato la mia quota di PDF da 300 megabyte lungo gli anni, e online è pieno di documenti che non hanno motivo per essere PDF - vale la pena ammirare quanto il formato abbia fatto per digitalizzare e proteggere la nostra conoscenza collettiva.

In 50 anni i PDF, nonostante le loro debolezze, ci aiuteranno a documentare la storia allontanando l’effimera natura della rete. E, diversamente dal formato cartaceo, i PDF non soffriranno di pagine consumate.

“Il consiglio [di Adobe] voleva abortirlo. Ho detto, ‘Assolutamente no. Tutto questo riguarda il risolvere un problema importante, e non ci muoveremo da qui finchè non lo faremo funzionare.”

— Warnock, parlando a Knowledge@Wharton riguardo i primi anni di Acrobat. Oggigiorno diamo per scontato il fatto che il PDF sia sostanzialmente comune ovunque online, ma c’è stato un momento in cui il formato PDF era in una così cattiva forma che Adobe ha dovuto smettere di far pagare Acrobat Reader, una mossa che Warnock ha descritto come un “una scelta molta richiosa.” (Fissarono invece un prezzo molto alto per Acrobat). Ma la decisione di stare dalla parte del cliente e renderlo gratis, infine si dimostrò la chiave del successo di Adobe come azienda. Anche se le persone pensano per primo a Photoshop quando si parla di Adobe, un profilo del 2013 del co-fondatore di Adobe fatto dalla sua alma mater, l’Università dello Utah, in definitiva identificava il successo dell’azienda con il formato di documenti che Warnock aveva creato. “Il PDF si impone sulla scena mondiale,” affermò lo scrittore Jason Matthew Smith.

Tornando a Manafort, c’è qualcosa che nella sua situazione avrebbe potuto fare diversamente, per evitare che tutto si trasformasse in un completo imbarazzo?

Pubblicità

Secondo l’Associazione PDF, la risposta è sicuramente sì.

Oltre al fatto che la versione Word crea dei sottili cambiamenti nel formato che possono essere rintracciati, software come Adobe Acrobat possono essere usati per modificare direttamente il testo in un file!

Ecco il punto di vista dell’associazione:

Manafort avrebbe potuto prontamente alterare il PDF da solo. Lo avesse fatto, avrebbe evitato il punto fondamentale della traccia cartacea che può condurlo in una prigione federale. Probabilmente aveva addirittura già un editor di PDF sul suo computer.

Dopo tutto, nel giro del riciclaggio di denaro sporco è frequente il bisogno di assemblare pagina da diversi file PDF, e c’è bisogno di un editor PDF per farlo. Per gran parte della sua carriera da riciclatore di denaro, Manafort era quasi sicuramente solo a uno o due click dalla modalità di modifica.

Il risultato è che le modifiche al PDF hanno giocato un ruolo fondamentale in un grosso scandalo politico.

La storia dell’invenzione del PDF può non avere al suo centro battaglie legali, o un aggancio per portare avanti la sua storia come la canzone di Suzanne Vega ma ha sicuramente il suo scandalo. E, che piaccia o meno, il goffo uso di Manafort di uno strumento sostanzialmente usato da chiunque sottolinea benissimo quanto il PDF sia davvero prevalente.

Questo articolo è apparso originariamente su Motherboard US.