Aprire un PDF danneggiato

tl;dr usa Sumatra PDF.

Obiettivo: aprire un file PDF di due pagine e stamparlo.
Il file proviene da un’email.
Problema: pdf.js (il lettore integrato di Firefox) non visualizza la prima pagina e dice di aprirlo con un lettore esterno.

Lo apro allora con Sumatra PDF: è chiaro che qualcosa non va, nella prima pagina sembra che qualcuno abbia cancellato il testo in cerchi concentrici, si scorge ancora qualche sparuto moncone di parola, c’è del grassetto a casaccio, lo sfondo (che è bianco uniforme, non è nemmeno un’immagine) a un certo punto diventa grigio con degli artefatti grafici nel mezzo simili a quelli di un JPG danneggiato.

Ora, un JPG danneggiato ho una vaga idea di come possa apparire perché qualche tempo fa per divertimento avevo intenzionalmente danneggiato dei JPG per vedere il risultato. Non fu tempo perso, perché ora mi ha reso possibile capire quel PDF era in qualche modo danneggiato.

Non ho idea di come sia potuto succedere, ma già una volta mi sono imbattuto in un XLS messo su internet (che doveva essere pubblicato per legge, tra l’altro) che era stato maciullato a livello binario e non si riusciva ad aprire né con LibreOffice, né col visualizzatore di XLS Microsoft, né con Google Docs, quindi ormai mi aspetto di tutto.
Lì era successo anche qualcosa di interessante: LibreOffice lo apriva, ma da una certa cella in poi i dati testuali e binari convertiti in testo finivano tutti nella stessa cella. Il visualizzatore e Docs invece dicevano che non si poteva aprire e basta.
Quando mi ero divertito a danneggiare i JPG, avevo scoperto che Paint.NET apre senza tanti problemi anche i file danneggiati e mostra quello che può, mentre IrfanView a volte collassa con un errore. L’intuizione e alcune sommarie ricerche su internet hanno confermato che in questi casi, il programma che riesce ad aprire, non effettua controlli sulla conformità del file: cerca di leggerlo e se va bene, bene; ci sarà qualche bit fuori posto, ma le informazioni non sono tutte perdute, e infatti…

Ero sicuro al 99% di essere di fronte a un caso simile, ma mi sono ricordato che Adobe Reader supporta anche le più astruse opzioni dei PDF: magari nella 1° pagina c’era un’immagine in formati mai più visti dentro a un form modificabile firmato con una chiave GPG dentro a uno script COBOL e col DRM buttato sopra tanto per gradire o qualche altra follia.

Per scrupolo ho quindi scaricato Adobe Reader: mi ha offerto McAfee, ho rifiutato, ha iniziato a scaricarsi dall’installer e installarsi senza fare domande (nemmeno “in che cartella?”) e si è piantato. Mi sono accorto che aveva fatto qualcosa, ovvero arrivare al 100%, quando tutti i PDF si sono improvvisamente associati a lui. Ovviamente senza chiedermi il permesso. Eccellente comprensione del concetto di “consenso”, Adobe.
Ho provato ad aprire il file: non visualizzava la prima pagina, sostenendo che fosse danneggiata senza speranza.

Eliminato Adobe Reader e reimpostato Sumatra come predefinito, ho provato col suddetto a riaprire il file: a un esame più attento, ho notato che il testo semidistrutto si poteva selezionare, copiare e incollare in un qualsiasi editor ed era a quel punto perfettamente leggibile. Bene, fatto, mandiamo il file in stampa.

Mai come in questo caso ho potuto apprezzare la grande massima

Be conservative in what you send, be liberal in what you accept

anche se la citazione originaria è leggermente diversa e il significato di fondo pure.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...