Alla difesa delle diafane memorie digitali

Posted on 25 febbraio 2015

3


Vint Cerf, uno dei padri di internet e oggi « Chief Internet Evangelist» di Google, ha recentemente espresso il suo timore per la possibile perdita di dati digitali da qui al futuro, quando alcuni dati potrebbero essere scritti in formati incomprensibili dalle macchine che saranno di uso comune da qui a qualche anno.

«Sono molto preoccupato», ha detto Cerf a margine della grande conferenza dell’American Association for the Advancement of Science a San Jose, in California. E la preoccupazione di Cerf è che, in futuro, buona parte dei dati che archiviamo in formato digitale possa divenire inaccessibile ai posteri, che potrebbero mancare della tecnologia per leggerli e riprodurli. La soluzione proposta da Cerf è quella di archiviare insieme ai dati anche i software capaci di leggerli e un’immagine ai raggi X delle macchine preposte a funzionare con quei programmi e a leggere quei dati.

L’idea permetterebbe di mettere a disposizione delle generazioni future gli strumenti per leggere tutti i formati divenuti obsoleti, ma non risolve uno dei problemi principali dati da una tale obsolescenza, che è quello per il quale alla fine non si saprà neppure cosa ci sia in quei file illeggibili, nell’immediatezza. L’idea di Cerf che possa essere un’azienda a incaricarsi di questo delicatissimo compito, appare ancora più improbabile e non solo perché di aziende che vivono attraverso i secoli se ne son viste poche, non si capisce infatti come un’azienda del genere potrebbe finanziare questa attività o cosa avrebbe da vendere e a chi, il passato non rende.

La preoccupazione di Cerf è del tutto condivisibile, ma nemmeno l’azienda per la quale fa l’evangelista della rete sembra molto interessata a diventare la bibliotecaria del mondo, figurarsi l’interesse a farsi museo delle tecnologie passate. Google negli ultimi anni ha abbandonato tutti i progetti di archiviazione e preservazione dei dati e anche il suo algoritmo di ricerca ora privilegia la «freschezza» delle informazioni sulla loro qualità o attendibilità.

È appena il caso di ricordare che nel 2001 l’azienda ha acquisito gli archivi Deja, che contenevano la più vasta selezione di archivi di Usenet, e ne ha tirato fuori i Google Groups, dotati di archivi che andavano a ritroso fino al 1981 e ora defunti. Stessa fine per Google Books, il progetto di digitalizzazione e archiviazione digitale dei libri, un’impresa che ormai si trascina con stanchezza e probabilmente sarà avviata alla chiusura, visto che l’ultimo post sul blog ufficiale risale al 2012 e che l’ultimo tweet dell’account relativo è stato pubblicato nel 2013. Stessa fine per il Google News Archive, lanciato nel 2006 e capace di offrire articoli di giornale vecchi di 200 anni, molti dei quali scansionati da Google stessa. Poi morto nel 2011.

Ben più pressante del pur incombente problema degli standard è quindi quello di capire chi e come si addosserà il compito di conservare e rendere accessibili non solo le informazioni più fresche ed attuale, ma chi al contempo sopporterà l’onere di conservare anche i dati molto vecchi o molto poco interessanti commercialmente, perché il vero rischio che si corre è quello di ammassare immensi archivi digitali che poi andranno distrutti dal disinteresse o dalla mancanza di manutenzione dei database.

Pubblicato in Giornalettismo

Annunci