Migrazione dati per sistemi COLD e supporti ottici

Introduzione

Agli inizi degli anni novanta, con la diffusione dei primi sistemi di digitalizzazione dei documenti, hanno iniziato ad emergere anche i primi problemi di archiviazione e conservazione a lungo termine. In quel periodo i dischi magnetici avevano capacità e costi incompatibili con le esigenze di archiviazione ed è così iniziato l'uso dei primi dischi ottici e magneto-ottici. I vantaggi rispetto ad altre tecnologie erano subito evidenti:

  • avevano un’elevata capacità - a differenza di oggi - molto più dei dischi magnetici
  • rispetto ai nastri magnetici, consentono un accesso casuale in tempi rapidi
  • è un supporto rimovibile, la cui vita media è più elevata della maggior parte dei supporti concorrenti

Assieme ai supporti di archiviazione è nata l’esigenza di gestire e catalogare queste grandi quantità di informazioni. Sono così nati i primi sistemi COLD – Computer Output to Laser Disc – che univano la digitalizzazione dei documenti e la memorizzazione su dischi ottici con possibilità di ricerca, recupero e visualizzazione dei dati.

L’evoluzione

Negli anni sono state introdotte leggi che consentono alle aziende e agli enti l’utilizzo di questi sistemi in sostituzione all’archiviazione cartacea. Questo ha stimolato una evoluzione dei sistemi COLD per gestire grandissime quantità di dati e l’industria dello storage ha iniziato a proporre soluzioni alternative che offrono capacità e prestazioni sempre maggiori e a costi inferiori.

Queste evoluzioni hanno portato ad una contrazione dell’uso della tecnologia ottica a favore di soluzioni basate su tecnologia a dischi magnetici, con le funzionalità richieste dalle normative che regolano l’archiviazione digitale sostitutiva. I sistemi di questo tipo sono ora definiti come ECM – Enterprise Content Management.

Le prime difficoltà

L’evoluzione delle tecnologie ha fatto nascere un nuovo problema: il supporto e la manutenzione dei sistemi COLD originariamente installati sta sparendo, sia dal punto di vista software che dal punto di vista hardware. Basti pensare al fatto che molti prodotti non sono più aggiornati da anni e in molti casi i produttori non operano nemmeno più sul mercato; o che è rimasto un solo produttore di drive a tecnologia magnetico-ottica ed un solo produttore di media!

Gli utilizzatori di questi sistemi si trovano così sempre più spesso nella situazione in cui i dati sono ancora perfettamente integri sul supporto ottico (la vita media è di ben 50 anni) ma non sono più in grado di leggerli: perché i drive non sono più funzionanti e non si trovano drive sostitutivi oppure perché la piattaforma software è inaccessibile.

Altri utilizzatori si trovano invece nella situazione di avere seguito l’evoluzione tecnologica, acquistando nuove soluzioni e sfruttandone tutti i vantaggi. In molti casi però si trovano ora a dover gestire molti sistemi diversi che spesso non “parlano” tra loro, con evidenti svantaggi non solo nel momento in cui i dati devono essere cercati e recuperati (spesso addirittura da web, inesistente al momento della creazione della soluzione), ma anche nei costi di gestione e manutenzione di tutti i sistemi, incluso il know-how storico che deve essere mantenuto in azienda.

Da questo nasce la necessità di dover migrare e consolidare i vecchi (legacy) sistemi COLD verso nuove soluzioni ECM. E qui è dove Kroll Ontrack può fornire la propria esperienza e propri servizi di migrazione.

Le opzioni di migrazione

Come abbiamo visto, l’evoluzione delle tecnologie di storage e delle esigenze di utilizzo degli archivi storici, rende necessario migrare i dati dei sistemi legacy. In base alle esigenze, le migrazioni possono avvenire su vari livelli:

  • migrazione del supporto, ad esempio dai dischi MO a quelli UDO2, a tape LTO con funzionalità WORM o ad un sistema di storage su disco
  • virtualizzazione dei supporti per consentirne l’accesso giornaliero riducendo l’utilizzo dell’infrastruttura hardware originale, poco prestante ma tuttora rispondente alle normative di legge
  • migrazione sia dei supporti che della applicazione di ECM

I problemi più comuni nei progetti di migrazione

Ogni migrazione presenta aspetti e problematiche specifiche agli ambienti di partenza e di destinazione. Queste problematiche vengono molto spesso sottovalutate e possono ritardare o in alcuni casi addirittura impedire l’implementazione di un nuovo sistema ECM. Vediamo quali sono i problemi più comuni che si incontrano e come questi possono essere affrontati:

  • Non si possiedono più lettori in grado di leggere i supporti e questi non sono più in commercio - Mentre i supporti sono spesso garantiti per una vita di almeno 50 anni, i drive di lettura e scrittura hanno in genere una vita molto più breve. I moderni drive UDO2, gli unici ancora in produzione, non sono però in grado di leggere formati non UDO. Nel caso di rottura di un drive, occorre quindi rivolgersi al mercato dell’usato, dove si possono trovare drive con diverse condizioni di usura e senza garanzia. Il recupero si può presentare quindi problematico e costoso se si considera che terminata la migrazione questi drive non serviranno più.Grazie alla nostra dotazione estensiva di drive legacy, siamo in grado di leggere la maggior parte dei supporti ottici disponibili, consegnando i dati estratti nel formato a voi più comodo (ad esempio: dischi USB, NAS, DVD, etc.).
  • L’applicazione COLD legacy non offre possibilità di esportazione dei dati - Molto spesso le applicazioni legacy non solo non offrivano funzionalità di esportazione dei metadati e/o dei documenti gestiti, ma usavano anche formati file e di database proprietari. Questo fa quasi sempre credere che non ci sia modo di migrare. La nostra esclusiva tecnologia “offline” è in grado di leggere in modalità non-nativa i formati dati e di database di oltre 70 applicazioni ECM. Se la vostra applicazione non è tra quelle supportate, contatteci direttamente. Nella maggior parte dei casi siamo in grado di aggiungere supporto per nuovi formati in circa 3 settimane.
  • L’infrastruttura e/o l’applicazione è ancora in uso e non è in grado di gestire il carico di lavoro aggiuntivo generato da un processo di migrazione “standard” - Le infrastrutture HW e SW sono dimensionate in base al carico di lavoro previsto dalle specifiche applicative. Effettuare una migrazione significa introdurre un carico aggiuntivo quasi sempre non gestibile dalla stessa infrastruttura: basti pensare come esempio dover leggere in 2 mesi i dati inseriti negli ultimi 7 anni. Questo comporta tempi di migrazione lunghissimi, spesso non compatibili con le esigenze aziendali. Una soluzione può essere quella di espandere l’infrastruttura, ma raramente questo ha senso per un sistema che poi deve essere dismesso. Sempre grazie alla nostra tecnologia “offline” in grado di leggere i dati in modalità non-nativa, siamo in grado di migrare senza utilizzare la vostra infrastruttura. E parallelizzando il processo, questo consente di ridurre in maniera drastica i tempi totali di migrazione.
  • Il formato dei dati e/o dei documenti estratti non è compatibile con la nuova applicazione - In molti casi, le applicazioni COLD legacy utilizzano formati dei documenti o di metadati non compatibili con le moderne applicazioni, basate spesso su standard web quali PDF, XML e database quali Microsoft SQL Server o Oracle. Se richiesto, il nostro processo può includere un passaggio di conversione dei formati dati. Siamo in grado ad esempio di convertire i documenti dai formati AFP, TIFF, Kofax, etc. a PDF, mantenendo la massima fedeltà di visualizzazione. Allo stesso modo possiamo fornire i metadati nel formato più adatto all’importazione nella nuova applicazione.
  • Controllo qualità - Un ultimo aspetto spesso poco considerato nei progetti di migrazione è la verifica della qualità dei dati che arrivano nel sistema di destinazione. Come descritto in questo documento, gli aspetti critici durante un processo di migrazione sono molteplici, dalla lettura dei supporti che può presentare errori a livello hardware, all’estrazione dei metadati, alla conversione dei formati e delle base dati. Utilizzando una migrazione “manuale”, senza un motore di controllo, è molto difficile tracciare in modo puntuale gli eventuali errori che compaiono nei vari passi del processo.
    Il nostro processo è invece completamente controllato da un database che guida e traccia ogni elemento migrato. A fine migrazione siamo così in grado di verificare gli errori riscontrati, generare la relativa reportistica e se richiesto, effettuare ulteriori tentativi di recupero.

 

Conclusioni

L’avvento dell’archiviazione ottica e dei sistemi COLD (o ECM) ha portato alle aziende ed alle pubbliche amministrazioni grande efficienza nel gestire gli archivi documentali. Negli ultimi anni l’evoluzione tecnologica ha seguito un passo notevole proponendo sistemi sempre più prestanti, efficaci ed accessibili. Questo ha spesso però comportato l’impossibilità di spostare i dati archiviati tra le varie piattaforme acquisite ed implementate durante gli anni, con evidenti problemi di integrazione e un aumento dei costi totali di gestione. Inoltre, nei casi di piattaforme più vecchie, ci si trova in casi dove non è più possibile accedere ai dati archiviati, anche se questi sono ancora presenti sui supporti fisici. Infine, queste difficoltà possono mettere l’azienda a rischio di eventuali sanzioni per il mancato rispetto delle normative che regolano l’archiviazione digitale sostitutiva.

E’ quindi evidente come sia necessario trovare un modo per migrare i dati verso i moderni sistemi ECM, garantendo alta affidabilità, prestazioni e accessibilità agli archivi documentali, necessità sempre più richieste dalle modalità di accesso web e mobile.

La decisione non è quindi se migrare, ma quando. Con la consapevolezza che più si rimanda, più la complessità, i rischi e i costi totali di gestione aumentano, mentre esistono processi collaudati per effettuare migrazioni nel modo più efficiente e sicuro possibile.