I file system di Linux, alcune considerazioni

Premessa

Siamo entrati in una nuova era dello storage digitale su hard disk, per la prima volta sono apparsi sul mercato dischi di capacità pari a 4TB a far fronte ad una crescita inarrestabile di informazioni in formato elettronico. Secondo un’analisi di Coughlin Associates saranno utilizzati più di 6 exabyte a scopo di archiviazione, conservazione e conversione di contenuti entro il 2012. Per intenderci, un exabyte equivale a un 1.000.000.000 di gigabyte in base decimale. Un altro modo per rendersi conto di questa capacità è visualizzarla in DVD: 1 exabyte = 250 milioni di DVD (assumento per semplicità una dimensione di 4GB a DVD). Sei exabyte equivalgono dunque all’incredibile quantità di 1,5 miliardi di DVD!

Ma anche i dati trasmessi sulle reti hanno ormai raggiunto cifre incredibili. In Italia, secondo dati Audiweb, nel mese di ottobre 2011 sono stati 27,3 milioni gli individui che si sono collegati almeno una volta ad Internet. In percentuale significa il 49,8% della popolazione e una crescita pari al 10,5% in un anno. Giornalmente, in media, navigano 13 milioni di persone. In generale, questa immensa mole di dati ci farà spostare dall’era dei Terabyte all’era degli Exabyte nel giro di pochi anni.

I problemi connessi con la gestione di grosse quantità di dati non sono cosa da poco. Ad esempio, per professionisti dell’IT una sfida importante consiste nel migliorare le performance di accesso ai file. Perché diciamo “migliorare”? Perché mantenere lo stato attuale non è o potrebbe non essere sufficiente. I grandi sistemi di storage memorizzano milioni o anche miliardi di file, è normale che anche il modo di accedere a questi file debba progredire. Quali opzioni sono allora disponibili per i file system, ossia per il sistema di archiviazione che definisce come i dati vengono scritti e letti? In caso di problemi capaci di determinare la perdita dei dati, quali sono le possibili soluzioni per il loro recupero?

Negli anni molti professionisti IT hanno scelto come sistema operativo Linux. Negli ambienti Linux sono disponibili diversi file system, questo da un lato offre maggiore flessibilità ma a volte può rendere più complessa la scelta di quale adottare.

Un approfondimento

In passato non esistevano molte possibilità di scelta ma nel corso del tempo i programmatori hanno contribuito allo sviluppo di nuovi file system per Linux che ora offre una varietà di opzioni per l’organizzazione e la gestione dei file su disco. Il file system con Linux sono intercambiabili by design, questo è una caratteristica della portabilità del sistema operativo (Virtual File System o VFS all’interno del kernel Linux ossia il cuore del sistema operativo). Ci sono diverse discussioni nelle comunità Linux riguardo gli aspetti positivi e negativi di ciascun file system. La tabella seguente mostra, senza un ordine particolare, le scelte base per il file system di un sistema operativo Linux:

  • Second Extended File System (EXT2)
  • Third Extended File System (EXT3)
  • File System for Silicon Graphics’ IRIX operating system (XFS)
  • Journaling File System for IBM’s AIX operating system (JFS)
  • Journaling File System, 64bit file system for IBM’s AIX operating system (JFS2)
  • Journaling File System from NameSys (ReiserFS)
     

Esistono dunque molte varianti per workstation e server Linux. Da dove iniziare?

La miglior risposta a questa domanda è fare dei test. L’obiettivo è quello di determinare le performance e l’affidabilità di ciascun file system. Esistono delle applicazioni in grado di effettuare dei benchmark e altre che simulano ambienti che operano con un elevato volume di file. Un ulteriore test riguarda la simulazione di problemi all’alimentazione elettrica o di errato spegnimento: quanto tempo impiega il volume per tornare nuovamente disponibile (“mount”)? Quanto tempo impiega il check del file system (FSCK) per analizzarne lo stato? È anche possibile testare l’integrità dei dati, a questo scopo si può utilizzare un generatore di hash MD5 su alcuni file, eseguire il test sopra e quindi verificare che i file non abbiano subito una corruzione interna.

Infine, poiché durante il salvataggio i dati vengono frammentati, un banchmark su file di grandi dimensioni può aiutare a determinare quale file system risponde meglio alle proprie esigenze. E’ chiaro che i test vanno a verificare situazioni estreme che l’utente o il sistema potranno anche non raggiungere mai. Tuttavia per effettuare una scelta il più possibile consapevole le indicazioni provenienti dalla varie prove possono rappresentare un valido aiuto.

Recupero dei dati da file system Linux

Forse molti utenti non sanno che in realtà stanno già utilizzando dei file system Linux. Ad esempio, un NAS (Network Attached Storage) per la casa o per l’ufficio potrebbe avere una versione di Linux al suo interno per il funzionamento.

La proliferazione dei file system Linux è dovuta alla natura open-source e ad una licenza detta GPL (General Public License) che accompagna questi progetti. Nessun individuo o azienda ne è proprietaria perciò lo sviluppo e i miglioramenti sono in teoria senza limiti.

Sarebbe però errato pensare che un sistema operativo Linux non sia soggetto a perdita dei dati: guasto o malfunzionamento hardware oppure la corruzione dei dati può rendere inaccessibili i file. Quando ciò si verifica, il modo più sicuro per tornare in possesso dei dati è rivolgersi a Kroll Ontrack.

Kroll Ontrack da oltre 30 anni è leader mondiale nel settore data recovery e in Italia è l’unica azienda a possedere una camera bianca professionale per il recupero dei dati. Possiamo mettere ai disposizione dei clienti tutta l’esperienza maturata a livello internazionale e tool proprietari appositamente sviluppati per le esigenze di recupero da file system Unix/Linux. Con più di 50.000 casi gestiti ogni anno e oltre il 90% delle situazioni risolte positivamente, Kroll Ontrack è la miglior scelta possibile per un recupero dati di successo anche in ambiente Linux.