Tecnologie per lo storage su larga scala

I sistemi di storage sono diventati - all’interno del più ampio contesto informatico - un settore complesso e spesso questo termine può significare cose diverse per persone diverse. Qual è allora la corretta definizione? Uno storage system è, molto semplicemente, un hardware che memorizza i dati.

Ad esempio, un sistema di storage può essere un server di piccole dimensioni che supporta un ufficio con 10 o meno utenti. In questo caso lo storage è rappresentato dagli hard disk drive interni al server che archiviano le informazioni. In ambienti business di più ampie dimensioni, un sistema di storage può essere rappresentato da un armadio SAN pieno di dischi, dove lo spazio per la memorizzazione dei dati è stato organizzato per fornire ridondanza e migliori prestazioni.

Tecnologia in evoluzione

Le tecnologie di storage di oggi comprendono vari tipi di supporti di memorizzazione ma nel corso degli ultimi anni, i sistemi SAN e NAS hanno fornito un'eccellente affidabilità. Qual è la differenza tra i due?

  • SAN (Storage Area Network), si tratta generalmente di grandi armadi, alcuni con all’interno ben 240 hard disk! Questi grandi sistemi di storage - anche di oltre 50 Terabyte - sono molto più di centinaia di hard disk accesi. Questi sistemi sono data warehouse incredibilmente potenti che hanno utility software versatili, in grado di gestire array multipli, varie configurazioni di storage e di fornire un costante monitoraggio del sistema.
  • NAS (Network Attached Storage), sono unità dotate di un proprio sistema operativo e file system. Queste unità sono disponibili in diverse capacità per adattarsi alla maggior parte bisogni e operare come file server

Per diverso tempo, i sistemi di archiviazione su larga scala sono stati fuori portata delle piccole imprese. I dischi Serial ATA (SATA) per i sistemi SAN rappresentano invece un modo economico di fornire una grande quantità di spazio di archiviazione. Questi array possono anche diventare sistemi virtuali di backup su nastro - letteralmente array RAID che vengono presentati come tape, eliminando però completamente il nastro.

Altre tecnologie di storage come iSCSI, DAS (Direct Attached Storage), storage Near-Line (es. un robot che preleva il supporto dati e lo inserisce in un lettore) e CAS (Content Storage Attached) sono tutti metodi per fornire l’accesso ai dati. In materia di sicurezza, gli esperti sanno bene che avere un backup non è sufficiente. Negli ambienti di oggi che utilizzano in modo massiccio informazioni in formato elettronico una normale notte di backup incrementale o un full backup settimanale diventano obsoleti in ore o addirittura in alcuni minuti dopo la creazione. Nei grandi ambienti di data warehouse, il backup di dati che si modificano in continuazione non è nemmeno considerato. L'unico metodo per questi sistemi è quello di avere uno storage in mirror ossia un server letteralmente identico con lo stesso spazio di archiviazione.

È possibile identificare il migliore sistema di storage? I più staranno pensando che il sistema migliore è quello che non subisce guasti o malfunzionamenti - il che è vero sia per gli utenti che per gli amministratori - ma la dura verità ci dice che i disastri accadono ogni giorno, nonostante l'attuazione di politiche e piani volti a limitare il rischio della perdita dei dati.

Nel rivedere le esigenze di storage è bene considerare queste domande:

  • Qual è il tempo di recupero dei dati? Qual è il tempo massimo che il cliente può attendere per riavere indietro i propri dati? In altre parole, per quanto tempo il cliente può “sopravvivere” senza le informazioni?
  • Qualità dei dati ripristinati. Si richiede il restore dei dati più recenti oppure è sufficiente il restore di un backup di vecchi dati? Se i dati nel sistema cambiano di frequente allora ad avere più valore sono le informazioni più recenti.
  • Quanti dati vengono archiviati? Il restore di molti dati attraverso la rete richiede tempo. Sulle configurazioni DAS (Direct Attached Storage) il tempo del restore dipenderà dal tipo di hardware e dalle sue performance di Input/Output.

Schemi unici per la protezione dei dati

I produttori di sistemi di storage adottano spesso schemi proprietari per l’organizzazione dei dati. Alcune unità SAN di grandi dimensioni incorporano una complessa organizzazione block-level del dispositivo, essenzialmente creando un file system di basso livello dal punto di vista RAID. Altre SAN hanno al loro interno un block-level transaction log in modo che il processore per il controllo della SAN sia in grado di tenere traccia dei block-level scritti sui singoli dischi. Utilizzando questo transaction-log, la SAN può riprendersi da shutdown o problemi di alimentazione inaspettati.

Alcuni esperti informatici stanno proponendo di aggiungere funzionalità intelligenti alla scheda controller RAID. Questa tecnologia potrebbe fornire maggiori possibilità di recupero in caso di disastro, con l'obiettivo di creare un dispositivo di storage in grado di “auto-ripararsi”. Altre idee in questo senso sono quelle di avere a disposizione sistemi di storage eterogenei indipendenti da uno specifico file system. Nelle organizzazioni dove vi sono hardware e piattaforme differenti, un file system completamente trasparente fornisce l’accesso ai dati indipendentemente dal sistema che li ha scritti. Altri scienziati informatici stanno approcciando la ridondanza in modo diverso. Il concetto di RAID è in uso su un vasto numero di sistemi, ma gli informatici e gli ingegneri sono alla ricerca di nuovi modi per fornire una migliore protezione dei dati in caso di guasto. Gli obiettivi che guidano questo tipo di sviluppo sono protezione dei dati e ridondanza senza sacrificare le prestazioni.

Evitare gli errori

Ci sono diversi metodi per ridurre o eliminare l'impatto di un guasto in un sistema di storage. Forse non si può impedire che un disastro accada ma si può minimizzare l'interruzione del servizio che ne consegue.

Ci sono molti modi per aggiungere ridondanza ad un sistema di storage primario. Alcune delle opzioni possono essere molto costose e solo le grandi imprese possono sostenere l'investimento. Queste possibilità includono sistemi di storage duplicati o server identici, noti come mirror site. Inoltre, utilizzare degli snapshot (istantanee) del file system con un checkpoint per il restore fornisce un altro livello per la protezione dei dati.

L’esperienza dimostra infatti che quando si verifica un disastro generalmente si manifestano più problemi. É quindi opportuno avere a disposizione più livelli di restore. Kroll Ontrack è a conoscenza di diverse situazioni iniziate con un problema su di un dispositivo di storage e poi trasformatesi in vere e proprie calamità per i dati. Spesso, gli sforzi che vengono fatti dai clienti per riportare il sistema al suo funzionamento comportano delle scelte che possono determinare la corruzione permanente dei dati. Seguono alcune indicazioni per ridurre i rischi e che possono essere adottate per ridurre al minimo la perdita dei dati quando si verifica un imprevisto:

Storage System off-line: evitare di forzare un array o un drive a tornare on-line. Generalmente ci sono dei validi motivi sulla base dei quali il controller disabilita un drive o un array, forzare il dispositivo a tornare on-line può esporre il volume alla corruzione del file system.
Rebuild di un drive guasto: quando si effettua il rebuild di un singolo drive non funzionante è importante permettere al controller di terminare l’operazione. Se un secondo drive si guasta o va off-line durante il processo è bene fermarsi e rivolgersi ad un fornitore di recupero dati professionale. Durante un rebuild, sostituire un secondo drive danneggiato comporta la modifica dei dati sugli altri drive.
Architettura del sistema di storage: pianificare la configurazione del sistema di storage con attenzione. Abbiamo visto più casi con configurazioni di diverso tipo su un singolo storage array. Ad esempio, 3 array RAID 5 (ciascuno con 6 drive) in configurazione RAID 0 (stripe) e poi messi in concatenazione (span). È importante mantenere una configurazione semplice e documentarne ogni aspetto.
Problemi a seguito della mancanza di alimentazione elettrica: se il problema viene scalato al supporto tecnico dell’OEM, chiedere sempre se l’integrità dei dati è a rischio o, per qualunque operazione, se questa danneggerà in qualche modo i dati. Se i tecnici rispondono che i dati potrebbero essere a rischio coinvolgere subito un fornitore professionale di recupero dati.
Kroll Ontrack con oltre 30 anni di esperienza internazionale nel settore data recovery, camere bianche professionali, centinaia di strumenti hardware e software proprietari e tecnici altamente specializzati è il partner tecologico di riferimento per risolvere con successo qualsiasi tipo di perdita dei dati da qualunque dispositivo di storage, fino ai casi più critici e complessi.