Un piano d’attacco per evitare il blocco dell’attività

DataStorage

Quando i sistemi si fermano e i dati non sono più disponibili per una società
sono problemi e costi elevati, ecco perché un buon piano di disaster recovery
risulta fondamentale per qualsiasi azienda

Gli argomenti sviluppati nel corso dell’articolo si basano su alcune considerazioni ed esperienze descritte da Kailash Jayaswal (Campbell, CA), attuale project manager per Cisco Systems, Kailash Jayaswal può vantare più di 18 anni di esperienza tecnica come amministratore di sistemi storage per grandi compagnie, tra le quali Roche Bioscience, Ibm, Siebel, e ovviamente, Cisco Systems. L’esperienza di Kailash Jayaswal si è sviluppata su sistemi storage dei principali produttori, come per esempio Sun, Emc, Ibm, Veritas, Intel, Microsoft, Network Appliance, e Hewlett-Packard. Insomma, si tratta indubbiamente di uno degli interlocutori più quotati a parlare di gestione storage e dei problemi connessi a questa attività.

Una premessa

Prima di approndire l’argomento del downtime in ambito storage occorre definire con precisione il concetto di infrastruttura IT che si andrà a considerare. Normalmente, in ambito informatico l’infrastruttura identifica l’insieme fisico dei componenti hardware utilizzati per interconnettere computer e utenti. In questa interpretazione sono quindi compresi tutti i componenti che permettono di stabilire i percorsi di connessione tra tutti gli elementi della rete, compresi: i server, i sistemi storage, i cavi, i dispositivi wireless, le antenne, i router e gli switch. Estendendo il concetto, in alcuni casi il termine infrastruttura include anche il software utilizzato per archiviare, gestire, inviare e ricevere i dati e i segnali che vengono trasmessi attraverso la rete. Infine, in alcuni contesti con il termine infrastruttura si intende definire solo l’hardware e il software d’interconnessione, escludendo quindi i computer e i dispositivi utente. In ogni caso, ai fini di quanto andremo a discutere nel corso dell’articolo, con il termine infrastruttura intenderemo definire qualsiasi elemento necessario a generare, supportare e garantire il trasporto delle informazioni, compresi quindi gli utenti e i sistemi da loro utilizzati.

Tempi legittimi

Un concetto base da assimilare immediatamente è che, per quanto ci si prodighi, sarà comunque impossibile eliminare completamente le possibilità di un downtime. Preso quindi atto della dura realtà, resta da definire quali possono essere considerati tempi accettabili per un ?interruzione della disponibilità dei dati e dei servizi erogati e supportati dall’infrastruttura IT aziendale. Iniziamo quindi a definire meglio il concetto di ?Disponibilità’. Con questo termine solitamente si tende ad indicare la porzione di tempo durante il quale un’applicazione o un servizio è raggiungibile e utilizzabile dagli utenti interni e/o esterni all’infrastruttura, per l’esecuzione di attività produttive. L’interruzione della disponibilità è solitamente generata da un ?Downtime’ o analogamente, dall’indisponibilità di qualcuno degli elementi necessari al corretto funzionamento dell’infrastruttura IT aziendale, che di fatto impediscono l’accesso e l’utilizzo dei dati. Partendo quindi dalla certezza di non poter escludere la possibilità di un downtime, resta da definire quale livello di disponibilità può essere ritenuto accettabile per la propria realtà aziendale e per i servizi erogati. Come in tutte le cose è quindi necessario raggiungere un compromesso. In questo caso, il punto chiave è quello di determinare il giusto equilibrio tra i costi connessi a un possibile downtime e quelli necessari a garantire il livello di disponibilità desiderato. Ecco quindi che i tempi di downtime considerati accettabili variano notevolmente da una realtà aziendale all’altra, e devono essere calcolati accuratamente per evitare che le spese necessarie a garantire i livelli di disponibilità scelti non si rivelino eccessivi rispetto ai reali costi generati da un downtime dei servizi storage e non solo.

Cause programmate o impreviste

Le cause di un’interruzione dei servizi possono essere veramente molte. Kailash Jayaswal indica una percentuale di circa l’80% delle ?interruzioni non programmate’ imputabile ad errori umani o dei processi, mentre il restante 20% lo attribuisce a errori (guasti) dei prodotti. Da evidenziare l’importante concetto delle ?interruzioni non programmate’. Kailash Jayaswa tende infatti a precisare che i downtime non sono generati solamente da eventi imponderabili, ma in molti casi si rendono necessari a causa di attività programmate e necessarie al mantenimento dei livelli di servizio dell’intera infrastruttura IT. Di seguito una breve rassegna delle principali cause di interruzioni dei servizi storage programmate e non:

Principali cause di downtime programmati – Backup – Sostituzioni o aggiornamenti di componenti hardware – Aggiornamenti software o delle applicazioni – Manutenzioni software o cambi di configurazione – Aggiornamenti del sistema operativo – Installazioni di Patch

Principali cause di downtime imprevisti – Errore umano – Application failure – Errori del sistema operativo – Guasti hardware come per esempio dischi, CPU o memorie – Incompatibilità/conflitti tra parametri delle applicazioni

Conclusioni

I problemi di downtime per I servizi di un’infrastruttura IT sono molto simili a quelli che si vivono in ambito sicurezza. Le cause che possono rendere indisponibili i servizi di rete e storage sono molteplici e si dividono tra interruzioni programmate dei servizi, generate da esigenze di aggiornamento e manutenzione, e quelle impreviste generate normalmente da guasti hardware/software. Come in ambito sicurezza anche in questo caso è necessario calcolare esattamente quali sono le richieste minime di disponibilità necessarie alla propria realtà aziendale, implementando le soluzioni minime necessarie a garantire i livelli di disponibilità individuati e dal costo proporzionato ai danni economici che si andrebbero a subire in caso di downtime.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore