L’incident management, o gestione degli incidenti, è un’area di processo di gestione dei servizi IT. Viene trattata in maniera esauriente nelle relative certificazioni internazionali come ITIL e ISO 20000. In genere viene gestita con un primo livello di help desk e un database di problemi noti, ma spesso è necessario un intervento di secondo livello.
La ISO 20000-1:2011 associa al concetto di incidente tre distinte possibilità: la riduzione della qualità di un servizio, l’interruzione non pianificata di un servizio o un evento che non ha ancora avuto impatto sul servizio al cliente.
Con “’incidente” si intende un problema inatteso che può verificarsi su di una rete o di un sistema.
Il primo obiettivo del Business Incident Management è sempre il ripristino della normale operatività del servizio il più rapidamente possibile, riducendo al minimo l’impatto sulle operazioni aziendali secondo il service level agreement (SLA) pattuito con il fornitore.
Quali sono gli obiettivi dell’Incident management
L’Incident Management si prefigge obiettivi specifici per garantire la continuità operativa e minimizzare le ripercussioni negative sugli utenti e sull’organizzazione. Questi i principali:
- Ripristino operativo rapido: priorità massima è data al tempestivo ripristino della funzionalità operativa, minimizzando l’impatto sulle attività aziendali e aderendo agli SLA stipulati;
- Risoluzione efficace degli incidenti: pronta identificazione e risoluzione di eventuali anomalie che influenzano reti o sistemi, salvaguardando l’integrità e l’efficienza operativa;
- Limitazione degli impatti negativi: ridurre al minimo le conseguenze avverse per gli utenti e per l’organizzazione, assicurando una gestione efficiente degli incidenti e la continuità dei servizi IT;
- Evoluzione e prevenzione: analisi approfondita degli incidenti per determinarne le cause e implementare misure preventive, incrementando sistematicamente la qualità del servizio erogato.
Esempi di Business Incident
Sono diversi gli scenari che possono essere classificati come incidenti aziendali, ciascuno con un impatto unico sulla continuità operativa e con necessità specifiche di intervento di Business Incident Management. Ecco alcuni esempi:
- Interruzioni del server: guasti hardware o software che causano il down di server critici, interrompendo servizi essenziali;
- Violazioni della sicurezza dei dati: attacchi informatici che compromettono dati sensibili, causando perdite economiche e danni alla reputazione;
- Errori di rete: problemi di connettività che impediscono l’accesso a risorse aziendali vitali;
- Problemi di software: malfunzionamenti o bug in applicazioni chiave che ostacolano i processi aziendali;
- Problemi di infrastruttura IT: guasti fisici o tecnici nelle infrastrutture IT che impediscono operazioni regolari.
Ognuna di queste problematiche richiede una risposta tempestiva e mirata per minimizzarne gli impatti negativi.
Il caso della network managed security
La gestione degli incidenti IT è solo una delle possibilità offerte in ambito di managed network security. Una semplice strutturazione della gestione di questa fase comprende, oltre all’IM, il monitoraggio, la configurazione e il tuning.
Molti dei parametri impiegati in queste fasi sono ovviamente gli stessi dell’incident management vero e proprio.
Gestione e supporto in situazioni critiche vanno affidate a un Security & Network Operation Center (SNOC) altamente specializzato e qualificato per la formulazione di una diagnosi affidabile. Oltre alla gestione dell’incidente sarà opportuno concordare la documentazione della diagnosi svolta.
Monitoraggio continuo
È il controllo proattivo dello stato di salute dei sistemi, resi idonei al controllo tramite piattaforme di monitoraggio dedicate e in tempo reale.
Configuration management
Una infrastruttura ha un parco di configurazioni piuttosto ampio, che spesso richiede una gestione specifica. L’esigenza diventa stringente se è ampia la variabilità delle modifiche alle configurazioni sia globali, sia locali per specifici gruppi di utenti.
Tuning continuo
L’infrastruttura è un corpo in continua modifica. Un controllo continuo orientato al suo tuning permette ottimizzazioni e migliorie che massimizzano la resa dell’investimento e lo rendono più resiliente ai problemi di sicurezza.
Tre pratiche di incident management
Che si rivolga al network o ad altre componenti, per ottenere i migliori risultati la gestione degli incidenti IT richiede pratiche da adottare. Un approccio corretto deve innanzitutto assicurare la gestione dell’incidente durante l’intero ciclo di vita. Deve poi operare quanto più possibile in modo automatico, agendo e comunicando in tempo reale.
Si possono poi identificare svariati modi di procedere che siano qualificabili come best practices. Ne proponiamo tre, solo apparentemente così di buon senso da essere sempre applicate: integrabilità, standard e priorità.
- Integrabilità: Software e procedure di incident management devono integrarsi agevolmente con tutti gli altri sistemi e processi coinvolti. Si pensi in particolare alle richieste del GDPR o degli altri apparati normativi in qualche modo attivi in altre aree del mondo (Giappone, California, Brasile). L’integrabilità permette di raggiungere facilmente il miglioramento continuo.
- Standardizzazione: Metodi e procedure devono garantire una gestione efficiente e tempestiva di tutti gli incidenti. È per questo che benché sia una convenzione, è comunque necessario che degli incidenti si occupi personale tecnico sì specializzato, ma con le opportune certificazioni.
- Prioritizzazione: Una serie di caratteristiche descrivono le proprietà di ogni incidente. Tra queste troviamo il sistema, il servizio, la posizione geografica, l’effetto all’interno o all’esterno del sistema. Valutando queste caratteristiche è possibile implementare un sistema di assegnazione delle priorità.
Vantaggi della gestione degli incidenti con Sorint
L’adozione dei servizi di incident management di Sorint si traduce in numerosi vantaggi per le aziende, enfatizzando l’efficacia e la resilienza operativa. I benefici chiave includono:
- Efficienza nel ripristino: Sorint assicura un recupero rapido delle operazioni, in linea con gli SLA aziendali, minimizzando l’interruzione delle attività;
- Gestione integrata degli incidenti: l’approccio di Sorint copre tutti gli aspetti dell’Incident management, dalla risoluzione tecnica alla gestione organizzativa, riducendo l’impatto complessivo sugli affari;
- Conformità ed esperienza: la conformità di Sorint con standard come ITIL e ISO 20000 garantisce una gestione degli incidenti allineata con le migliori pratiche internazionali;
- Soluzioni su misura: Sorint offre soluzioni flessibili, adattandosi alle specifiche esigenze aziendali e migliorando l’efficienza operativa;
Focus sul miglioramento continuo: oltre alla gestione degli incidenti, Sorint promuove l’evoluzione continua dei processi, incrementando la resilienza e l’affidabilità dei sistemi IT.