Connect with us

Il momento dell’NOC Agentic è adesso

Leader di pensiero

Il momento dell’NOC Agentic è adesso

mm

La rete moderna non assomiglia più a quella di pochi anni fa, dopo il passaggio al lavoro remoto e a un’era di rapida adozione di AI e SaaS. Ciò che un tempo era centralizzato e relativamente prevedibile è ora una complessa rete di piattaforme cloud, dispositivi edge, uffici branch e internet domestico, nonché sistemi on-premises.

I tradizionali Network Operations Center (NOC) non erano stati progettati per questo. La maggior parte degli strumenti di monitoraggio richiede ancora la correlazione manuale dei dati tra sistemi diversi, rendendo più difficile mantenere la visibilità e sommergendo gli ingegneri con un’infinita ondata di avvisi contraddittori quando devono prendere decisioni e risolvere problemi rapidamente.

I fornitori di servizi e le squadre IT aziendali operano in un ambiente simile. I margini sono stretti e le squadre sono più sottili, ma gli standard per i cicli di acquisizione dei clienti non sono cambiati. Quando ci vogliono otto o dieci mesi prima che un contratto diventi redditizio, le poste in gioco intorno al mantenimento e all’esperienza del cliente di alta qualità sono elevate.

Nel complesso, il palco è perfettamente allestito per l’NOC agentic.

Costruire l’NOC Agentic

Secondo Gartner, anche se solo il 17% delle organizzazioni attualmente distribuisce AI agentic, il 60% prevede di farlo entro i prossimi due anni. Ciò continua una curva di adozione aggressiva dal momento in cui la tecnologia ha iniziato a guadagnare trazione per la sua capacità di ragionare attivamente sui dati, non solo automatizzare passivamente compiti definiti.

Per il NOC, l’AI agentic è la differenza tra frammentazione o frustrazione, tempi di risoluzione più rapidi, interruzioni ridotte e una comprensione più completa dell’ambiente. Tuttavia, perché questi vantaggi si concretizzino, l’NOC agentic deve essere ancorato alla collaborazione tra l’AI e gli operatori umani. La velocità non è mai più importante dell’accuratezza e dell’affidabilità, quindi quando l’AI può migliorare il triage, l’analisi della causa radice e alla fine raccomandare azioni, il giudizio umano è ancora essenziale per quell’ultimo bit di convalida.

L’NOC agentic è anche definito da dati ben strutturati. Un inventario preciso, convenzioni di denominazione coerenti e una visibilità a livello di rete nel traffico, routing e prestazioni dipingono un quadro di ciò che sta attualmente accadendo, come la rete dovrebbe comportarsi e come i problemi sono stati risolti in precedenza. Senza questa visione, qualsiasi analisi sarà incompleta e gli operatori non possono automatizzare ciò che non possono vedere o capire.

La cattura della conoscenza tribale rientra anche in questo ombrello.

La risorsa più grande del NOC sono i cervelli dei suoi ingegneri. La combinazione di esperienza e intuizione che deriva da anni di diagnosi e risoluzione di problemi di rete è qualcosa che nemmeno il modello di AI più avanzato può replicare senza aiuto. È per questo che questa conoscenza tribale deve essere documentata e tradotta in un formato che possa essere ingerito e riutilizzato. Anche i runbook raffinati e i loop di apprendimento centralizzati hanno un ruolo da svolgere, fornendo una base per il comportamento umano e macchina per identificare più efficacemente le aree di miglioramento.

I Vantaggi Reali

I problemi di IT e di rete sono stati alla base del 23% delle interruzioni più impattanti nel 2024. La stessa analisi ha rilevato che nel corso degli ultimi tre anni, quasi il 40% delle organizzazioni ha subito un’interruzione importante a causa di errori umani. Questo tasso di interruzioni non è sostenibile da nessuna prospettiva, aziendale, ingegneristica o dei consumatori. Tuttavia, esemplifica esattamente perché l’NOC agentic è così cruciale.

La promessa dell’NOC agentic non è l’autonomia per se stessa, ma operazioni più rapide e più sicure, costruite su una base di visibilità reale della rete. Quando un problema colpisce la rete, il più grande ritardo spesso non è la rilevazione, ma la comprensione di ciò che è cambiato, cosa è stato interessato e cosa fare dopo. I sistemi agentic aiutano a comprimere questo cronogramma, partendo dall’analisi accelerata della causa radice.

La differenza tra l’identificazione della causa radice di un problema in pochi minuti rispetto a ore o addirittura giorni è massiccia. Il costo medio di un solo ora di downtime di rete può superare i 300.000 dollari per le imprese di medie e grandi dimensioni. In realtà, il 41% segnala costi di downtime orari che vanno da 1 milione a oltre 5 milioni di dollari secondo una recente ricerca di ITIC.

Eppure, la realtà è spesso più vicina alla seconda quando gli operatori sono chiamati a setacciare manualmente i dati. D’altra parte, gli strumenti di AI agentic possono portare alla superficie le cause potenziali e i servizi interessati e raccomandare i passaggi successivi in pochi secondi. Quando le poste in gioco finanziarie sono così elevate, un’analisi della causa radice più rapida e una rimozione più sicura sono diventate un assoluto must-have.

Oltre a migliorare i compiti tattici, l’NOC agentic agisce come facilitatore per la condivisione di conoscenze – combinando l’esperienza degli ingegneri di tutta l’organizzazione in una risorsa condivisa. A lungo termine, questo processo crea un ciclo di apprendimento continuo in cui i successi e le sfide di ogni incidente servono a informare e raffinare le raccomandazioni dell’AI quando si verificano nuovi incidenti.

Ad esempio, supponiamo che un’azienda abbia a che fare con persistenti problemi di prestazioni di rete e decida di implementare un nuovo dispositivo per cercare di migliorare l’efficienza, ma l’aggiornamento richiede una modifica della configurazione. Nel processo, qualcosa va storto e scatena un’interruzione. Nell’era dell’NOC agentic, un sistema di AI potrebbe correlare telemetria, topologia, stato del dispositivo e modifiche recenti, puntando infine l’operatore verso la probabile causa radice in una frazione del tempo. L’impatto positivo dei sistemi agentic sulle operazioni di rete è chiaro e i dati lo supportano.

McKinsey ha recentemente scoperto che la risoluzione autonoma dei problemi e la riparazione nelle operazioni di rete hanno ridotto i biglietti di risoluzione dei problemi totali fino al 70%, insieme ai costi operativi del 55-80%, migliorando anche il tempo di riparazione del 30-40%.

Sfide da Cui Guardarsi

Uno degli errori più comuni che le organizzazioni commettono è quello di lanciarsi a capofitto nell’AI senza stabilire le necessarie fondamenta. La maggior parte (70%) dei lavoratori è ansiosa per i benefici dell’AI secondo KPMG, ma senza dati affidabili e processi ben documentati, il valore di questi sistemi soffre.

Invece, l’AI dovrebbe essere introdotta gradualmente. Costruire un NOC agentic è un viaggio. Alla fine, i sistemi dovrebbero iniziare a possedere casi d’uso più avanzati e proattivi, come la rilevazione di modelli in picchi di temperatura o l’identificazione di tendenze nel riavvio dei dispositivi – entrambi possono essere segnali di un’interruzione imminente. All’inizio, tuttavia, concentrarsi su compiti più piccoli come l’assistenza alla diagnostica lascia spazio perché i sistemi imparino e migliorino.

Un altro errore è pensare che ogni azione possa trarre beneficio dall’automazione. Una buona regola empirica è che, quando un essere umano risolve lo stesso problema ripetutamente, quel compito è un buon candidato per l’automazione. Questo approccio graduale può anche aiutare a costruire fiducia e fiducia.

Da febbraio 2025, la fiducia nell’AI tra i dipendenti statunitensi è scesa del 33% secondo Deloitte, mentre l’Indice di fiducia nell’AI di McKinsey del 2026 ha scoperto che le inesattezze di output sono ancora la principale preoccupazione per l’AI per la maggior parte delle aziende statunitensi (74%), seguite solo da problemi di sicurezza informatica (72%). Ricordate il rapporto KPMG che ha scoperto che i lavoratori statunitensi sono ansiosi di abbracciare l’AI? Il rapporto ha anche scoperto che solo il 41% è disposto a fidarsi.

Andare avanti con l’esitazione dell’AI si riduce a governance e spiegabilità. Le barriere operative chiare e le prove di audit forniscono agli ingegneri una chiara comprensione di come un agente di AI abbia raggiunto la raccomandazione finale, nonché i meccanismi per intercettare e affrontare gli errori prima che possano causare danni lungo la strada. La fiducia, la governance e la convalida umana sono ciò che separa le operazioni agentic utili dall’automazione rischiosa, ed è per questo che l’obiettivo del NOC agentic non dovrebbe mai essere quello di rimuovere la supervisione umana, ma migliorarla.

La rete moderna chiede molto agli operatori di oggi. Per stare al passo, lo sforzo umano deve spostarsi lontano dalla triage ripetitiva e verso la politica, la convalida, la governance e i casi nuovi o ad alto rischio. L’AI agentic aiuta a rendere possibile questo spostamento, identificando e affrontando i problemi in anticipo, condividendo più efficacemente le conoscenze tra i team e rendendo la decisione più coerente. L’evoluzione e il miglioramento continuo di come la rete viene monitorata e mantenuta sono radicati nell’AI agentic.

Alex Cruz Farmer ha quasi 20 anni di esperienza nella costruzione e nel scaling di piattaforme SaaS e infrastrutture dalla fase iniziale alla IPO e all'acquisizione. In precedenza, ha ricoperto ruoli di leadership nel settore produttivo in Cloudflare e Cisco ThousandEyes, guidando la crescita dei ricavi, nuovi prodotti e capacità guidate dall'AI, e ora guida il prodotto in Kentik attraverso l'intelligenza della rete e le soluzioni per i fornitori di servizi.