Connect with us

L’IA sta costringendo un reset nell’osservabilità della rete

Leader di pensiero

L’IA sta costringendo un reset nell’osservabilità della rete

mm

Per anni, l’osservabilità della rete è stata una discussione sugli strumenti. Quale piattaforma raccoglie l’insieme più ampio di telemetria? Quale agente copre i miei dispositivi più oscuri? Quale architettura si eseguirà meglio in scala? In quali punti della rete dovremmo catturare i pacchetti? Quella conversazione presumeva che la rete fosse relativamente stabile e che il cambiamento fosse incrementale.

Non lo è più.

I carichi di lavoro guidati dall’IA stanno aumentando la variabilità del traffico, poiché l’adozione dell’IA si accelera in tutta l’azienda. Le ricerche recenti mostrano che il 88% delle organizzazioni utilizza ora l’IA in almeno una funzione aziendale. Le architetture ibride si estendono tra cloud, data center, WAN e edge. I segnali di sicurezza e prestazioni si sovrappongono ora in modi che non facevano cinque anni fa. E l’azienda si aspetta una risoluzione più rapida, meno interruzioni e una chiara responsabilità.

Sotto quella pressione, gli approcci attuali all’osservabilità della rete stanno fallendo. Non perché le squadre mancano di abilità, ma perché l’architettura sottostante all’osservabilità non ha tenuto il passo.

Non si tratta di aggiungere altri cruscotti o catturare più dati. Si tratta di riconoscere che l’osservabilità deve evolversi da una raccolta di strumenti in una fondazione di dati coerente. Quella fondazione è ciò che consentirà alle squadre di operazioni di rete (NetOps) di sfruttare l’IA per l’osservabilità e l’intelligenza della rete.

Ecco come pensare a dove sei e come andare avanti.

Dove sei sulla curva di maturità?

Le ricerche di Enterprise Management Associates (EMA) hanno mostrato che solo il 46% dei leader IT ritenevano di essere completamente soddisfatti degli strumenti di osservabilità della rete. La maggior parte delle lamentele sono ben note, con la sprawl degli strumenti, il rumore degli avvisi e la scarsa qualità dei dati che fanno la lista.

Il rapporto EMA del 2025, Network Observability Maturity Model: How to Plan for NetOps Excellence, ha anche identificato cinque distinti stadi di maturità:

  1. Ad Hoc e Reattivo
  2. Fragmentato e Opportunistico
  3. Integrato e Gestito Centralmente
  4. Intelligente e Automatizzato
  5. Ottimizzato e Guidato dall’IA

Oggi voglio concentrarmi sugli ultimi tre stadi, che è dove si troveranno la maggior parte delle organizzazioni, prima di descrivere il percorso per l’ultimo stadio.

Fragmentato e Opportunistico

Hai多pli strumenti di osservabilità. Spesso tre o quattro. La ricerca di settore riflette lo stesso modello, con l’87% delle squadre NetOps che ora si affidano a più strumenti di osservabilità, eppure solo il 29% degli avvisi che generano sono azionabili. La copertura esiste, ma è irregolare. Gli ingegneri agiscono come livello di integrazione, spostandosi tra console e correlando mentalmente gli eventi. L’IA può essere presente, ma opera all’interno di silos. Le squadre lavorano sodo in questo stadio, ma l’architettura lavora contro di loro.

Integrato e Gestito Centralmente

Hai raggiunto una forte copertura di monitoraggio in tutta l’infrastruttura e il traffico. C’è una certa integrazione tra i sistemi. I cruscotti sono standardizzati. Potresti avere un’automazione precoce per incidenti comuni.

Ma l’analisi della causa radice dipende ancora dalla cucitura manuale. Le informazioni predittive sono limitate. L’IA accelera l’analisi, ma non cambia fondamentalmente il modo in cui la rete è compresa.

Intelligente e automatizzato

La telemetria è in tempo reale dove conta. I dati di flusso, pacchetto e configurazione sono correlati. Gli avvisi sono contestuali, non guidati dalla soglia. L’IA supporta la rilevazione delle anomalie, la previsione della capacità e la remediation guidata. L’automazione è introdotta deliberatamente e all’interno dei limiti di policy. Solo le organizzazioni con risorse adeguate sono a questo stadio.

Un gruppo più piccolo di organizzazioni di classe mondiale ha raggiunto l’ultimo stadio di maturità, Ottimizzato e Guidato dall’IA. Gli strumenti da soli non ti aiuteranno a evolvere.

Da Intelligente e automatizzato a Ottimizzato e Guidato dall’IA: cosa fare dopo

La modernizzazione dell’osservabilità della rete non richiede di estirpare ciò che hai. Richiede un passaggio dagli strumenti ai dati.

1. Inizia con la coerenza dei dati, non con più IA

Prima di ampliare le iniziative dell’IA, chiediti una domanda: i nostri dati di rete sono puliti, coerenti e connessi tra i domini?

I formati di telemetria incoerenti, i punti ciechi nel cloud o nel SD-WAN, gli spazi IP duplicati e i record di inventario obsoleti minano i risultati dell’IA più di quanto la maggior parte dei dirigenti si renda conto. Se la telemetria non può essere affidabilmente collegata all’identità e al contesto dall’indirizzamento autoritativo, la correlazione rimane probabilistica piuttosto che definitiva.

È qui che i servizi di rete fondamentali contano. DNS, DHCP e gestione degli indirizzi IP (insieme noti come DDI) formano la mappa autoritativa della rete. Ogni dispositivo, carico di lavoro e connessione interseca con quel livello.

Quando la telemetria di osservabilità è arricchita con l’intelligenza di identità e indirizzamento autoritativa, l’analisi diventa fondata. L’IA può distinguere il comportamento previsto dall’anomalia vera con maggiore fiducia. L’analisi della causa radice avviene più velocemente. L’automazione diventa più sicura.

2. Riduci la sprawl degli strumenti attraverso un’integrazione profonda

La maggior parte delle aziende continuerà a operare più sistemi di osservabilità. Quello non è il principale problema. Il problema è l’integrazione superficiale.

Incorporare un cruscotto all’interno di un altro o condividere le esportazioni di dati di base non crea coerenza. Gli ambienti maturi integrano al livello dei dati. Coordinano la raccolta della telemetria, correlano gli avvisi tra i domini e abilitano i flussi di lavoro che attraversano gli strumenti piuttosto che rimanere intrappolati all’interno di essi.

Quando l’integrazione raggiunge quel livello, la consolidazione diventa razionale invece che politica. I sistemi ridondanti sono più facili da ritirare. La telemetria sovrapposta è più facile da razionalizzare. L’IA opera su un contesto unificato invece che su frammenti cuciti insieme.

3. Modernizza in fasi per evitare la disgregazione

La paura di destabilizzare gli ambienti legacy è legittima. Nessuno vuole rompere la produzione mentre si persegue la purezza architettonica. Un approccio fase riduce quel rischio.

Fase uno: Sovrapponi l’intelligenza

Flussi di telemetria in un livello di analisi condiviso. Arricchiscilo con contesto di identità e policy. Utilizza l’IA per la rilevazione e la raccomandazione, non per l’applicazione autonoma.

Fase due: Standardizza e razionalizza

Mentre la correlazione migliora e il rumore diminuisce, identifica gli strumenti ridondanti e ritira quelli che non possono partecipare all’architettura unificata.

Fase tre: Introduci l’automazione con limiti di policy

Inizia con scenari di automazione a basso rischio. Lascia che l’IA suggerisca la remediation prima di consentire l’esecuzione. Espandi gradualmente mentre la fiducia e la governance maturano.

Non si tratta di attivare un interruttore. Si tratta di aumentare la coerenza senza sacrificare la stabilità.

Il cambio strategico: passare a Ottimizzato e Guidato dall’IA

L’osservabilità non è più una raccolta di strumenti di monitoraggio. È un’infrastruttura di IA guidata di base che richiede una nuova base. Quando le organizzazioni ancorano l’osservabilità in un’architettura di dati unificata e in un’intelligenza di rete autoritativa, l’IA diventa anticipatoria.

Le analisi predittive si spostano dalla teoria alla pratica. Analizzando insieme la telemetria storica e in tempo reale, l’IA può identificare i primi segnali di stress di capacità, deriva di configurazione o comportamento anormale prima che si aggravino. Invece di correre a riparare gli outage, le squadre intervengono prima che gli utenti notino il degrado. Ciò è particolarmente significativo perché gli outage IT su larga scala possono costare alle organizzazioni fino a 2 milioni di dollari all’ora.

La pianificazione della capacità diventa dinamica invece che periodica. L’esaurimento delle risorse e la saturazione del servizio possono essere proiettati in anticipo, abilitando l’ottimizzazione proattiva invece della scalabilità reattiva.

Questo è ciò che si trova all’orizzonte.

Se i tuoi dati sono frammentati, l’IA li esporrà.

Se la tua fondazione è coerente, l’IA diventa un vantaggio.

La domanda non è se adotterai l’osservabilità e l’intelligenza guidate dall’IA. La domanda è se la tua architettura è pronta per essa.

Scott Fulton è Chief Product e Technology Officer di BlueCat e un veterano leader tecnologico aziendale con più di 20 anni di esperienza in infrastrutture cloud, DevOps e cybersecurity. In precedenza ha fondato la startup di osservabilità cloud OpsCruise, dove ha guidato lo sviluppo di tecnologie guidate da intelligenza artificiale utilizzate da organizzazioni Fortune 500.