Interviste
Manuel Romero, Co-Fondatore e Chief Scientific Officer di Maisa – Serie di Interviste

Manuel Romero, Co-Fondatore e Chief Scientific Officer di Maisa, è un ricercatore e ingegnere di intelligenza artificiale focalizzato sullo sviluppo di sistemi di intelligenza artificiale affidabili e di livello aziendale. Ha co-fondato Maisa nel 2024 per creare un’intelligenza artificiale responsabile in grado di eseguire processi aziendali complessi con trasparenza e controllo. Prima di Maisa, Romero ha ricoperto ruoli di ingegneria e apprendimento automatico di alto livello in aziende come Clibrain e Narrativa, dove si è specializzato nell’elaborazione del linguaggio naturale e nei sistemi di intelligenza artificiale su larga scala. All’inizio della sua carriera ha lavorato come ingegnere software full-stack e specialista DevOps prima di passare alla ricerca e sviluppo avanzato di intelligenza artificiale, diventando un contributore attivo all’ecosistema open-source di intelligenza artificiale.
Maisa AI sviluppa “lavoratori digitali” autonomi, agenti di intelligenza artificiale progettati per automatizzare flussi di lavoro aziendali complessi mantenendo tracciabilità, governance e affidabilità. La piattaforma consente alle organizzazioni di creare e distribuire agenti di intelligenza artificiale utilizzando il linguaggio naturale, abilitando l’automazione attraverso sistemi e fonti di dati interni senza una codifica estensiva. Concentrandosi sulla ragione verificabile e sull’esecuzione strutturata, Maisa mira a superare le limitazioni comuni associate ai sistemi di intelligenza artificiale generativa e aiuta le aziende a distribuire in modo sicuro intelligenza artificiale autonoma su larga scala.
Ha spesso focalizzato l’attenzione sulla comprensione del “perché” più profondo dietro i sistemi di intelligenza artificiale. Dal punto di vista tecnico, cosa l’ha spinta a co-fondare Maisa nel 2024 e quale lacuna nell’architettura di intelligenza artificiale aziendale credeva non fosse stata affrontata?
La motivazione alla base della fondazione di Maisa è derivata dalla consapevolezza che la maggior parte degli stack di intelligenza artificiale aziendale era stata costruita intorno a modelli, non a sistemi.
Durante il boom dell’intelligenza artificiale generativa, molte aziende si sono concentrate sull’integrazione di grandi modelli di linguaggio nei flussi di lavoro esistenti. Tuttavia, questi sistemi erano spesso fragili, opachi e difficili da operare su larga scala. Mancavano di:
- esecuzione deterministica dove contava.
- forte osservabilità, tracciabilità
- riproducibilità
La lacuna che abbiamo visto è stata l’assenza di vera infrastruttura di intelligenza artificiale per le aziende. Le aziende stavano costruendo applicazioni intorno agli API dei modelli di linguaggio, ma mancavano di qualcosa di equivalente a un’architettura di computer per il lavoro della conoscenza.
Maisa è stata creata per colmare quella lacuna progettando un’architettura centrata sull’Unità di Elaborazione della Conoscenza (KPU), un sistema che consente all’intelligenza artificiale di operare in modo affidabile all’interno dei flussi di lavoro aziendali reali.
Ha lavorato su elaborazione avanzata del linguaggio naturale e sistemi generativi prima di fondare Maisa. Come quelle esperienze hanno influenzato le scelte architettoniche della piattaforma?
La mia esperienza lavorativa nell’elaborazione del linguaggio naturale e nella generazione, in particolare nella formazione e pre-formazione di modelli di linguaggio e successivamente di grandi modelli di linguaggio (centinaia di essi), ha reso chiaro qualcosa quando ho cercato di costruire sistemi reali su di essi. L’architettura del trasformatore è estremamente potente, ma viene con almeno tre limitazioni fondamentali che devono essere affrontate per utilizzarla in modo affidabile nella produzione.
Il primo è l’allucinazione. Questi modelli generano testo in modo probabilistico e possono produrre output che suonano corretti ma non sono radicati in informazioni verificate.
Il secondo è la limitazione del contesto. Anche con finestre di contesto più ampie, i modelli operano all’interno di uno spazio di token limitato, il che rende difficile ragionare su grandi o complessi corpi di conoscenza.
Il terzo è l’informazione aggiornata. I modelli pre-addestrati rappresentano uno snapshot della conoscenza al momento dell’addestramento, mentre gli ambienti aziendali richiedono sistemi che possano ragionare su informazioni costantemente in evoluzione.
Riconoscendo queste limitazioni ha plasmato molte delle scelte architettoniche dietro Maisa. Invece di affidarsi solo al modello, ci siamo concentrati sulla costruzione di un sistema che fornisce accesso strutturato alla conoscenza, meccanismi di convalida e esecuzione controllata in modo che l’intelligenza artificiale possa operare in modo affidabile all’interno dei flussi di lavoro aziendali reali.
Molte aziende sperimentano con l’intelligenza artificiale generativa ma lottano per andare oltre i piloti. Dal punto di vista della progettazione dei sistemi, qual è la ragione principale per cui il scaling fallisce in così tante organizzazioni?
Molte aziende lottano per andare oltre i piloti di intelligenza artificiale generativa perché la maggior parte dei dispiegamenti è costruita come esperimenti piuttosto che come sistemi robusti. I primi prototipi spesso si affidano all’ingegneria dei prompt, all’orchestrazione leggera e ai pipeline di recupero semplici, che possono dimostrare valore ma non forniscono l’affidabilità, l’osservabilità o il controllo richiesto per gli ambienti di produzione. Quando le organizzazioni cercano di scalare questi sistemi, incontrano problemi come output inconsistenti, mancanza di tracciabilità, difficoltà nell’integrarsi con i flussi di lavoro aziendali e limitata governance su come l’intelligenza artificiale si comporta. In sostanza, il problema è che i grandi modelli di linguaggio sono generatori probabilistici, mentre i processi aziendali richiedono comportamento prevedibile e verificabile. Senza un’architettura che aggiunga struttura intorno alla ragione, alla convalida, all’esecuzione e al monitoraggio, i sistemi di intelligenza artificiale generativa rimangono difficili da scalare oltre i casi d’uso isolati.
I Lavoratori Digitali di Maisa sono progettati per essere verificabili e strutturati piuttosto che puramente probabilistici. Cosa significa ciò in termini pratici per le aziende che valutano l’intelligenza artificiale per l’uso in produzione?
Quando diciamo che i Lavoratori Digitali di Maisa sono verificabili e strutturati piuttosto che puramente probabilistici, intendiamo che l’intelligenza artificiale opera all’interno di un sistema controllato dove le sue azioni e il suo ragionamento possono essere tracciati e governati. Invece di permettere a un modello di generare liberamente output e decisioni, il sistema struttura come l’intelligenza artificiale interagisce con i dati, gli strumenti e i flussi di lavoro. Ogni passaggio nel processo può essere registrato, ispezionato e convalidato, e le azioni vengono eseguite attraverso interfacce definite piuttosto che direttamente dal output del modello. Per le aziende, ciò significa che i sistemi di intelligenza artificiale possono essere monitorati, verificati e integrati in processi critici con maggiore fiducia. Ciò sposta l’intelligenza artificiale da essere una scatola nera a un sistema il cui comportamento può essere compreso, controllato e affidabile in ambienti di produzione.
Come architetto dell’Unità di Elaborazione della Conoscenza, come differisce da un livello di orchestrazione tipico o da un motore di flussi di lavoro costruito intorno a grandi modelli di linguaggio?
L’Unità di Elaborazione della Conoscenza differisce dai livelli di orchestrazione tipici perché è progettata per gestire il ciclo di vita completo del ragionamento guidato dall’intelligenza artificiale piuttosto che semplicemente coordinare i prompt e le chiamate al modello. La maggior parte dei framework di orchestrazione agisce come gestori di flussi di lavoro che concatenano passaggi come il recupero, il prompt e l’esecuzione degli strumenti. L’Unità di Elaborazione della Conoscenza opera a un livello architettonico più profondo strutturando come la conoscenza viene acceduta, come il ragionamento viene eseguito e come le azioni vengono eseguite all’interno del sistema. Tratta l’elaborazione della conoscenza come un livello computazionale fondamentale, integrando la memoria, la convalida e l’esecuzione controllata in modo che l’intelligenza artificiale possa operare in modo affidabile all’interno dei flussi di lavoro aziendali complessi piuttosto che semplicemente generare risposte.
Nelle industrie regolamentate, la tolleranza al rischio è bassa. Quali decisioni di progettazione specifiche ha preso per assicurarsi che i output dell’intelligenza artificiale rimangano affidabili e non propaghino errori attraverso flussi di lavoro complessi?
Nelle industrie regolamentate, l’affidabilità e il controllo sono essenziali, quindi abbiamo progettato il sistema con diverse salvaguardie per assicurarsi che i output dell’intelligenza artificiale rimangano attendibili. Un principio chiave è l’esecuzione strutturata, dove l’intelligenza artificiale non può scatenare azioni critiche senza passare attraverso interfacce controllate. Incorporiamo anche strati di convalida che verificano i output del modello contro schemi, regole o meccanismi secondari prima che vengano accettati. Inoltre, il sistema mantiene la piena osservabilità, registrando i passaggi di ragionamento, le interazioni con gli strumenti e le decisioni in modo che possano essere tracciati e verificati. Insieme, queste scelte di progettazione aiutano a prevenire che gli errori si propaghino attraverso i flussi di lavoro e consentono alle organizzazioni di operare i sistemi di intelligenza artificiale con il livello di affidabilità e governance richiesto in ambienti regolamentati.
Quali sono i casi d’uso più convincenti in cui ha visto i Lavoratori Digitali spostarsi dall’assistenza guidata all’esecuzione guidata dall’intelligenza artificiale completamente operativa?
Alcuni dei casi d’uso più convincenti appaiono in flussi di lavoro intensivi di conoscenza dove i processi sono ben definiti ma richiedono ancora un’analisi e una presa di decisione significative. In aree come la revisione della conformità, le operazioni di supporto tecnico e la gestione della conoscenza interna, i Lavoratori Digitali possono andare oltre l’assistenza agli esseri umani e iniziare a eseguire compiti strutturati dall’inizio alla fine. Possono recuperare e analizzare grandi volumi di informazioni interne, applicare procedure definite, interagire con sistemi aziendali attraverso strumenti controllati e produrre output che alimentano direttamente i flussi di lavoro operativi. La chiave è quando l’intelligenza artificiale non genera solo suggerimenti ma è in grado di eseguire azioni definite in modo affidabile all’interno di un sistema governato, consentendo alle organizzazioni di automatizzare parti del lavoro della conoscenza complesso piuttosto che solo aumentarlo.
Man mano che la sorveglianza regolamentare sull’intelligenza artificiale si intensifica a livello globale, come crede che l’infrastruttura di intelligenza artificiale di base evolverà per soddisfare i requisiti di conformità senza limitare l’innovazione?
Man mano che la sorveglianza regolamentare sull’intelligenza artificiale aumenta, credo che vedremo uno spostamento lontano da architetture che semplicemente chiamano API di provider di modelli e si affidano ciecamente all’output. Le aziende e i regolatori richiederanno sempre più sistemi in cui il comportamento dell’intelligenza artificiale sia osservabile, verificabile e governato. È qui che le architetture come l’Unità di Elaborazione della Conoscenza diventano importanti. Questo tipo di architettura consente alle organizzazioni di applicare controlli, tracciare decisioni e assicurarsi che i output dell’intelligenza artificiale siano affidabili prima di influenzare processi reali. Nel tempo, mi aspetto che questi tipi di sistemi diventino la base standard per l’infrastruttura di intelligenza artificiale affidabile.
Ha parlato di etica e responsabilità insieme al suo lavoro tecnico. Come queste prospettive influenzano il modo in cui costruisce sistemi di intelligenza artificiale trasparenti?
L’etica e la responsabilità, per me, si traducono direttamente in scelte di progettazione del sistema. Se i sistemi di intelligenza artificiale devono partecipare a flussi di lavoro operativi reali, non possono funzionare come scatole nere opache il cui comportamento non può essere ispezionato o compreso. Questa prospettiva ha influenzato fortemente il modo in cui costruisco i sistemi di intelligenza artificiale. La trasparenza, la tracciabilità e la supervisione umana devono essere incorporate nell’architettura fin dall’inizio. Ciò significa assicurarsi che i passaggi di ragionamento possano essere osservati, le decisioni possano essere verificate e le azioni vengano eseguite attraverso meccanismi controllati. Quando questi principi sono incorporati a livello di infrastruttura, i sistemi di intelligenza artificiale diventano non solo più affidabili ma anche più facili per le organizzazioni da governare in modo responsabile.
Guardando avanti, crede che l’infrastruttura di intelligenza artificiale agente diventerà così fondamentale come l’infrastruttura cloud lo è stata nel decennio precedente — e cosa deve accadere tecnicamente perché questo spostamento si materializzi?
Credo che l’infrastruttura di intelligenza artificiale agente abbia il potenziale per diventare così fondamentale come l’infrastruttura cloud è diventata nel corso dell’ultimo decennio. Man mano che le organizzazioni cercano di automatizzare lavoro della conoscenza sempre più complesso, avranno bisogno di sistemi che possano coordinare in modo affidabile il ragionamento, la memoria e l’esecuzione attraverso molti compiti e fonti di dati. Tuttavia, perché questo spostamento si materializzi, l’architettura sottostante deve maturare oltre le semplici integrazioni dei modelli. Abbiamo bisogno di un’infrastruttura che fornisca ragionamento strutturato, accesso affidabile alla conoscenza aziendale, forte osservabilità e esecuzione controllata delle azioni. Quando queste capacità vengono incorporate nel sistema di base, l’intelligenza artificiale agente può evolversi da strumenti sperimentali in infrastrutture affidabili su cui le organizzazioni possono fare affidamento per eseguire operazioni critiche.
Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare Maisa AI.












