Haastattelut

Manuel Romero, Maisan perustaja ja tieteellinen johtaja – Haastattelusarja

mm

Manuel Romero, Maisan perustaja ja tieteellinen johtaja, on tekoälytutkija ja -insinööri, joka on keskittynyt kehittämään luotettavia, yritysten käyttöön soveltuvia tekoälyjärjestelmiä. Hän perusti Maisan vuonna 2024 luomaan vastuullista tekoälyä, joka pystyy suorittamaan monimutkaisia liiketoimintaprosesseja avoimuuden ja hallinnan kanssa. Ennen Maisaa Romero työskenteli johtavissa tekoäly- ja koneoppimistehtävissä yrityksissä kuten Clibrain ja Narrativa, joissa hän erikoistui luonnollisen kielen prosessoinnissa ja suurten tekoälyjärjestelmien kehittämisessä. Uransa alussa hän työskenteli täysipainoisena ohjelmistokehittäjänä ja DevOps-asiantuntijana, kunnes siirtyi edistyneeseen tekoälytutkimukseen ja -kehittämiseen, ja hänestä tuli aktiivinen osanottaja avoimen tekoälyekosysteemin kehittämiseen.

Maisa AI kehittää autonomisia “digitaalisia työntekijöitä”, tekoälyagentteja, jotka on suunniteltu automatisoimaan monimutkaisia yritysten prosesseja ylläpitäen jäljitettävyyttä, hallintaa ja luotettavuutta. Alusta mahdollistaa organisaatioiden rakentaa ja ottaa käyttöön tekoälyagentteja luonnollisen kielen avulla, mikä mahdollistaa automaation sisäisten järjestelmien ja tietolähteiden kanssa ilman laajaa koodaamista. Keskitettyässä verifioidussa päättelyssä ja rakenteellisessa suorittamisessa Maisa pyrkii voittamaan yleiset rajoitukset, jotka liittyvät generatiivisiin tekoälyjärjestelmiin, ja auttamaan yrityksiä ottamaan käyttöön autonomisen tekoälyn turvallisesti laajassa mittakaavassa.

Olet usein keskittynyt ymmärtämään tekoälyjärjestelmien taustalla olevia syvempiä “miksi”-kysymyksiä. Teknisen näkökulman kannalta, mitä teki sinut perustamaan Maisan vuonna 2024, ja mikä aukko yritysten tekoälyarkkitehtuurissa sinun mielestäsi ei ollut kohtuullista?

Syy Maisan perustamiseen oli se, että useimmat yritysten tekoälypinot olivat rakennettu malleja, ei järjestelmiä, ympärille.

Generatiivisen tekoälyn buumin aikana monet yritykset keskittyivät integroimaan suuria kielen malleja olemassa oleviin prosesseihin. Näistä järjestelmistä useat olivat kuitenkin hauraita, epäselviä ja vaikeasti toimivat laajassa mittakaavassa. Niissä puuttui:

  • määrätty suorittaminen, jossa se oli tärkeää.
  • vahva havainnointi, jäljitettävyys
  • toistettavuus

Me havaitsemamme aukko oli todellisen tekoälyinfrastruktuurin puute yrityksille. Yritykset rakensivat sovelluksia LLM-rajapintojen ympärille, mutta niiltä puuttui jotain vastaavaa kuin tietokoneen arkkitehtuuri tietotyölle.

Maisa luotiin täyttämään tämä aukko suunnittelemalla arkkitehtuuri, joka keskittyy Tietojen prosessointiyksikköön (KPU), järjestelmään, joka mahdollistaa tekoälyn toimimisen luotettavasti oikeissa yritysten prosesseissa.

Olet työskennellyt edistyneen luonnollisen kielen prosessoinnin ja generatiivisten järjestelmien parissa ennen Maisan perustamista. Miten nämä kokemukset vaikuttivat Maisan alustan arkkitehtonisiin valintoihin?

Kokemukseni luonnollisen kielen prosessoinnissa ja luonnollisen kielen generoinnissa, erityisesti kielen mallien koulutuksessa ja esikoulutuksessa, ja myöhemmin suurten kielen mallien (satojen) koulutuksessa, teki jotain hyvin selväksi, kun yritin rakentaa oikeita järjestelmiä niiden päälle. Transformer-arkkitehtuuri on erittäin voimakas, mutta siinä on vähintään kolme perustavaa rajoitusta, jotka on ratkaistava, jotta sitä voidaan käyttää luotettavasti tuotannossa.

Ensimmäinen on hallucinaatiot. Nämä mallit generoivat tekstin todennäköisyyden perusteella ja voivat tuottaa ulostulon, joka kuulostaa oikealta, mutta ei ole perusteltu vahvistetussa tiedossa.

Toinen on kontekstin rajoitukset. Vaikka suuremmat kontekstien ikkunat, mallit toimivat rajatulla token-avaruudella, mikä tekee vaikeaksi päättelyä suurten tai monimutkaisten tietojen yli.

Kolmas on ajantasainen tieto. Esikoulutetut mallit edustavat tietojen valokuvaa koulutusajankohtana, kun taas yritysympäristöissä vaaditaan järjestelmiä, jotka voivat päättelyä jatkuvasti muuttuvan tiedon yli.

Näiden rajoitusten tunnistaminen muovasi monia Maisan taustalla olevia arkkitehtonisia päätöksiä. Sen sijaan, että olisimme riippuvaisia mallista, keskityimme rakentamaan järjestelmää, joka tarjoaa rakenteellisen pääsyn tietoihin, validointimekanismit ja kontrolloidun suorittamisen, jotta tekoäly voisi toimia luotettavasti oikeissa yritysten prosesseissa.

Monet yritykset kokeilevat generatiivista tekoälyä, mutta kamppailevat siirtymisessä koepiloteista. Järjestelmien suunnittelun kannalta, mikä on ydin syy, miksi skaalautuminen epäonnistuu monissa organisaatioissa?

Monet yritykset kamppailevat siirtymisessä generatiivisen tekoälyn koepiloteista, koska useimmat käyttöönotot on rakennettu kokeiluina eikä vankkoina järjestelminä. Alkuvaiheen prototyypit usein riippuvat ohjelmointikielestä, kevyestä orkestraatiosta ja yksinkertaisista hakuputkistosta, mikä voi osoittaa arvoa, mutta ei tarjoa luotettavuutta, havainnointia tai hallintaa, jota tuotantoympäristössä vaaditaan. Kun organisaatiot yrittävät skaalata näitä järjestelmiä, he kohtaavat ongelmia, kuten epäjohdonmukaisia tuloksia, puutteellista jäljitettävyyttä, vaikeuksia integroida yritysten prosesseihin ja rajoitettua hallintaa siitä, miten tekoäly toimii. Ydinongelma on, että suuret kielen mallit ovat todennäköisyysgeneraattoreita, kun taas yritysprosessit vaativat ennustettavaa ja auditoitavaa käyttäytymistä. Ilman arkkitehtuuria, joka lisää rakennetta päättelyyn, validointiin, suorittamiseen ja valvontaan, generatiiviset tekoälyjärjestelmät ovat vaikeasti skaalattavissa laajemmille käyttötapauksille.

Maisan Digitaaliset Työntekijät on suunniteltu olevan auditoitavissa ja rakenteellisia eikä pelkästään todennäköisyysperäisiä. Mitä se tarkoittaa käytännössä yrityksille, jotka arvioivat tekoälyä tuotantokäyttöön?

Kun sanomme, että Maisan Digitaaliset Työntekijät ovat auditoitavissa ja rakenteellisia eikä pelkästään todennäköisyysperäisiä, tarkoitan, että tekoäly toimii ohjatussa järjestelmässä, jossa sen toimintaa ja päättelyä voidaan jäljittää ja hallita. Sen sijaan, että antaisimme mallin vapaasti generoida tuloksia ja päätöksiä, järjestelmä määrittää, miten tekoäly vuorovaikuttaa tietojen, työkalujen ja prosessien kanssa. Jokainen prosessin vaihe voidaan kirjata, tarkastella ja validoida, ja toimintoja suoritetaan määritellyn rajapinnan kautta eikä suoraan mallin tulosteesta. Yrityksille se tarkoittaa, että tekoälyjärjestelmät voidaan valvoa, auditoida ja integroida kriittisiin prosesseihin suuremmalla luottamuksella. Se siirtää tekoälyn mustasta laatikosta järjestelmäksi, jonka käyttäytyminen voidaan ymmärtää, hallita ja luottaa tuotantoympäristöissä.

Teolette työskennellyt edistyneen luonnollisen kielen prosessoinnin ja generatiivisten järjestelmien parissa ennen Maisan perustamista. Miten nämä kokemukset vaikuttivat Maisan alustan arkkitehtonisiin valintoihin?

Kokemukseni luonnollisen kielen prosessoinnissa ja luonnollisen kielen generoinnissa, erityisesti kielen mallien koulutuksessa ja esikoulutuksessa, ja myöhemmin suurten kielen mallien (satojen) koulutuksessa, teki jotain hyvin selväksi, kun yritin rakentaa oikeita järjestelmiä niiden päälle. Transformer-arkkitehtuuri on erittäin voimakas, mutta siinä on vähintään kolme perustavaa rajoitusta, jotka on ratkaistava, jotta sitä voidaan käyttää luotettavasti tuotannossa.

Ensimmäinen on hallucinaatiot. Nämä mallit generoivat tekstin todennäköisyyden perusteella ja voivat tuottaa ulostulon, joka kuulostaa oikealta, mutta ei ole perusteltu vahvistetussa tiedossa.

Toinen on kontekstin rajoitukset. Vaikka suuremmat kontekstien ikkunat, mallit toimivat rajatulla token-avaruudella, mikä tekee vaikeaksi päättelyä suurten tai monimutkaisten tietojen yli.

Kolmas on ajantasainen tieto. Esikoulutetut mallit edustavat tietojen valokuvaa koulutusajankohtana, kun taas yritysympäristöissä vaaditaan järjestelmiä, jotka voivat päättelyä jatkuvasti muuttuvan tiedon yli.

Näiden rajoitusten tunnistaminen muovasi monia Maisan taustalla olevia arkkitehtonisia päätöksiä. Sen sijaan, että olisimme riippuvaisia mallista, keskityimme rakentamaan järjestelmää, joka tarjoaa rakenteellisen pääsyn tietoihin, validointimekanismit ja kontrolloidun suorittamisen, jotta tekoäly voisi toimia luotettavasti oikeissa yritysten prosesseissa.

Teidän on suunniteltu Knowledge Processing Unit, joka eroaa tyypillisestä orkestraatiokerroksesta tai työvirran moottorista, joka on rakennettu suurten kielen mallien ympärille. Miten se eroaa?

Tietojen prosessointiyksikkö eroaa tyypillisistä orkestraatiokerroksista, koska se on suunniteltu hallitsemaan tekoälypohjaisen päättelyn koko elinkaarta eikä vain koordinoimaan pyynnön ja mallin välisiä kutsuja. Useimmat orkestraatiopohjaiset kehykset toimivat työvirran hallintina, jotka ketjuvat yhteen vaiheet kuten hakeminen, pyynnön muodostaminen ja työkalujen suorittaminen. Tietojen prosessointiyksikkö toimii syvemmällä arkkitehtonisella tasolla, jossa se määrittää, miten tietoja käsitellään, miten päättelyä suoritetaan ja miten toimintoja suoritetaan järjestelmässä. Se kohdellaan tietojen prosessointia ydinlaskentatasona, joka integroi muistiin, validointiin ja kontrolloituun suorittamiseen, jotta tekoäly voisi toimia luotettavasti monimutkaisissa yritysten prosesseissa eikä pelkästään generoisi vastauksia.

Säädellyissä aloissa riskitoleranssi on alhainen. Mitkä tarkat suunnittelupäätökset teit, jotta tekoälytulokset säilyvät luotettavina eivätkä levitä virheitä monimutkaisissa prosesseissa?

Säädellyissä aloissa luotettavuus ja hallinta ovat olennaisia, joten suunnittelimme järjestelmän useilla varotoimilla, jotta tekoälytulokset säilyvät luotettavina. Yksi avainperiaate on rakenteellinen suorittaminen, jossa tekoäly ei voi laukaista kriittisiä toimintoja ilman, että ne menevät kontrolloidun rajapinnan läpi. Lisäksi integroimme validointikerrokset, jotka tarkistavat mallin tulokset schemojen, sääntöjen tai toissijaisen mekanismin kautta ennen kuin ne hyväksytään. Lisäksi järjestelmä ylläpitää täydellistä havainnointia, jossa tallennetaan päättelyvaiheet, työkalujen vuorovaikutus ja päätökset, jotta ne voidaan jäljittää ja auditoida. Nämä suunnittelupäätökset yhdessä auttavat estämään virheiden leviämistä prosesseissa ja sallivat organisaatioiden toimia tekoälyjärjestelmillä, joilla on tarvittava luotettavuus ja hallinta säädellyissä ympäristöissä.

Mitkä ovat kaikkein vakuuttavimmat alkuvaiheen käyttötapaukset, joissa olette nähneet Digitaalisten Työntekijöiden siirtymisen ohjatusta avustuksesta täysin toimivaan tekoälyohjattuun suorittamiseen?

Joitakin kaikkein vakuuttavimpia alkuvaiheen käyttötapauksia nähdään tietointensiivisissä prosesseissa, joissa prosessit on määritelty, mutta edelleen vaativat merkittävää analyysiä ja päätöksentekoa. Alueilla, kuten vaatimusten tarkastelussa, teknisissä tukitoimissa ja sisäisessä tietojen hallinnassa, Digitaaliset Työntekijät voivat siirtyä ohjatusta avustuksesta tekoälyohjattuun suorittamiseen. Ne voivat hakea ja analysoida suuria määriä sisäistä tietoa, soveltaa määriteltyjä menettelyjä, vuorovaikuttaa yritysjärjestelmien kanssa kontrolloiduilla työkaluilla ja tuottaa tuloksia, jotka syötetään suoraan toimintaprosesseihin. Avainaskel tapahtuu, kun tekoäly ei ole ainoastaan generoimassa ehdotuksia, vaan pystyy luotettavasti suorittamaan määriteltyjä toimintoja hallitussa järjestelmässä, jolloin organisaatiot voivat automatisoida osia monimutkaisesta tietotyöstä eikä ainoastaan lisätä sitä.

Kun tekoälyyn liittyvä sääntely kiristyy maailmanlaajuisesti, miten näet tekoälyinfrastruktuurin kehittyvän sääntelyvaatimusten täyttämiseksi ilman innovaation rajoittamista?

Kun tekoälyyn liittyvä sääntely kiristyy, uskon, että siirrymme pois arkkitehtuureista, jotka vain kutsuvat mallipalvelun rajapintoja ja luottavat tulokseen sokeasti. Yritykset ja sääntelijät vaativat yhä enemmän järjestelmiä, joissa tekoälyn käyttäytyminen on havainnottavissa, auditoitavissa ja hallittavissa. Tässä on tärkeää arkkitehtuureja kuten Tietojen prosessointiyksikkö, joka mahdollistaa organisaatioiden asettaa kontrollit, jäljittää päätökset ja varmistaa, että tekoälytulokset ovat luotettavia ennen kuin ne vaikuttavat oikeisiin prosesseihin. Ajan myötä odotan, että nämäkaltaiset järjestelmät tulevat olemaan perusta luotettavalle tekoälyinfrastruktuurille.

Olet puhunut eettisyydestä ja vastuullisuudesta rinnan teknisen työskentelysi kanssa. Miten nämä näkökulmat vaikuttavat siihen, miten lähestyt tekoälyjärjestelmien rakentamista?

Eettisyys ja vastuullisuus kääntyvät suoraan järjestelmien suunnittelupäätöksiin. Jos tekoälyjärjestelmät osallistuvat oikeisiin toimintaprosesseihin, ne eivät voi toimia läpinäkymättöminä mustina laatikoina, joiden käyttäytyminen ei voida tarkastella tai ymmärtää. Tämä näkökulma on vaikuttanut vahvasti siihen, miten lähestyn tekoälyjärjestelmien rakentamista. Läpinäkyvyys, jäljitettävyys ja ihmisen valvonta on sisällyttävä arkkitehtuuriin alusta alkaen. Tämä tarkoittaa varmistamista, että päättelyvaiheet voidaan havainnoida, päätökset voidaan auditoida ja toimintoja suoritetaan kontrolloiduilla mekanismeilla. Kun nämä periaatteet on upotettu infrastruktuurin tasolle, tekoälyjärjestelmistä tulee luotettavampia ja helpompia organisaatioiden hallitsemiseen vastuullisesti.

Etenevänä, uskotko, että agenteille tekoälyinfrastruktuuri tulee olemaan yhtä perusta kuin pilvi-infrastruktuuri on ollut edellisellä vuosikymmenellä – ja mitä on tapahtuvan teknisesti, jotta tämä siirtymä materialisoituu?

Uskon, että agenteille tekoälyinfrastruktuuri on potentiaalia tulla yhtä perustaa kuin pilvi-infrastruktuuri on ollut edellisellä vuosikymmenellä. Kun organisaatiot pyrkivät automatisoimaan yhä monimutkaisempaa tietotyötä, he tarvitsevat järjestelmiä, jotka voivat luotettavasti koordinoida päättelyä, muistia ja suorittamista useiden tehtävien ja tietolähteiden yli. Mutta jotta tämä siirtymä materialisoituu, perusarkkitehtuuri on kehittynyt yksinkertaisista mallien integraatioista. Tarvitsemme infrastruktuuria, joka tarjoaa rakenteellisen päättelyn, luotettavan pääsyn yritysten tietoihin, vahvan havainnoinnin ja kontrolloidun suorittamisen, jotta tekoäly voisi kehittyä kokeellisista työkaluista luotettavaksi infrastruktuuriksi, jota organisaatiot voivat luottaa kriittisten toimintojensa suorittamiseen.

Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, voivat vierailla Maisa AI:n sivuilla.

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.