Connect with us

Мануель Ромеро, співзасновник і головний науковий співробітник компанії Maisa – Серія інтерв’ю

Інтерв’ю

Мануель Ромеро, співзасновник і головний науковий співробітник компанії Maisa – Серія інтерв’ю

mm

Мануель Ромеро, співзасновник і головний науковий співробітник компанії Maisa, є дослідником і інженером штучного інтелекту, який спеціалізується на розробці надійних систем штучного інтелекту для підприємств. Він заснував компанію Maisa у 2024 році, щоб створити підзвітний штучний інтелект, який зможе виконувати складні бізнес-процеси прозоро і під контролем. До заснування Maisa Ромеро займав керівні посади інженера штучного інтелекту і машинного навчання в компаніях Clibrain і Narrativa, де він спеціалізувався на обробці природної мови і великомасштабних системах штучного інтелекту. На початку своєї кар’єри він працював інженером програмного забезпечення і спеціалістом DevOps, перш ніж перейти до розробки передових систем штучного інтелекту і стати активним учасником відкритої екосистеми штучного інтелекту.

Maisa AI розробляє автономних “цифрових працівників”, агентів штучного інтелекту, призначених для автоматизації складних корпоративних потоків роботи, зберігаючи при цьому прозорість, керування і надійність. Платформа дозволяє організаціям створювати і розгортати агентів штучного інтелекту за допомогою природної мови, що дозволяє автоматизувати процеси всередині систем і джерел даних без великої кількості коду. Зосереджуючись на перевірці висновків і структурованому виконанні, компанія Maisa намагається подолати звичайні обмеження систем генерації штучного інтелекту і допомогти підприємствам безпечно розгортати автономний штучний інтелект у великих масштабах.

Ви часто зосереджувалися на розумінні глибшої “причини” систем штучного інтелекту. З технічної точки зору, що спонукало вас заснувати компанію Maisa у 2024 році, і яку прогалину в архітектурі штучного інтелекту для підприємств ви вважали не вирішеною?

Мотивація для заснування компанії Maisa виникла з розуміння того, що більшість корпоративних стеків штучного інтелекту будувалися навколо моделей, а не систем.

Під час буму генерації штучного інтелекту багато компаній зосередилися на інтеграції великих мовних моделей у існуючі потоки роботи. Однак ці системи часто були хиткими, непрозорими і важкими для використання у великих масштабах. їм бракувало:

  • детермінованого виконання, де це було важливо.
  • сильної спостережуваності, відстежуваності
  • повторюваності

Прогалина, яку ми бачили, полягала в відсутності справжньої інфраструктури штучного інтелекту для підприємств. Компанії будували додатки навколо API великих мовних моделей, але їм бракувало чогось подібного до комп’ютерної архітектури для роботи з знаннями.

Компанія Maisa була створена для вирішення цієї прогалини шляхом розробки архітектури, центром якої є блок обробки знань (KPU), система, яка дозволяє штучному інтелекту працювати надійно всередині реальних корпоративних потоків роботи.

Ви працювали над передовими системами обробки природної мови і генерації штучного інтелекту до заснування компанії Maisa. Як ці досвіди вплинули на архітектурні рішення платформи?

Мій досвід роботи в галузі обробки природної мови і генерації штучного інтелекту, особливо щодо навчання і попереднього навчання мовних моделей і пізніше великих мовних моделей (сотень з них), зробив щось дуже ясним, коли я намагався будувати справжні системи на їх основі. Архітектура трансформера надзвичайно потужна, але вона має принаймні три фундаментальні обмеження, які потрібно вирішити, щоб використовувати її надійно у виробництві.

Перше обмеження – галюцинації. Ці моделі генерують текст ймовірнісно і можуть виробляти виводи, які звучать правильно, але не ґрунтуються на перевірених даних.

Друге обмеження – обмеження контексту. Навіть з більшим вікном контекstu, моделі працюють у обмеженому просторі токенів, що робить важким висновок над великими або складними тілами знань.

Третє обмеження – актуальність інформації. Предварньо навчені моделі представляють собою знімок знань на момент навчання, тоді як корпоративні середовища вимагають систем, які можуть висновкувати над постійно змінюваною інформацією.

Розуміння цих обмежень вплинуло на багато архітектурних рішень платформи Maisa. Замість того, щоб покладатися лише на модель, ми зосередилися на будівництві системи, яка забезпечує структурований доступ до знань, механізми перевірки і контрольоване виконання, щоб штучний інтелект міг працювати надійно у реальних корпоративних потоках роботи.

Багато підприємств експериментують з генерацією штучного інтелекту, але мають труднощі з переходом від пілотних проектів. З точки зору системного дизайну, яка є основною причиною невдачі масштабування у багатьох організаціях?

Багато підприємств мають труднощі з переходом від пілотних проектів генерації штучного інтелекту, оскільки більшість розгортань будуються як експерименти, а не як надійні системи. Ранні прототипи часто покладаються на інженерію запитів, легку оркестрацію і прості трубопроводи витягування, які можуть продемонструвати цінність, але не забезпечують надійності, спостережуваності чи контролю, необхідних для виробничих середовищ. Коли організації намагаються масштабувати ці системи, вони зустрічають проблеми, такі як неконсистентні виводи, відсутність відстежуваності, труднощі з інтеграцією з корпоративними потоками роботи і обмежене керування поведінкою штучного інтелекту. У своїй основі проблема полягає в тому, що великі мовні моделі є ймовірнісними генераторами, тоді як корпоративні процеси вимагають передбачуваної і аудитуємої поведінки. Без архітектури, яка додає структуру навколо висновків, перевірки, виконання і моніторингу, системи генерації штучного інтелекту залишаються важкими для масштабування за межі ізольованих випадків використання.

Цифрові працівники компанії Maisa розроблені для того, щоб бути аудитуємими і структурованими, а не просто ймовірнісними. Що це означає на практиці для підприємств, які оцінюють штучний інтелект для використання у виробництві?

Коли ми кажемо, що цифрові працівники компанії Maisa розроблені для того, щоб бути аудитуємими і структурованими, а не просто ймовірнісними, ми маємо на увазі, що штучний інтелект працює у контрольованій системі, де його дії і висновки можна відстежувати і керувати. Замість того, щоб дозволити моделі вільно генерувати виводи і рішення, система структурує, як штучний інтелект взаємодіє з даними, інструментами і потоками роботи. Кожний крок у процесі можна реєструвати, інспектувати і верифікувати, а дії виконуються через визначені інтерфейси, а не безпосередньо з виводу моделі. Для підприємств це означає, що системи штучного інтелекту можна моніторити, аудітувати і інтегрувати у критичні процеси з більшою впевненістю. Це змушує штучний інтелект переходити від чорної скриньки до системи, поведінка якої можна зрозуміти, контролювати і довіряти у виробничих середовищах.

Як архітектор блоку обробки знань, як він відрізняється від типової оркестраційної шари або потокової машини, побудованої навколо великих мовних моделей?

Блок обробки знань відрізняється від типових оркестраційних шарів, оскільки він розроблений для керування повним життєвим циклом висновків штучного інтелекту, а не просто для координації запитів і викликів моделі. Більшість оркестраційних фреймворків діють як менеджери потоків, які ланцюжком з’єднують кроки, такі як витягування, запит і виконання інструментів. Блок обробки знань працює на глибшому архітектурному рівні, структуруючи, як до знань звертаються, як висновки здійснюються і як дії виконуються всередині системи. Він розглядає обробку знань як основний розрахунковий шар, інтегруючи пам’ять, перевірку і контрольоване виконання, щоб штучний інтелект міг працювати надійно всередині складних корпоративних потоків роботи, а не просто генерувати відповіді.

У галузях, де високий рівень регулювання, толерантність до ризику низька. Які конкретні рішення щодо дизайну ви прийняли для забезпечення того, щоб виводи штучного інтелекту залишалися надійними і не поширювали помилки через складні потоки роботи?

У галузях, де високий рівень регулювання, надійність і контроль є важливими, ми розробили систему з декількома заходами безпеки, щоб виводи штучного інтелекту залишалися довіреними. Одним з ключових принципів є структурований виконаń, коли штучний інтелект не може безпосередньо спровокувати критичні дії без проходження контрольованих інтерфейсів. Ми також інтегруємо шари перевірки, які перевіряють виводи моделі проти схем, правил або вторинних механізмів, перш ніж вони приймаються. Крім того, система підтримує повну спостережуваність, реєструючи кроки висновків, взаємодію з інструментами і рішення, щоб вони могли бути відстежені і аудітуємі. Разом ці рішення щодо дизайну допомагають запобігти помилкам, які можуть поширитися через потоки роботи, і дозволяють організаціям працювати з системами штучного інтелекту з тим рівнем надійності і керування, який необхідний у галузях з високим рівнем регулювання.

Які найбільш переконливі перші випадки використання, де ви бачили цифрових працівників переходити від підтримки до повністю оперативного виконання штучного інтелекту?

Деякі з найбільш переконливих перших випадків використання можна побачити у потоках роботи, які вимагають великої кількості аналізу і прийняття рішень. У галузях, таких як перегляд відповідності, технічна підтримка і внутрішнє керування знаннями, цифрові працівники можуть переходити від простої підтримки людей до виконання структурованих завдань. Вони можуть витягувати і аналізувати великі об’єми внутрішньої інформації, застосовувати визначені процедури, взаємодіяти з корпоративними системами через контрольовані інструменти і виробляти виводи, які безпосередньо підключаються до оперативних потоків роботи. Ключовий перехід відбувається, коли штучний інтелект не тільки генерує пропозиції, а й здатний надійно виконувати визначені дії у керованій системі, що дозволяє організаціям автоматизувати частини складної роботи з знаннями, а не просто посилювати її.

Як регулювання штучного інтелекту посилюється у світі, як ви бачите еволюцію основної інфраструктури штучного інтелекту для задоволення вимог відповідності без обмеження інновацій?

Як регулювання штучного інтелекту посилюється, я вважаю, що ми побачимо перехід від архітектур, які просто викликають API моделей, і довіряють виводам сліпо. Підприємства і регулюючі органи все частіше будуть вимагати систем, у яких поведінка штучного інтелекту спостережувана, аудітуєма і керується. Це саме місце, де архітектури, такі як блок обробки знань, стають важливими. Цей тип архітектури дозволяє організаціям забезпечувати контроль, відстежувати рішення і гарантувати, що виводи штучного інтелекту надійні, перш ніж вони впливають на реальні процеси. З часом я очікую, що такі системи стануть стандартною основою для довірчих інфраструктур штучного інтелекту.

Ви говорили про етику і підзвітність разом зі своїми технічними роботами. Як ці погляди впливають на ваш підхід до будівництва прозорих систем штучного інтелекту?

Етика і підзвітність, для мене, перекладаються безпосередньо у рішення щодо дизайну. Якщо системи штучного інтелекту будуть брати участь у реальних оперативних потоках роботи, вони не можуть функціонувати як непрозорі чорні скриньки, поведінка яких не може бути інспектована або зрозуміла. Цей погляд сильно вплинув на мій підхід до будівництва систем штучного інтелекту. Прозорість, відстежуваність і нагляд людини повинні бути закладені в архітектуру з самого початку. Це означає забезпечення того, щоб кроки висновків могли бути спостережені, рішення могли бути аудітуємими, а дії виконувалися через контрольовані механізми. Коли ці принципи закладені на рівні інфраструктури, системи штучного інтелекту стають не тільки більш довіреними, а й легшими для організацій у керуванні відповідальністю.

Оглядаючи майбутнє, ви вважаєте, що інфраструктура агентного штучного інтелекту стане такою ж фундаментальною, як і інфраструктура хмарних обчислень стала за попереднє десятиліття – і що потрібно зробити технічно для реалізації цього зсуву?

Я вважаю, що інфраструктура агентного штучного інтелекту має потенціал стати такою ж фундаментальною, як і інфраструктура хмарних обчислень стала за попереднє десятиліття. Коли організації намагаються автоматизувати все більш складну роботу з знаннями, їм будуть потрібні системи, які можуть надійно координувати висновки, пам’ять і виконання через багато завдань і джерел даних. Однак, для реалізації цього зсуву основна архітектура повинна дозріти за межі простих інтеграцій моделей. Нам потрібна інфраструктура, яка забезпечує структурований висновок, надійний доступ до корпоративних знань, сильну спостережуваність і контрольоване виконання дій. Коли ці можливості будуть закладені в основну систему, агентний штучний інтелект може еволюціонувати від експериментальних інструментів у довірчу інфраструктуру, на яку організації можуть покладатися для виконання критичних операцій.

Дякуємо за велике інтерв’ю, читачам, які бажають дізнатися більше, слід відвідати Maisa AI.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.