інтерв'ю
Алекс Головач, співзасновник Kubiks – серія інтерв'ю

Алекс Головач, співзасновник Kubiks, — досвідчений інженер-програміст, що спеціалізується на масштабованих, високопродуктивних системах. Він керував цифровими трансформаціями, створював відмовостійкі мікросервіси та розробляв корпоративні інтеграції в Prove, TAG – The Aspen Group, airSlate та Google. Сьогодні він спрямовує цей досвід на переосмислення спостережуваності за допомогою штучного інтелекту в Kubiks.
Кубікс — це платформа спостереження на основі штучного інтелекту, яка допомагає інженерним командам швидше контролювати, діагностувати та вирішувати проблеми. Вона автоматично фіксує журнали, трасування, запити та виклики LLM без ручного налаштування, а потім використовує штучний інтелект для визначення першопричин, надсилання контекстних сповіщень і навіть пропонування виправлень. Завдяки картам послуг у режимі реального часу, історичним знімкам та інтеграції з популярними інструментами та хмарними постачальниками, Kubiks оптимізує реагування на інциденти та підвищує надійність системи.
Ви створювали та масштабували інфраструктуру в таких компаніях, як airSlate, Prove та Google. Яка з цих ролей найбільше вплинула на ваше бачення проблем масштабування систем, і як ці уроки зрештою надихнули вас стати співзасновником Kubiks?
Я з власного досвіду дізнався, як це — підтримувати надійність, коли понад 100 інженерів щодня впроваджують зміни. У таких умовах фактор «шини», ризик раптової недоступності ключових членів команди, є високим, і ключовим є автоматизація всього можливого для забезпечення безперебійної роботи сервісу. Але не завжди можна передбачити, що зламається далі. Цей досвід підкреслив обмеження традиційних підходів, тому наявність агентів штучного інтелекту, які постійно контролюють кожну частину в режимі реального часу, змінює все. Вони завжди активні, миттєво попереджають вас і виконують аналіз першопричин, коли щось відбувається. Саме це спонукало мене стати співзасновником Kubiks.ai, щоб зробити цей інтелектуальний, постійний нагляд доступним для більшої кількості команд.
Компанія Kubiks була запущена у травні 2025 року зі сміливою обіцянкою: налаштування за одну хвилину та виправлення за допомогою штучного інтелекту. Яку прогалину на ринку ви побачили, що переконала вас, що зараз саме час для створення цієї компанії?
Зараз існує величезна прогалина, оскільки штучний інтелект нарешті може додати в Інтернет шар самовідновлення. Наша місія проста: щоб штучний інтелект контролював ваші виробничі системи, проводив автоматичний аналіз першопричин збоїв та готував безпечні виправлення, щоб команди могли реагувати за лічені секунди. Завдяки постійному проактивному моніторингу, який виконує штучний інтелект, інженери можуть зосередитися на швидкій реакції, а не на нескінченних перевірках. Це той великий зсув, який ми забезпечуємо.
Kubiks унікальним чином фіксує повний запит та виклики LLM, автоматично генерує виправлення та надсилає запити на перевірку. Які технічні прориви забезпечили цей безперебійний процес від виявлення до вирішення? Чи було важко збалансувати ретельність з простотою?
Нашим проривом є наскрізна кореляція та контекстна інженерія: ми автоматично витягуємо ключові ідентифікатори з кожного запиту, такі як платежі, користувачі, сесії, бази даних, черги, моделі та версії, та об'єднуємо їх в єдину часову шкалу. Після підключення всього ланцюжка штучний інтелект точно визначає перший невдалий виклик, вхідні дані, що його спричинили, та що саме потрібно виправити. Це спирається на Scuba від Facebook, їхній внутрішній інструмент спостереження. Після використання чогось подібного ви не можете повернутися лише до метрик та агрегатів.
Kubiks пропонує візуалізації в режимі реального часу, карти послуг та представлення даних, орієнтованих на взаємовідносини. Як об'єднання журналів, трас, метрик та карт в одну єдину інформаційну панель радикально змінює те, як команди виявляють та вирішують проблеми?
Сучасні системи схожі на керування автомобілем на швидкості автостради. Якби вам довелося аналізувати кожні необроблені показники датчика, ви б точно потрапили в аварію. Натомість вам потрібна одна панель інструментів, яка позначає, що і де не так. Ось чому ми поєднуємо журнали, траси, метрики та карту в реальному часі: один швидкий погляд дає вам повну картину, а один клік – виправлення. Це перетворює розсіяне налагодження на цілеспрямоване, ефективне вирішення проблеми.
Подорожі в часі та анотації знімків звучать потужно для історичного налагодження. На практиці, які випадки використання цього методу виявили проблеми, які не могли бути вирішені лише за допомогою перегляду в режимі реального часу?
Уявіть, що ваш основний сервіс виходить з ладу, і карта в реальному часі стає червоною всюди з помилками по всій системі, але ви не можете сказати, що сталося першим серед цього хаосу. Наприклад, одного разу у нас було завдання Airflow з неправильно налаштованою політикою повторних спроб; воно було заплановано на ніч, але спрацювало опівдні під час пікового трафіку, що перевантажило базу даних. Перегляд у реальному часі показав лише поширені збої, але подорож у часі дозволила нам перемотати назад і побачити, як інцидент почався з пропуску цього завдання, виявивши першопричину, яка не була зрозумілою в реальному часі.
Як ваш ШІ аналізує телеметрію, щоб виявляти аномалії та пропонувати виправлення? Чи можете ви навести приклади, коли Кубікс виявляв ледь помітні або приховані проблеми, які традиційний моніторинг пропустив би?
Інженер розгорнув нову логіку для прапорця функції, і виробництво залишалося стабільним протягом двох тижнів з вимкненим прапорцем. Потім, її ввімкнення для сегмента користувачів спричинило помилки лише для цих користувачів. На стандартних інформаційних панелях це виглядало випадковим і важко відстежити до розгортання. Kubiks пов'язує кожен запит з версією коду, станом прапора, сегментом користувача та викликами нижче за течією. Коли помилки зростали, штучний інтелект зіставляв їх з активацією прапора та конкретним шляхом коду. Він виділяв функцію, що призвела до збою, та запускав вхідні дані. Пов'язуючи спостережуваність з кодом та прапорцями, штучний інтелект швидко визначає причини та пропонує цільові виправлення, помічаючи те, що традиційні інструменти не помічають.
Користувачі кажуть, що Kubiks «не потребує жодних проблем із налаштуванням» і «всі параметри фіксуються одразу після встановлення». Які заходи ви вжили для забезпечення довіри та зручності використання — від встановлення до щоденного робочого процесу?
Ми розробили Kubiks так, щоб він був знайомим ще з моменту локальної розробки, тож ви можете завоювати довіру ще до того, як продакшн почне працювати. Наш CLI запускає ваш застосунок локально, автоматично інструментує HTTP, DB, черги та LLM-виклики, а також передає чисту телеметрію; ручне ведення журналу чи трасування не потрібне. Він передає багатий контекст до вашого редактора коду штучного інтелекту через MCP, з тими ж самими представленнями, які ви бачите під час промежуточного та продакшн-проектування. Ви вивчаєте його один раз, у своєму природному потоці, під час створення функцій, що робить його безперебійним та надійним, коли це найважливіше.
Багато стартапів у сфері штучного інтелекту сьогодні стикаються з проблемою спостережуваності, оскільки їхні системи швидко масштабуються. Як Kubiks допомагає меншим командам працювати з тими ж стандартами надійності, що й мільярдні компанії?
Стартапи розвиваються швидко. Ви не можете зупинити спринт, щоб додавати журнали та трасування всюди. Ось чому ми наголошуємо на автоматичній інструментації. За допомогою однієї установки Kubiks фіксує повну картину: HTTP-маршрути, виклики бази даних, взаємодії LLM. Це дозволяє невеликим командам досягти надійності корпоративного рівня без додаткових витрат.
З огляду на зростання складності систем на базі штучного інтелекту, яку роль, на вашу думку, відіграватиме Kubiks у забезпеченні надійності, спостережуваності та дієвості в розподілених робочих навантаженнях штучного інтелекту?
Традиційні мікросервіси були складними, але передбачуваними. Ви могли відображати граф викликів та передбачати потоки. Розподілений ШІ змінює це: агенти взаємодіють динамічно, запускають інструменти, адаптують плани на льоту та маршрутизують на основі контексту. Це інноваційно, але кошмар для налагодження. Kubiks автоматично інструментує всю систему (кожен агент, інструмент, черга, вебхук та виклик моделі), а потім створює графік причинно-наслідкових зв'язків у реальному часі, який показує, хто що зробив, коли та з якими даними. Наш ШІ контролює це в режимі реального часу, виявляючи відхилення, цикли, пропущені передачі передач та погані рішення в міру їх виникнення, а не пізніше в журналах.
Заглядаючи в майбутнє, як ви бачите еволюцію спостережуваності в хмарних середовищах на базі штучного інтелекту? Який план дій ви обираєте для Kubiks.ai протягом наступних кількох років — більше автоматизації, глибший інтелект чи розширена інтеграція?
Незабаром компанії запускатимуть мільйони агентів одночасно в хмарах, потребуючи чіткого бачення того, що називається «що», «коли» та з якими даними. Спостереження розвиватиметься, щоб забезпечувати аналітику цих динамічних систем у режимі реального часу, заглядаючи всередину LLM для розуміння їхніх рішень. У Кубікс ми зосереджуємося на наскрізному трасуванні на рівні агента: підказки, параметри, режими, інструменти, вхідні дані та виходи. Це допоможе інженерам виявляти загрози, граничні випадки та аномалії на ранній стадії, роблячи складні середовища штучного інтелекту більш надійними та дієздатними.
Дякую за чудове інтерв’ю, читачі, які хочуть дізнатися більше, повинні відвідати Кубікс.