Wywiady
Alex Holovach, współzałożyciel Kubiks – seria wywiadów

Alex Holovach, współzałożyciel Kubiks, jest doświadczonym inżynierem oprogramowania specjalizującym się w skalowalnych, wysokowydajnych systemach. Kierował transformacjami cyfrowymi, budował odporne na błędy mikrousługi i rozwijał integracje korporacyjne w Prove, TAG – The Aspen Group, airSlate i Google. Obecnie wykorzystuje tę wiedzę, aby na nowo zdefiniować obserwowalność za pomocą sztucznej inteligencji w Kubiks.
Kubiki to oparta na sztucznej inteligencji platforma obserwacyjna, która pomaga zespołom inżynierskim szybciej monitorować, diagnozować i rozwiązywać problemy. Automatycznie rejestruje logi, ślady, zapytania i wywołania LLM bez ręcznej konfiguracji, a następnie wykorzystuje sztuczną inteligencję do określania przyczyn źródłowych, wysyłania alertów kontekstowych, a nawet sugerowania rozwiązań. Dzięki mapom usług w czasie rzeczywistym, historycznym migawkom i integracji z popularnymi narzędziami i dostawcami chmury, Kubiks usprawnia reagowanie na incydenty i poprawia niezawodność systemu.
Budowałeś i skalowałeś infrastrukturę w takich firmach jak airSlate, Prove i Google. Która z tych ról najbardziej ukształtowała Twoje spojrzenie na wyzwania związane ze skalowaniem systemów i jak te doświadczenia ostatecznie zainspirowały Cię do współzałożenia Kubiks?
Przekonałem się z pierwszej ręki, jak to jest utrzymać niezawodność, gdy ponad 100 inżynierów codziennie wprowadza zmiany. W takich konfiguracjach czynnik magistrali, czyli ryzyko nagłej niedostępności kluczowych członków zespołu, jest wysoki, a kluczem jest zautomatyzowanie wszystkiego, co możliwe, aby zapewnić płynne działanie usługi. Nie zawsze jednak można przewidzieć, co się zepsuje. Te doświadczenia uwypukliły ograniczenia tradycyjnych podejść, dlatego ciągłe monitorowanie każdej części w czasie rzeczywistym przez agentów AI zmienia wszystko. Są zawsze dostępni, natychmiast powiadamiają i zajmują się analizą przyczyn źródłowych, gdy coś się zepsuje. To właśnie skłoniło mnie do współzałożenia Kubiks.ai, aby udostępnić ten inteligentny, ciągły nadzór większej liczbie zespołów.
Firma Kubiks wystartowała w maju 2025 roku z śmiałą obietnicą: konfiguracja w minutę i naprawy wspomagane sztuczną inteligencją. Jaką lukę na rynku dostrzegłeś, która przekonała Cię, że to właściwy moment na założenie tej firmy?
Obecnie istnieje ogromna luka, ponieważ sztuczna inteligencja może wreszcie dodać do internetu warstwę samonaprawiającą. Nasza misja jest prosta: pozwolić sztucznej inteligencji monitorować systemy produkcyjne, przeprowadzać automatyczną analizę przyczyn awarii i przygotowywać bezpieczne rozwiązania, aby zespoły mogły reagować w ciągu kilku sekund. Dzięki stałemu, proaktywnemu monitorowaniu przez sztuczną inteligencję, inżynierowie mogą skupić się na szybkich reakcjach zamiast na niekończących się kontrolach. To właśnie ta wielka zmiana, którą umożliwiamy.
Kubiks w unikalny sposób rejestruje kompletne żądania i wywołania LLM, automatycznie generuje poprawki i dostarcza pull requesty do weryfikacji. Jakie przełomy techniczne umożliwiły ten płynny proces od wykrywania do rozwiązania? Czy trudno było znaleźć równowagę między dokładnością a prostotą?
Naszym przełomem jest kompleksowa inżynieria korelacji i kontekstu: automatycznie pobieramy kluczowe identyfikatory z każdego żądania, takie jak płatności, użytkownicy, sesje, bazy danych, kolejki, modele i wersje, i splatamy je w jedną oś czasu. Dzięki połączeniu całego łańcucha, sztuczna inteligencja lokalizuje pierwsze nieudane wywołanie, dane wejściowe, które je spowodowały, oraz dokładnie to, co należy naprawić. Rozwiązanie to bazuje na Scuba, wewnętrznym narzędziu Facebooka do obserwacji. Po skorzystaniu z takiego narzędzia nie można już powrócić do samych metryk i agregatów.
Kubiks oferuje wizualizacje w czasie rzeczywistym, mapy usług i widoki zorientowane na relacje. W jaki sposób połączenie logów, śladów, metryk i mapowania w jeden ujednolicony panel radykalnie zmienia sposób, w jaki zespoły wykrywają i rozwiązują problemy?
Nowoczesne systemy są jak jazda samochodem z prędkością autostradową. Gdybyś musiał analizować każdy odczyt z czujnika, z pewnością doszłoby do awarii. Zamiast tego potrzebujesz jednego pulpitu, który sygnalizuje, co i gdzie jest nie tak. Dlatego łączymy logi, ślady, metryki i mapę na żywo: jeden szybki rzut oka daje pełny obraz, a jedno kliknięcie prowadzi do rozwiązania problemu. Dzięki temu rozproszone debugowanie zamienia się w skoncentrowane, wydajne rozwiązanie.
Podróże w czasie i adnotacje do migawek brzmią obiecująco w kontekście debugowania danych historycznych. W praktyce, w jakich przypadkach ujawniło to problemy, których nie dałoby się rozwiązać za pomocą samych widoków w czasie rzeczywistym?
Wyobraź sobie, że Twoja usługa bazowa przestaje działać, a mapa na żywo zmienia kolor na czerwony, wyświetlając błędy systemowe, ale w całym tym chaosie nie jesteś w stanie określić, co zawiodło jako pierwsze. Na przykład, mieliśmy kiedyś zadanie Airflow z błędnie skonfigurowaną polityką ponawiania; było zaplanowane na noc, ale zostało uruchomione w południe w szczycie ruchu, co zablokowało bazę danych. Widoki w czasie rzeczywistym pokazywały jedynie liczne awarie, ale podróż w czasie pozwoliła nam cofnąć się i zobaczyć, jak incydent zaczyna się od nieudanego uruchomienia tego zadania, ujawniając przyczynę, która na żywo nie była jasna.
W jaki sposób Twoja sztuczna inteligencja analizuje dane telemetryczne, aby wykrywać anomalie i tworzyć sugerowane rozwiązania? Czy możesz podać przykłady, w których Kubiks wykrył subtelne lub ciche problemy, których tradycyjny monitoring by nie wykrył?
Inżynier wdrożył nową logikę związaną z flagą funkcji, a produkcja pozostawała stabilna przez dwa tygodnie z wyłączoną flagą. Następnie włączenie jej dla segmentu użytkowników powodowało błędy tylko u tych użytkowników. W standardowych pulpitach nawigacyjnych wyglądało to losowo i trudno było prześledzić to do wdrożenia. Kubiks łączy każde żądanie z wersją kodu, stanem flagi, segmentem użytkownika i wywołaniami downstream. W przypadku wystąpienia błędów, sztuczna inteligencja dopasowywała je do aktywacji flagi i konkretnej ścieżki kodu. Wskazywała wadliwą funkcję i wyzwalające dane wejściowe. Łącząc obserwowalność z kodem i flagami, sztuczna inteligencja szybko identyfikuje przyczyny i sugeruje ukierunkowane poprawki, wychwytując to, czego tradycyjne narzędzia nie dostrzegają.
Użytkownicy twierdzą, że Kubiks „nie wymaga żadnej konfiguracji” i „zawiera wszystkie funkcje od razu po wyjęciu z pudełka”. Jakie środki podjęto, aby zapewnić zarówno zaufanie, jak i użyteczność – od instalacji po codzienny przepływ pracy?
Zaprojektowaliśmy Kubiks tak, aby był znajomy już na etapie lokalnego rozwoju, dzięki czemu budujesz zaufanie, zanim produkcja się rozkręci. Nasz interfejs wiersza poleceń uruchamia aplikację lokalnie, automatycznie instrumentuje wywołania HTTP, DB, kolejek i LLM oraz przesyła czyste dane telemetryczne; nie wymaga ręcznego logowania ani śledzenia. Dostarcza bogaty kontekst do edytora kodu AI za pośrednictwem MCP, z dokładnie tymi samymi widokami, które zobaczysz w środowisku testowym i produkcyjnym. Uczysz się go raz, w naturalnym procesie tworzenia funkcji, dzięki czemu jest płynny i niezawodny, gdy jest najbardziej potrzebny.
Wiele startupów zajmujących się sztuczną inteligencją zmaga się obecnie z problemem obserwowalności, ponieważ ich systemy szybko się skalują. W jaki sposób Kubiks pomaga mniejszym zespołom działać z tymi samymi standardami niezawodności, co firmy warte miliardy dolarów?
Startupy rozwijają się szybko. Nie da się zatrzymać sprintu, aby wszędzie dodać logi i ślady. Dlatego kładziemy nacisk na automatyczną instrumentację. Po jednej instalacji Kubiks od razu pokazuje pełny obraz: trasy HTTP, wywołania bazy danych, interakcje LLM. Pozwala małym zespołom osiągnąć niezawodność na poziomie korporacyjnym bez dodatkowych kosztów.
Biorąc pod uwagę rosnącą złożoność systemów opartych na sztucznej inteligencji, jaką rolę Twoim zdaniem odegra Kubiks w zapewnieniu niezawodności, możliwości obserwacji i wykonalności działań w rozproszonych obciążeniach AI?
Tradycyjne mikrousługi były złożone, ale przewidywalne. Można było mapować graf wywołań i przewidywać przepływy. Rozproszona sztuczna inteligencja to zmienia: agenci wchodzą w interakcje dynamicznie, uruchamiają narzędzia, dostosowują plany w locie i wyznaczają trasy w oparciu o kontekst. To innowacyjne, ale koszmarne w debugowaniu. Kubiks automatycznie analizuje całą konfigurację (każdego agenta, narzędzie, kolejkę, webhooka i wywołanie modelu), a następnie tworzy żywy wykres przyczynowo-skutkowy pokazujący, kto co zrobił, kiedy i z jakimi danymi. Nasza sztuczna inteligencja monitoruje to w czasie rzeczywistym, wychwytując dryfty, pętle, pominięte przekazania i błędne decyzje w momencie ich wystąpienia, a nie później w logach.
Patrząc w przyszłość, jak wyobrażasz sobie ewolucję obserwowalności w środowiskach chmurowych opartych na sztucznej inteligencji? Jaką mapę drogową obierasz – większą automatyzację, głębszą inteligencję czy rozszerzoną integrację – dla Kubiks.ai w ciągu najbliższych kilku lat?
Wkrótce firmy będą uruchamiać miliony agentów jednocześnie w chmurach, potrzebując jasnego wglądu w to, co nazywamy „czym”, kiedy i z jakimi danymi. Obserwowalność będzie się rozwijać, aby zapewnić wgląd w czasie rzeczywistym w te dynamiczne systemy, zaglądając do LLM-ów i rozumiejąc ich decyzje. W Kubiks koncentrujemy się na kompleksowym śledzeniu na poziomie agenta: monity, parametry, tryby, narzędzia, dane wejściowe i wyjściowe. Pomoże to inżynierom wcześnie wykrywać zagrożenia, przypadki skrajne i anomalie, zwiększając niezawodność i skuteczność złożonych środowisk AI.
Dziękuję za wspaniały wywiad. Czytelnicy chcący dowiedzieć się więcej powinni odwiedzić nas Kubiki.