Wywiady
Onur Alp Soner, CEO i współzałożyciel Countly – seria wywiadów

Onur Alp Soner jest współzałożycielem i dyrektorem generalnym Countly, platformy analitycznej i zaangażowania w aplikacjach. Jako technolog i samouk, wybudował Countly od podstaw, aby dać firmom więcej kontroli nad tym, jak rozumieją i wchodzą w interakcje ze swoimi użytkownikami. Pod jego kierownictwem Countly stał się zaufaną platformą dla przedsiębiorstw na całym świecie, które chcą innowacyjnie rozwijać się, jednocześnie trzymając prywatność użytkowników w centrum swoich strategii wzrostu.
Zabierz nas z powrotem do momentu, który skłonił cię do założenia Countly — co konkretnie spotkałeś z istniejącymi narzędziami analitycznymi, co przekonało cię, że model własności danych jest fundamentalnie złamany?
Okło 13 lat temu, kiedy aplikacje mobilne zaczynały się rozkwitać, dostępne narzędzia analityczne podążały za bardzo konkretnym modelem. Wiele z nich było bezpłatnych lub tanich, ale cena była taka, że platforma gromadziła i monetyzowała twoje dane, często wprowadzając je do ekosystemów reklamowych. W tym czasie to było powszechnie akceptowane jako normalny sposób funkcjonowania.
To jednak nie zgadzało się z naszymi poglądami. Nawet jako mała firma, pomysł przekazania wszystkich naszych danych użytkowników tylko po to, aby zrozumieć, jak nasz produkt działa, nie miał sensu.
Countly powstał jako odpowiedź na to. Chcieliśmy zbudować analitykę, którą firmy mogłyby w pełni posiadać i kontrolować, dlatego też uruchomiliśmy ją jako platformę open-source i samodzielną. Pomysł był prosty: organizacje powinny móc zrozumieć i działać na podstawie swoich danych bez ich udostępniania. Ta zasada nadal leży u podstaw Countly.
Odkąd założyłeś Countly, AI przesunął własność danych z marginesowego problemu do strategicznego wymogu. Kiedy stało się dla ciebie jasne, że ta zasada będzie miała znaczenie daleko poza analityką?
We wczesnych latach, większość rozmów o własności danych była ujęta w kategoriach prywatności lub zgodności. Były to głównie banki, dostawcy opieki zdrowotnej i rządy, które bardzo dbały o to, gdzie znajdują się ich dane i kto nimi zarządza. Dla wielu innych analityka była postrzegana jako proste narzędzie raportowania, więc kwestia własności nie wydawała się pilna.
To spojrzenie zaczęło się zmieniać, gdy firmy zaczęły coraz bardziej polegać na danych, aby prowadzić swoje produkty, a nie tylko je mierzyć. Gdy analityka przeszła od raportowania do podejmowania decyzji, personalizacji, zmian produktów i zaangażowania klienta, znaczenie kontroli nad tymi danymi stało się znacznie bardziej oczywiste. Każda firma cyfrowa, od mobilności po hotelarstwo, skutecznie zaczęła konkurować na danych, a nie tylko na doświadczeniu z przodu.
AI przyspieszył tę realizację dramatycznie. Możesz wykupić lub zbudować model AI, ale nie możesz kupić danych behawioralnych, które odzwierciedlają, jak twoi klienci wchodzą w interakcje z twoim produktem. Te dane są unikalne dla każdej organizacji.
Wiele organizacji uważa, że są „gotowe do AI”, ponieważ mają duże ilości danych. Co zwykle brakuje pod powierzchnią, gdy patrzy się na prawdziwe firmy?
Brak danych zwykle nie jest problemem. Prawdziwy problem to brak danych, które można wykorzystać. Wiele organizacji ma ogromne ilości informacji, ale są one rozproszone po różnych narzędziach, zespołach i systemach. Na przykład, marketing może mieć jeden zestaw danych, produkt inny, a inżynieria własne dane telemetryczne, często przechowywane w różnych formatach z niewielką wspólną strukturą.
Dla AI, aby było użyteczne, dane pod spodem muszą być czyste, spójne i kontekstowe. Nie wystarczy gromadzić zdarzeń lub logów; trzeba zrozumieć, co te sygnały naprawdę reprezentują. Bez tego warstwy semantycznej, systemy AI są podstawowo zgadywane.
Inny problem to własność. Zaskakująco wiele firm nie kontroluje swoich własnych danych, ponieważ znajdują się one wewnątrz platform trzecich. To utrudnia łączenie zestawów danych, zarządzanie ich użyciem lub bezpieczne stosowanie modeli AI do nich.
Więc gdy firmy mówią, że są „gotowe do AI”, ponieważ mają wiele danych, prawdziwe pytanie brzmi, czy mają spójną podstawę danych.
Dlaczego dane pierwszej strony tworzą trwałą przewagę konkurencyjną w systemach AI, podczas gdy same modele stają się coraz bardziej wymiennymi?
To, co tworzy trwałą przewagę, nie jest modelem samym w sobie, ale zrozumieniem użytkowników, które pochodzi z danych pierwszej strony. Te dane odzwierciedlają, jak ludzie rzeczywiście wchodzą w interakcje z twoim produktem, i są unikalne dla każdej organizacji. Modele, z drugiej strony, stają się coraz bardziej towarami. Możesz je wykupić, dostosować lub przełączyć się między dostawcami dość łatwo. To, czego nie możesz powielić, to dane behawioralne generowane przez twoich własnych użytkowników, którzy wchodzą w interakcje z twoimi produktami w czasie.
Te dane przechwytują wzorce, kontekst i sygnały, które odzwierciedlają, jak klienci naprawdę się zachowują. Gdy są one prawidłowo zorganizowane i zrozumiane, pozwalają firmom budować systemy, które ciągle uczą się z prawdziwego użycia, a nie z danych ogólnych.
Gdzie nowoczesne stosy analityczne cicho się psują, gdy są przeznaczone dla systemów AI zamiast raportowania, pulpitów i wskaźników KPI?
One mają tendencję do psucia się w punkcie, w którym dane muszą przechodzić od obserwacji do działania. Tradycyjne stosy analityczne były zaprojektowane głównie do raportowania. Gromadzą i agregują dane, a następnie prezentują je w pulpitach, które pomagają zespołom zrozumieć, co się wydarzyło wczoraj lub w zeszłym tygodniu.
Systemy AI, jednak, działają inaczej. Wymagają danych, które są zorganizowane, kontekstowe i dostępne w czasie rzeczywistym, aby mogły bezpośrednio wpływać na to, jak system się zachowuje. Gdy potoki analityczne są zbudowane wokół przetwarzania wsadowego i opóźnionego raportowania, mają trudności z obsługą systemów, które muszą reagować natychmiast.
Jak brak prawdziwej własności danych pojawia się operacyjnie, gdy zespoły próbują przenieść AI z eksperymentów do produkcji?
Zwykle pojawia się to jako problem kontroli. Ostatecznie, jeśli nie masz kontroli nad swoimi danymi, nie masz kontroli nad twoim AI. To staje się szczególnie oczywiste, gdy zespoły przechodzą od eksperymentów do produkcji. Podczas eksperymentów zespoły mogą często pracować z małymi zestawami danych lub tymczasowymi potokami, ale systemy produkcyjne wymagają stałego dostępu do niezawodnych danych w całej organizacji.
Potem, w wielu firmach, podstawowe dane znajdują się w różnych platformach trzecich, takich jak narzędzia analityczne, systemy marketingowe lub usługi chmurowe. To utrudnia łączenie zestawów danych, stosowanie reguł zarządzania lub przenoszenie danych między systemami w kontrolowany sposób. To jest jeden z powodów, dla których wiele projektów AI pozostaje zakleszczone w fazie pilotażu. Bez zorganizowanych, ogólnoustrojowych danych staje się trudno wdrożyć AI w sposób niezawodny w produkcji.
To również utrudnia śledzenie, jak model doszedł do decyzji lub odtworzenie dokładnego stanu danych za nim. Bez tego poziomu kontroli, poprawienie błędów lub wycofanie decyzji staje się niezwykle trudne.
Dlaczego słaba struktura danych, semantyka i kontekst podważają nawet najbardziej zdolne modele AI?
Nawet najbardziej zdolne modele AI są tylko tak dobre, jak dane, które otrzymują. Jeśli podstawowe dane są słabo zorganizowane lub pozbawione kontekstu, model ma bardzo niewielkie zrozumienie tego, co te sygnały naprawdę reprezentują.
W wielu systemach dane są gromadzone jako izolowane zdarzenia lub logi bez wyraźnego znaczenia. Model może zobaczyć tysiące interakcji, ale bez odpowiedniej struktury i semantyki, nie może odróżnić tego, co jest ważne, od tego, co jest po prostu szumem.
Kontekst jest równie ważny. Systemy AI muszą zrozumieć, jak różne części danych są ze sobą powiązane w czasie. Bez tego kontekstu, modele mogą nadal produkować dane wyjściowe, ale są one często niewiarygodne, ponieważ system pracuje z niepełnymi informacjami.
Jakie ostrzegawcze sygnały wskazują, że firma zmierza ku ogólnym wynikom AI, zanim te doświadczenia staną się ogólne dla klientów?
Najbardziej podstawowym ostrzegawczym sygnałem jest to, gdy firmy polegają na tych samych zewnętrznych modelach AI i narzędziach, ale robią bardzo mało, aby rozwinąć swoje własne podstawy danych. Jeśli organizacje używają tych samych modeli, ale nie karmią ich swoimi własnymi danymi użytkowników i kontekstowymi, systemy są podstawowo pracujące z tymi samymi ogólnymi danymi wejściowymi. W takiej sytuacji AI może produkować tylko ogólne lub generyczne wyniki. Z czasem to prowadzi do produktów, które czują się coraz bardziej podobne, ponieważ inteligencja za nimi jest zbudowana na tych samych ograniczonych informacjach.
Inny ostrzegawczy sygnał to, gdy organizacje koncentrują się intensywnie na przyjmowaniu modeli AI, ale nie zwracają uwagi na strukturę i jakość swoich danych. AI powiększa to, co otrzymuje. Jeśli podstawowe dane są nieporządane, rozproszone lub słabo zorganizowane, system po prostu wyprodukuje bardziej wyrafinowaną wersję tego samego problemu.
Dla organizacji próbujących zbudować AI na podstawie swoich własnych danych, co Countly umożliwia, czego nie umożliwiają tradycyjne analityka i platformy danych?
Kluczowa różnica leży w tym, jak kontrola jest wbudowana w platformę. W wielu produktach analitycznych własność danych jest czymś, co pojawia się jako opcja lub funkcja. Z Countly, siedzi to w samym rdzeniu systemu. Platforma została zaprojektowana tak, aby organizacje nie musiały oddawać kontroli nad swoimi danymi w zamian za zaawansowaną funkcjonalność.
W praktyce oznacza to, że firmy mogą uruchomić Countly we własnym środowisku, utrzymać pełną kontrolę nad swoim stosiem danych i nadal mieć dostęp do funkcji analitycznych, zaangażowania i automatyzacji w skali. To staje się szczególnie ważne, gdy organizacje chcą zbudować AI na podstawie swoich własnych danych. Wiele tradycyjnych narzędzi analitycznych jest zbudowanych głównie do raportowania, co oznacza, że dane, które gromadzą, często pozostają wewnątrz pulpitów trzecich stron zamiast stawać się użyteczną podstawą dla innych systemów. Countly podejście jest inne, traktując analitykę jako część podstawowej infrastruktury danych.
Jak powinna ewoluować definicja etycznego AI, gdy własność danych jest traktowana jako podstawowa zasada projektowa, a nie tylko jako pole wyboru w polityce?
Gdy własność danych staje się zasadą projektową, etyczne AI nie jest już tylko o audytowaniu modeli po fakcie, ale o budowaniu systemów, w których użytkownicy zachowują agencję nad danymi, które je szkolą. Etyka staje się infrastrukturą.
Dziękujemy za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić Countly.












