Röportajlar
Alexandr Yarats, Perplexity Arama Direktörü – Röportaj Serisi

Alexandr Yarats Arama Direktörüdür şaşkınlık AI. Kariyerine 2017 yılında Yandex'de başladı ve aynı zamanda Yandex Veri Analiz Okulu'nda eğitim gördü. İlk yıllar yoğun ama ödüllendiriciydi; bu da onun bir Mühendislik Ekibi Lideri haline gelmesini sağladı. Bir teknoloji deviyle çalışma arzusundan yola çıkarak, 2022'de Kıdemli Yazılım Mühendisi olarak Google'a katıldı ve Google Asistan ekibine (daha sonra Google Bard) odaklandı. Daha sonra Arama Başkanı olarak Şaşkınlık'a geçti.
Perplexity AI, sorguları doğal dildeki tahmini metni kullanarak yanıtlayan, AI sohbet robotu destekli bir araştırma ve konuşmaya dayalı arama motorudur. 2022'de kullanıma sunulan Perplexity, web'deki kaynakları kullanarak yanıtlar üretiyor ve metin yanıtındaki bağlantıları belirtiyor.
Başlangıçta makine öğrenimiyle ilgilenmenize ne sebep oldu?
Makine öğrenimine (ML) olan ilgim kademeli bir süreçti. Okul yıllarımda matematik, olasılık teorisi ve istatistik çalışarak çok zaman geçirdim ve doğrusal regresyon ve KNN gibi klasik makine öğrenimi algoritmalarıyla oynama fırsatı buldum. Verilerden doğrudan bir tahmin fonksiyonunun nasıl oluşturulabileceğini ve ardından bunu görünmeyen verileri tahmin etmek için nasıl kullanabileceğinizi görmek büyüleyiciydi. Bu ilgi beni Rusya'da oldukça rekabetçi bir makine öğrenimi yüksek lisans programı olan Yandex Veri Analizi Okulu'na yönlendirdi (her yıl yalnızca 200 kişi kabul ediliyor). Orada daha gelişmiş makine öğrenimi algoritmaları hakkında çok şey öğrendim ve sezgilerimi geliştirdim. Bu süreçteki en önemli nokta, sinir ağları ve derin öğrenme hakkında bilgi edindiğim zamandı. Bunun önümüzdeki birkaç on yıl boyunca sürdürmek istediğim bir şey olduğu benim için çok netleşti.
Daha önce bir yıl boyunca Google'da Kıdemli Yazılım Mühendisi olarak çalıştınız. Bu deneyimden edineceğiniz önemli çıkarımlar nelerdi?
Google'a katılmadan önce, Yandex Veri Analizi Okulu'ndan mezun olduktan hemen sonra Yandex'te dört yıldan fazla çalıştım. Orada, Yandex Taksi (Rusya'daki Uber'in benzeri) için çeşitli makine öğrenimi yöntemleri geliştiren bir ekibe liderlik ettim. Bu gruba ilk kurulduğunda katıldım ve hem personel sayısı (30'dan 500 kişiye) hem de pazar değeri (en büyük taksi hizmeti haline geldi) açısından dört yıl içinde hızla büyüyen, sıkı sıkıya bağlı ve hızlı tempolu bir ekipte çalışma şansı buldum. Rusya'daki sağlayıcı, Uber ve diğerlerini geride bırakıyor).
Bu süre zarfında pek çok şeyi sıfırdan inşa etme ve birçok projeyi sıfırdan bire hayata geçirme ayrıcalığına sahip oldum. Orada çalıştığım son projelerden biri hizmet desteği için sohbet robotları oluşturmaktı. Orada, büyük dil modellerinin gücünü ilk kez gördüm ve bunların gelecekte ne kadar önemli olabileceğine hayran kaldım. Bu farkındalık beni Google'a yönlendirdi ve burada daha sonra adı Google Bard (Perplexity'nin rakiplerinden biri) olarak değiştirilen Google Asistan ekibine katıldım.
Google'da birinci sınıf altyapının neye benzediğini, Arama ve Yüksek Lisans'ın nasıl çalıştığını ve gerçek ve doğru yanıtlar sağlamak için birbirleriyle nasıl etkileşime girdiklerini öğrenme fırsatım oldu. Bu harika bir öğrenme deneyimiydi, ancak zamanla Google'ın yavaş ilerlemesinden ve hiçbir şeyin yapılmadığı hissinden dolayı hayal kırıklığına uğradım. Arama ve Yüksek Lisans üzerine çalışan ve benim Yandex'de olduğum kadar hızlı, hatta daha hızlı hareket eden bir şirket bulmak istiyordum. Neyse ki bu organik olarak gerçekleşti.
Google'da dahili olarak Perplexity'nin ekran görüntülerini ve Google Asistan'ı Perplexity ile karşılaştırmayı gerektiren görevleri görmeye başladım. Bu, şirkete olan ilgimi artırdı ve birkaç hafta süren araştırmadan sonra orada çalışmak istediğime ikna oldum, bu yüzden ekibe ulaşıp hizmetlerimi teklif ettim.
Perplexity'deki mevcut rolünüzü ve sorumluluklarınızı tanımlayabilir misiniz?
Şu anda arama ekibinin başkanı olarak görev yapıyorum ve Perplexity'ye güç sağlayan dahili erişim sistemimizi oluşturmaktan sorumluyum. Arama ekibimiz bir web tarama sistemi, erişim motoru ve sıralama algoritmaları oluşturmaya çalışıyor. Bu zorluklar bana hem Google'da (Arama ve Yüksek Lisans'ta çalışarak) hem de Yandex'de edindiğim deneyimlerden yararlanmamı sağlıyor. Öte yandan Perplexity'nin ürünü, çok güçlü LLM'lerin olduğu bir dünyada bir erişim sisteminin nasıl görünmesi gerektiğini yeniden tasarlamak ve yeniden yapılandırmak için benzersiz fırsatlar sunuyor. Örneğin, tıklama olasılığını artırmak için sıralama algoritmalarını optimize etmek artık önemli değil; bunun yerine yanıtlarımızın yararlılığını ve gerçekçiliğini artırmaya odaklanıyoruz. Bu, yanıt motoru ile arama motoru arasındaki temel ayrımdır. Ekibim ve ben geleneksel 10 mavi bağlantının ötesine geçecek bir şey inşa etmeye çalışıyoruz ve şu anda üzerinde çalışmak için daha heyecan verici bir şey düşünemiyorum.
Perplexity'de metinden SQL'e dönüştürme aracı geliştirmekten yapay zeka destekli arama oluşturmaya geçiş sürecini detaylandırabilir misiniz?
Başlangıçta, yapılandırılmış verilerinize (örneğin bir e-tablo veya tablo) dayalı olarak hızlı bir yanıt almanız gereken durumlarda özel bir yanıt motoru sağlayan bir metinden SQL'e motor oluşturmaya çalıştık. Bir metinden SQL'e projesi üzerinde çalışmak, Yüksek Lisans ve RAG hakkında çok daha derin bir anlayış kazanmamıza olanak sağladı ve önemli bir gerçeğin farkına varmamızı sağladı: Bu teknoloji, başlangıçta düşündüğümüzden çok daha güçlü ve geneldir. İyi yapılandırılmış veri kaynaklarının çok ötesine geçebileceğimizi ve yapılandırılmamış verilerle de baş edebileceğimizi kısa sürede fark ettik.
Bu geçiş sırasındaki temel zorluklar ve içgörüler nelerdi?
Bu geçiş sürecindeki temel zorluklar, şirketimizi B2B'den B2C'ye taşımak ve altyapı yığınımızı yapılandırılmamış aramayı destekleyecek şekilde yeniden inşa etmekti. Bu geçiş sürecinde, müşteri odaklı bir ürün üzerinde çalışmanın çok daha keyifli olduğunu fark ettik çünkü sürekli bir geri bildirim ve etkileşim akışı almaya başlıyorsunuz. Bu, metinden SQL'e dönüştürme motoru geliştirip kurumsal çözümlere odaklandığımızda pek görmediğimiz bir şeydi.
Arama-artırılmış üretim (RAG), Perplexity'nin arama yeteneklerinin temel taşlarından biri gibi görünüyor. Perplexity'nin RAG'yi diğer platformlardan nasıl farklı kullandığını ve bunun arama sonucu doğruluğunu nasıl etkilediğini açıklayabilir misiniz?
RAG, bir Yüksek Lisans'a harici bilgi sağlamaya yönelik genel bir kavramdır. Fikir ilk bakışta basit görünse de, on milyonlarca kullanıcıya verimli ve doğru bir şekilde hizmet verecek böyle bir sistemi oluşturmak ciddi bir zorluktur. Bu sistemi kendi bünyemizde sıfırdan tasarlamak ve son hassaslık ve performansa ulaşmak için kritik olduğu kanıtlanan birçok özel bileşen oluşturmak zorunda kaldık. Sistemimizi, tek bir kullanıcının talebini hızlı ve uygun maliyetli bir şekilde karşılamak için onlarca LLM'nin (büyükten küçüğe) paralel olarak çalıştığı şekilde tasarladık. Ayrıca, LLM'leri uçtan uca arama ile birlikte eğitmemize olanak tanıyan bir eğitim ve çıkarım altyapısı oluşturduk, böylece sıkı bir şekilde entegre oldular. Bu, halüsinasyonları önemli ölçüde azaltır ve yanıtlarımızın yararlılığını artırır.
Google'ın kaynaklarıyla karşılaştırıldığında sınırlı imkanlara sahip olan Perplexity, rekabetçi kalmak ve güncel bilgileri garanti altına almak için web tarama ve dizinleme stratejilerini nasıl yönetiyor?
Google'ınki kadar kapsamlı bir dizin oluşturmak önemli miktarda zaman ve kaynak gerektirir. Bunun yerine, kullanıcılarımızın Perplexity'de sıklıkla sorduğu konulara odaklanıyoruz. Kullanıcılarımızın çoğunun Perplexity'yi iş/araştırma asistanı olarak kullandığı ve birçok sorgunun web'in yüksek kaliteli, güvenilir ve faydalı kısımlarını aradığı ortaya çıktı. Bu, 80/20 yaklaşımıyla önemli sonuçlar elde edebileceğiniz bir kuvvet yasası dağılımıdır. Bu içgörülere dayanarak, kalite ve doğruluk açısından optimize edilmiş çok daha kompakt bir dizin oluşturmayı başardık. Şu anda kuyruğu kovalamakla daha az zaman harcıyoruz, ancak altyapımızı ölçeklendirdikçe kuyruğu da takip edeceğiz.
Büyük dil modelleri (LLM'ler) Perplexity'nin arama yeteneklerini nasıl geliştirir ve bunları web'den bilgi ayrıştırma ve sunma konusunda özellikle etkili kılan şey nedir?
Yüksek Lisans'ları hem gerçek zamanlı hem de çevrimdışı işlemler için her yerde kullanıyoruz. Yüksek Lisans, web sayfalarının en önemli ve ilgili kısımlarına odaklanmamızı sağlar. Sinyal-gürültü oranını en üst düzeye çıkarma konusunda daha önce her şeyin ötesine geçiyorlar; bu da daha önce küçük bir ekip tarafından halledilemeyen birçok şeyin üstesinden gelmeyi çok daha kolay hale getiriyor. Genel olarak, bu belki de Yüksek Lisans'ın en önemli yönüdür: çok küçük bir ekiple karmaşık şeyler yapmanızı sağlarlar.
İleriye baktığımızda, Şaşkınlığın öngördüğü temel teknolojik veya pazar zorlukları nelerdir?
İleriye baktığımızda, bizim için en önemli teknolojik zorluklar, cevaplarımızın yararlılığını ve doğruluğunu geliştirmeye devam etmek etrafında yoğunlaşacak. Güvenilir bir şekilde cevaplayabileceğimiz sorgu ve soru türlerinin kapsamını ve karmaşıklığını artırmayı hedefliyoruz. Bununla birlikte, sistemimizin hızına ve servis verimliliğine çok önem veriyoruz ve ürünümüzün kalitesinden ödün vermeden servis maliyetlerini mümkün olduğunca aşağıya çekmeye odaklanacağız.
Sizce Perplexity'nin arama yaklaşımı, web sitelerini geri bağlantılara ve diğer kanıtlanmış arama motoru sıralama metriklerine göre sıralayan Google'ın yaklaşımından neden daha üstün?
Klasik arama motorlarından tamamen farklı bir sıralama metriğini optimize ediyoruz. Sıralama hedefimiz, geri alma sistemi ile LLM'leri yerel olarak birleştirmek için tasarlanmıştır. Bu yaklaşım, tıklama veya reklam gösterimi olasılığını optimize eden klasik arama motorlarından oldukça farklıdır.
Harika röportaj için teşekkürler, daha fazla bilgi edinmek isteyen okuyucular ziyaret etmelidir. şaşkınlık AI.












