Röportajlar
RelationalAI’den Araştırma ve Geliştirme Başkan Yardımcısı Nikolaos Vasiloglou – Röportaj Serisi

Nikolaos Vasiloglou RelationalAI’de Araştırma ve Geliştirme Başkan Yardımcısıdır. Kariyerini perakende, online reklamcılık ve güvenlik gibi sektörlerde makine öğrenimi yazılımları geliştirmeye ve veri bilimi projelerini yönetmeye adamıştır. ICLR/ICML/NeurIPS/UAI/MLconf/KGC/IEEE S&P topluluğunun bir üyesidir ve yazar, incelemeçi ve atölye ve ana konferans organizatörü olarak görev yapmıştır. Nikolaos, RelationalAI’de Büyük Dil Modelleri ve Bilgi Grafikleri arasındaki kesişme noktalarında araştırma ve stratejik girişimlere liderlik etmektedir.
RelationalAI bir entreprise AI şirketi olup, karar zekası platformu geliştirmeye odaklanmıştır. Bu platform, organizasyonların veri analizi ötesinde, otomatik ve yüksek kaliteli karar vermeye geçmesine yardımcı olmak üzere tasarlanmıştır. Teknolojisi, Snowflake gibi veri ortamlarıyla doğrudan entegre olur ve ilişkisel veritabanları, bilgi grafikleri ve gelişmiş akıl yürütme sistemlerini birleştirerek bir şirketin işleyişini, ilişkilerini ve mantığını kodlayan bir “anlamsal model” oluşturur. Bu, AI sistemlerinin (örneğin “Rel” gibi karar ajanları) karmaşık, birbirine bağlı verileri üzerinde akıl yürütmesine ve öngörüler ve reçeteler oluşturmasına olanak tanır, böylece şirketlerin daha hızlı ve daha bilgili kararlar almasına olanak tanır, bu da verilerini güvenli bulut ortamları dışına çıkarmadan yapılır.
Akademik makine öğrenimi, büyük ölçekli endüstriyel dağıtımlar ve şirketlerdeki liderlik rolleri gibi nadir bir kariyer yoluna sahipsiniz. Bu deneyimler, makine öğrenimi araştırmasının gerçek dünya sistemleriyle nasıl kesiştiği konusunda sizin perspektifinizi nasıl şekillendirdi?
Perakende, güvenlik ve online reklamcılık gibi farklı iş kollarıyla etkileşime girmekle şanslıydım. Bu, makine öğrenimi ve AI’nin ortak bir payda olarak nasıl işlediğini anlamamı sağladı. 2000’lerin başından itibaren yazılımların dünyanın geri kalanını yutacağını ve verilerin karar zekasını yutacağını biliyorduk, ancak birkaç şirket, Google dahil, gelişmiş makine öğrenimi algoritmalarının sonunda her şeyi yutacağına inanıyordu. 2008’de NeurIPS katılımcıları, gerçek dünya hakkında anlamayan, sadece oyuncaklarla oynamayı seven “nerd” ve “hayalperest” olarak görülüyordu. Bir noktaya kadar doğruydu, ancak ben bunun değişime doğru bir yolculukta olduğumu düşünüyordum. Diğerlerinin aksine, akademik araştırmaların endüstriye geçişine aktif olarak katılmaktan vazgeçmedim.
NeurIPS 2025 analiziniz, kod asistanları gibi Claude Code, OpenAI Codex ve NotebookLM’yi kullanarak konferansın tamamını işledi. AI araştırmalarını analiz etmek için AI sistemlerini kullanırken en çok ne şaşırttı?
Verileri kazımak, makine tarafından okumak ve özellikle sezgisel bir şekilde özetlemek ve açıklamak için yazılım oluşturmak şaşırtıcı derecede kolaydı. GenAI sistemleri bir hikaye anlatmakta harikalar, ancak hikayeyi anlatmakta değil. NotebookLM herhangi bir alanı analiz etmekte ve inanılmaz sonuçlar sunmakta çok iyidir. Ancak hikayenin kontrolü, grafiklerin kontrolü veya vurgunun kontrolü yoktur. Öğreniyorum ki bu araçlar PowerPoint sunuları oluşturmada çok iyi değil, bu nedenle HTML oluşturup daha sonra bunları PDF’ye dönüştürmek zorunda kaldım. En büyük zorluk, şekilleri oluşturmaktı – difüzyon oluşturma çok yavaş, güvensiz ve pahalıydı ve kontrol yoktu. Şaşırtıcı bir şekilde modeller, matplotlib, plotly ve diğer Python kütüphaneleriyle programlı olarak SVG’ler oluşturmada çok iyiler. Bu teknik ölçeklendi, ancak görsel hataları düzeltmek için birkaç geçiş gerektirdi. Modeller gelecek yıl daha da iyi olacak.
Analizinizin en güçlü temalarından biri, eğitim-zamanı ölçeklemesinden çıkarım-zamanı hesaplama ölçeklemesine geçişidir. Test-zamanı hesaplama neden model performansı iyileştirmek için böyle güçlü bir kaldıraç haline geliyor?
Ölçekleme yasaları bizim pusulamız. Model boyutunu ve ön eğitime veri miktarını artırmak kapasitesini doldurdu. İlk nesil ölçekleme yasaları bizi GPT-4’e kadar getirdi. Bunlar, OpenAI’nin GenAI devrimini başlatmasına yardımcı olanlardı. Daha sonra, modelin birçok token üretmeden önce cevap vermesini sağlayan başka bir boyut olduğunu fark ettik. Bu, LLM’lerin verimliliğini artırmak için başka bir yoldur. Model boyutu ve akıl yürütme uzunluğu genellikle Sistem 1 ve Sistem 2 düşünce modları (Daniel Kahneman) olarak ifade edilir. Akıl yürütme izleri model kapasitesini artırmak için başka bir yoldur. Bunun insanlardaki başarılara benzeyen bir kalıp olduğunu düşünüyorum – yüksek IQ, ancak başarı her zaman uzun ve zorlu akıl yürütmeye bağlıydı. Küçük modellerin uzun düşünme pencereleri, 100 kat daha büyük modelleri geride bırakabilir. Yani LLM’lerde düşünme, zekadan daha önemli.
Monolitik modellerden planlama, eylem ve çıktı doğrulama yeteneklerine sahip ajans sistemlerine geçişe dikkat çekiyorsunuz. Ajans AI’nin güvenilir bir üretim paradigmalarına dönüşmesi için ne kadar yakınız?
Bu yönde büyük adımlar atıyoruz. En büyük sorunlar güvenilirlik ve güvenlik, böylece onlara otomatik olarak güvenebilelim. NeurIPS içeriğine yakından bakarsanız, araştırma yapan, matematik problemlerini çözen ve kodlama problemlerini çözen otonom sistemleri göreceksiniz, ancak örneğin otonom bir sürücüsüz araba görmeyeceksiniz. Moltbook (AI ajanları için bir sosyal ağ) ile yapılan son deney, otonom ajans AI’nin sorunlarını vurguladı. Ancak yeni ilaçlar ve malzemeler keşfetmek için ajans AI ile çalışmak büyük. Bu konuda sevinmek ve ilerlemek için yeterli.
Verimlilik, daha küçük modellerin mimari geliştirmeler ve daha akıllı çıkarım stratejileri yoluyla rekabetçi performans elde etmesini sağlayan bir ana itici güç gibi görünüyor. Raw model boyutundan daha önemli olan verimlilik atılımlarına doğru mu gidiyoruz?
AI üretim ölçeğine ulaştığında, mühendislik daha önemli hale geliyor. Frontier modellerine güvenmek sürdürülemez. Demo için iyidir, ancak şirketler büyük modellerin yüksek maliyetiyle karşılaşırlar. İlk kez küçük modeller daha uygulanabilir bir çözüm haline geldi. Endüstrinin statükosunu değiştiren sessiz bir güç var. NVIDIA’nın GPU tekelini elinde tutması ve fiyatları yüksek tutması vardı, ancak AMD pazarına giriyor ve fiyatları düşürecek. Enerji hala bir sorun, ancak pazar hareket ediyor. Frontier laboratuvarları daha pahalı hale geldikçe, küçük modelleri kiralık GPU’lar üzerinde çalıştırmak daha uygulanabilir bir çözüm haline geliyor.
Sunumunuz, parametreler, veri, mimari ve çıkarım dahil olmak üzere çok boyutlu bir ölçekleme paradigmalarına geçişe işaret ediyor. Araştırmacılar ve uygulayıcılar bu yeni ölçekleme paradigmalarına nasıl yaklaşmalı?
Çoğu profesyonel için mimari ve parametreler kontrol dışında kalıyor. Model üreticileri, gerekli sermayeye sahip olanlar, inovasyonu sürdürecek. Token çıkarım uzunluğu, organizasyonun sermaye harcamalarına bağlı olacak. Kontrolleri altında kalan veri üzerinde odaklanacaklar. Veri oluşturma, küratörlüğü ve hata ayıklama (çoğunlukla akıl yürütme izleri) üzerinde odaklanılacak. Bu, günlük operasyonların odağı olacak. Tabii ki NeurIPS ve diğer büyük konferansları takip etmek, yeni mimarilerin trendlerini takip etmek için gerekecek.
NeurIPS sentezinizde, AI destekli bilimsel keşiflere odaklanan araştırmaların artan bir payına dikkat çekiyorsunuz. Makine öğrenimi araştırması için AI-for-bilimi bir sonraki büyük cephe mi?
Sanırım bu akademik araştırmaların ötesine geçiyor. Bir sonraki altın çağını görüyoruz. 1849’da Kaliforniya’da altın rush zirveye ulaştı. İnsanların yapması gereken, sadece nehir suyunu süzerek altın bulmaktı. Bugün gördüğümüz çok gerçek. İki veya üç kişilik startup’ların dil modellerini kullanarak yeni malzemeler, ilaçlar ve ürün bileşenleri bulmalarını görebiliyorum. Akıllıca token yakmak büyük kazançlar getirebilir. Kod asistanları gibi Claude Code, OpenAI Codex ve Google Antigravity, SaaS şirketleri için engeli kaldırabilir, böylece çok yetenekli bilgisayar bilimcileri bilimsel aramaya odaklanabilir. Bir kâr amacı gütmeyen kuruluş gibi First Principles veya Bio[hub] için çalışıyorsanız, yeni fizik yasaları ve teorileri veya biyolojide katkılar bulunabilir. Gelir elde etmek istiyorsanız, bilim temelinde yeni ürünler icat edeceksiniz – ilaçlar, malzemeler, piller vb.
Çalışmanız ayrıca, modellerin güçlü benchmark puanları elde etmesine rağmen basit gerçek dünya varyasyonlarında başarısız olmasına neden olan artan bir doğrulama açığını vurguluyor. Bu açıklama, büyük dil modellerinin当前 sınırlarını ne hakkında bilgi veriyor?
Harika bir hafızaları var ve genellemeye iyi bir şekilde uyarlanabiliyorlar. Benchmark’lar araştırma başlangıcında iyidir. Bir eşiği geçtiğinizde, benchmark’u öğrenirsiniz, sorunu değil. Benchmark’ları daha zor hale getirmek ve sınırları zorlamak için çok iyi olduk. Benchmark’ların sorunu, bir noktada aşırı odaklanmaya ve hile yapmaya başlıyoruz. Burada trend, rakipleri daha dürüst hale getirmek. Benim için benchmark’lar, birkaç atılım olduktan sonra, çok önemli değil. İyi bir ürünün, liderlik sıralamasında ilk ona girmesi gerekmez. Benchmark’lara iyi olan, ancak ürün olarak subpar olan birçok ürün gördüm.
Sunumunuz, küçük dil modellerinin çıkarım ölçeklemesiyle birleştirilmesinin ve ajans mimarileriyle donatılmasının, hyperscale veri merkezleri dışında çalışan güçlü AI sistemlerini mümkün kılabileceğini öne sürüyor. Bu merkezileştirme, AI’nin endüstriler genelinde dağıtımını yeniden şekillendirebilir mi?
Kenar dağıtımı üzerinde büyük bir vurguya tanık olacağız. Çevremizde daha akıllı cihazlar göreceğiz. Microsoft, 1bit LLM üzerinde yıllarca çalıştı ve yaklaşık 30 kat sıkıştırma elde etti, bu da gelecekte tek bir çip üzerinde even frontier modellerini çalıştırmasına olanak tanıyacak. Bu çalışmayı yıllarca takip ediyoruz ve ilerleme şaşırtıcı. Özellikle giyilebilir cihazlar alanında.
Geçen yılın NeurIPS’inde weak kenar modellerini frontier modelleriyle birleştirmek fikri vardı. Bu, bant genişliğinize bağlı olarak çıkarım gücünüzü sürekli bir spektrumda ayarmanıza olanak tanır. NeurIPS’teki ilk Telco Atölyesi, cell tower’larına GPU’lar yerleştirme eğilimini ortaya koydu, bu da ilginçtir, çünkü cell tower neither bir veri merkezi ne de bir kenar cihazıdır. Bu, hesap hiyerarşisinde yeni bir katman ekler.
LLM’lerden kaçan bir başka şey, dağıtılmış model eğitimi (ve Google’nin Gemini’yi uzak veri merkezlerinde eğitmesini kastetmiyorum). Bağımsız varlıkların kendi modellerini eğittiği ve kullanıcıların bunları Lego gibi birleştirdiği çok ilginç bir trend var. Bu, çok büyük bir vaat edilen modüler mimari. Büyük modeller böyle eğitilir. Farklı takımlar uzmanlaşmış modeller oluşturur ve sonunda bunları Lego blokları gibi birleştirirler.
Binlerce NeurIPS makalesini analiz ettikten sonra, AI araştırmaları topluluğunun ilerlemeyi nerede doğru bir şekilde öngördüğünü ve nerede en önemli gelecek değişikliklere dikkat etmediğini düşünüyorsunuz?
Araştırma topluluğu öngörülerde bulunmaz. Araştırmacılar kendi sürücülere, merak, fon, serendipite ve elbette içgüdüye sahipler. İlginç yönleri kaçırabilirler, ancak kesinlikle jemand bunu bulacak ve gelecekte bir noktada üzerine alacak. Bu beklenen ve sağlıklıdır. Yöneticiler, yatırımcılar ve mühendisler, doğru kararlar alabilmek ve en eğitimli bahisleri yapabilmek için ortaya çıkan trendleri tanımlamak zorundadır. 5 yıllık analiz penceresimde, bazı trendler erken yakalandı, diğer sinyaller kaçırıldı. Bazıları için hala alpha dalgasına binmek için zaman var.
Veri piyasaları yıllarca izlediğim bir şey ve bu yıl sonunda atladı. Eksik olan bileşen, atıf idi. Artık LLM yarışmalarına katkıda bulunan eğitim verilerini gerçek zamanlı olarak tanımlayabiliyoruz. Bu, dividend ödemelerine olanak tanır. Bu, frontier modelleriyle davalara karışan yayıncılar için kaçırılmış bir fırsattı. Bazıları, flat lisans anlaşmalarına teslim olmak zorunda kaldı, ancak ben onların bir atıf modelinden daha sürdürülebilir gelir elde etme fırsatına sahip olduklarını düşünüyorum.
Robotikte bir devrim geliyor. NVIDIA ve diğerlerinin duyurduğu dünya modelleri, fizik simülasyonunda çok doğru ve ölçeklenebilir. AI’nin daha fiziksel hale geleceğini bekleyebiliriz.
Transformer mimarisi sonunda RNN’ler, mamba gibi durum uzay modelleriyle birleşti ve harika küçük LLM’ler üretti. Transformer’in performansında büyük bir rol oynayan sınırlamalarını şimdi biliyoruz, ancak bir sonraki adımı bilmiyoruz. Bu, transformer’in kanıtlanmış bir şekilde dayanıklı ve esnek olduğu zaman gelecek. Yeni bir LLM mimarisinin mimarının insan mı yoksa transformer mi olacağı bilinmez. Transformer, NLP’de (NLP’den başlayan GenAI’yi unutmayın) parçalı mimarileri birleştirdi. Matematik için çalıştı, bu yıl tablolar için çalıştı, ancak fizik için çalışmadı. Fizik birleştiren yeni mimarinin, AGI yolculuğunda transformer’i değiştirebileceğini düşünüyorum.
Harika bir röportaj için teşekkür ederiz, daha fazla bilgi öğrenmek isteyen okuyucular RelationalAI‘yi ziyaret edebilir.












