Wawancara
Nikolaos Vasiloglou, Wakil Presiden Riset ML di RelationalAI – Seri Wawancara

Nikolaos Vasiloglou adalah Wakil Presiden Riset ML di RelationalAI. Ia telah menghabiskan karirnya dengan membangun perangkat lunak ML dan memimpin proyek ilmu data di Retail, Iklan Online, dan Keamanan. Ia adalah anggota komunitas ICLR/ICML/NeurIPS/UAI/MLconf/KGC/IEEE S&P, telah bertugas sebagai penulis, pengulas, dan penyelenggara Lokakarya dan konferensi utama. Nikolaos memimpin penelitian dan inisiatif strategis di persimpangan Large Language Models dan Knowledge Graphs untuk RelationalAI.
RelationalAI adalah perusahaan AI yang membangun platform kecerdasan keputusan yang dirancang untuk membantu organisasi melampaui analisis data menuju pengambilan keputusan otomatis yang berkualitas tinggi. Teknologinya terintegrasi langsung dengan lingkungan data seperti Snowflake, menggabungkan basis data relasional, grafik pengetahuan, dan sistem penalaran lanjutan untuk menciptakan “model semantik” dari bisnis – secara esensial mengkodekan bagaimana perusahaan beroperasi, hubungannya, dan logikanya. Ini memungkinkan sistem AI (termasuk agen keputusan seperti “Rel”) untuk beralasan atas data yang kompleks dan terhubung, serta menghasilkan wawasan prediktif dan preskriptif, memungkinkan perusahaan untuk membuat keputusan yang lebih cepat dan lebih tepat tanpa memindahkan data mereka ke luar lingkungan awan yang aman.
Anda telah memiliki jalur karir yang langka yang meliputi pembelajaran mesin akademis, penerapan industri skala besar, dan peran kepemimpinan di perusahaan seperti Symantec, Aisera, dan sekarang RelationalAI. Bagaimana pengalaman tersebut membentuk perspektif Anda tentang di mana penelitian pembelajaran mesin bertemu dengan sistem dunia nyata saat ini?
Saya beruntung dapat terlibat dengan domain bisnis yang berbeda, dari ritel dan keamanan, hingga iklan online. Itu membantu saya memahami bagaimana pembelajaran mesin dan AI menjadi penyebut umum. Kami tahu sejak awal 2000-an bahwa perangkat lunak sedang “memakan” dunia, data sedang “memakan” kecerdasan keputusan, namun sedikit perusahaan, termasuk Google, percaya bahwa algoritma pembelajaran mesin yang canggih akhirnya akan “memakan” semuanya. Kembali pada 2008, peserta NeurIPS dianggap sebagai “nerd” dan “pemimpi” yang tidak memahami dunia nyata, hanya orang yang suka bermain-main dengan “mainan”. Itu benar sampai titik tertentu, tetapi saya percaya bahwa ini ada pada trajektori untuk berubah. Tidak seperti yang lain, saya tidak menyerah pada aktif berpartisipasi dalam transisi penelitian akademis ke industri.
Analisis Anda tentang NeurIPS 2025 menggunakan asisten pengkodean seperti Claude Code, OpenAI Codex, dan NotebookLM untuk memproses konferensi seluruhnya. Apa yang paling mengejutkan Anda tentang menggunakan sistem AI untuk menganalisis penelitian AI itu sendiri?
Sangat mudah untuk membangun perangkat lunak untuk mengambil data, membacanya dengan mesin, dan mengategorikannya ke dalam bagian dan bahkan merangkum serta menjelaskannya dengan cara yang sangat intuitif. Sistem GenAI luar biasa dalam menceritakan sebuah cerita, tetapi tidak menceritakan cerita. NotebookLM adalah ratu menganalisis domain apa pun dan menghasilkan hasil yang luar biasa. Namun, Anda tidak memiliki kontrol atas cerita, grafik, atau penekanan. Saya belajar bahwa alat tersebut tidak bagus dalam membuat slide PowerPoint, sehingga saya harus membangun HTML dan kemudian mengonversinya ke PDF. Tantangan terbesar adalah membuat gambar – generasi difusi terlalu lambat, tidak dapat diandalkan, dan mahal, tanpa kontrol. Mengejutkan, model tersebut cukup baik dalam membuat SVG secara programatis dengan matplotlib, plotly, dan perpustakaan Python lainnya. Teknik itu skalabel, tetapi memerlukan beberapa kali untuk memperbaiki kesalahan visualisasi. Model tersebut akan menjadi lebih baik tahun depan.
Salah satu tema terkuat dalam analisis Anda adalah pergeseran dari skala waktu pelatihan ke komputasi waktu inferensi. Mengapa komputasi waktu uji coba muncul sebagai tuas yang sangat kuat untuk meningkatkan kinerja model?
Hukum skala adalah kompas kita. Meningkatkan ukuran model dan data pra-pelatihan telah mencapai kapasitasnya. Generasi pertama hukum skala membawa kita hingga GPT-4. Mereka adalah yang membantu OpenAI untuk memulai revolusi GenAI. Kami segera menyadari bahwa ada dimensi lain yang memungkinkan model untuk menghasilkan banyak token sebelum mencapai jawaban. Ini adalah cara lain untuk meningkatkan efisiensi LLM. Ukuran model dan panjang penalaran sering diekspresikan sebagai mode pemikiran Sistem 1 dan Sistem 2 (Daniel Kahneman). Jejak penalaran adalah cara lain untuk meningkatkan kapasitas model. Jika Anda memikirkan tentang hal itu, terobosan dari manusia dimulai dari insting (IQ tinggi), tetapi kesuksesan selalu karena penalaran yang panjang dan menyakitkan. Kami melihat pola ini: Model yang lebih kecil dengan jendela pemikiran yang panjang mengungguli model yang 100 kali lebih besar. Jadi, pemikiran lebih penting daripada IQ dalam LLM.
Anda menyoroti transisi dari model monolitik ke sistem agenik yang mampu merencanakan, bertindak, dan memverifikasi outputnya. Seberapa dekat kita dengan AI agenik menjadi paradigma produksi yang dapat diandalkan daripada prototipe penelitian?
Kami membuat kemajuan besar dalam arah itu. Masalah terbesar adalah keandalan dan keamanan, sehingga kami dapat mempercayainya untuk beroperasi secara otonom. Jika Anda melihat lebih dekat konten NeurIPS, Anda akan melihat sistem otonom yang melakukan penelitian, memecahkan masalah matematika, dan memecahkan masalah pengkodean, tetapi Anda tidak melihat mobil otonom, misalnya. Pengalaman terbaru dengan Moltbook (jaringan sosial untuk agen AI) menyoroti masalah AI agenik otonom. Namun, menemukan obat dan bahan baru dengan AI agenik sangat besar, jadi mari kita rayakan dan fokus pada itu untuk saat ini.
Kemampuan tampaknya menjadi penggerak inovasi utama, dengan model yang lebih kecil mencapai kinerja kompetitif melalui perbaikan arsitektur dan strategi inferensi yang lebih cerdas. Apakah kita memasuki era di mana terobosan efisiensi lebih penting daripada ukuran model mentah?
Ketika AI berkembang ke produksi, rekayasa menjadi lebih penting. Mengandalkan model frontier tidak berkelanjutan. Ini bagus untuk demo, tetapi perusahaan menghadapi kenyataan pahit ketika mereka melihat biaya model besar. Untuk pertama kalinya, model yang lebih kecil telah menjadi solusi yang lebih layak. Ada kekuatan diam yang mengubah status quo industri. Sampai sekarang, NVIDIA telah memiliki monopoli GPU dan menjaga harga tetap tinggi. AMD sedang membuat jalan di pasar dengan chip berkualitas tinggi dan itu akan memaksa harga turun. Energi terus menjadi masalah, tetapi kami melihat beberapa pergerakan di pasar. Ketika laboratorium frontier menjadi lebih mahal, solusi model yang lebih kecil di GPU yang disewa telah menjadi lebih layak.
Presentasi Anda menunjukkan bahwa bidang ini telah bergeser dari skala waktu pelatihan tunggal (parameter) ke skala multi-dimensi yang melibatkan parameter, data, arsitektur, dan inferensi. Bagaimana peneliti dan praktisi harus memikirkan paradigma skala baru ini?
Bagi sebagian besar profesional, arsitektur dan parameter berada di luar kendali mereka. Pembuat model yang memiliki modal yang diperlukan akan mengarahkan inovasi. Panjang inferensi token akan ditentukan oleh pengeluaran capex organisasi. Yang tersisa di bawah kendali mereka adalah data. Kami akan melihat lebih banyak fokus pada membuat, mengkurasi, dan memecahkan data (jejak penalaran sebagian besar waktu). Ini akan menjadi fokus operasional sehari-hari. Tentu saja, mereka perlu mengikuti NeurIPS dan konferensi besar lainnya untuk tetap mendapatkan tren arsitektur baru.
Dalam sintesis NeurIPS Anda, Anda menunjukkan bahwa bagian yang semakin besar dari penelitian fokus pada penemuan ilmiah yang digerakkan AI, mulai dari biologi hingga pemodelan iklim. Apakah Anda melihat AI-untuk-sains sebagai frontier utama berikutnya untuk penelitian pembelajaran mesin?
Saya pikir itu melampaui penelitian akademis. Kami sedang melihat demam emas berikutnya. Pada 1849, demam emas di California mencapai puncaknya. Semua yang harus dilakukan orang adalah terus-menerus menyaring air sungai untuk menemukan emas. Kami tahu sekarang bahwa banyak orang tidak menemukan emas, tetapi apa yang kita lihat sekarang sangat nyata. Saya dapat melihat gelombang besar dari startup dua atau tiga orang yang menggunakan model bahasa untuk menemukan bahan, obat, dan komponen produk baru. Membakar token dengan cara paling cerdas dapat membawa hasil yang besar. Asisten pengkodean seperti Claude Code, OpenAI Codex, dan Google Antigravity dapat menghilangkan hambatan untuk perusahaan SaaS, meninggalkan generasi baru ilmuwan komputer yang sangat mampu dalam pencarian ilmiah. Jika Anda bekerja untuk organisasi nirlaba seperti First Principles, atau Bio[hub], ada kesempatan untuk menemukan hukum fisika dan teori baru, atau kontribusi lain dalam biologi. Jika Anda ingin menghasilkan pendapatan, Anda akan bekerja pada penemuan produk baru berdasarkan sains, seperti farmasi, bahan, baterai, dll.
Penelitian Anda juga menyoroti celah verifikasi yang semakin besar, di mana model mencapai skor benchmark yang kuat tetapi gagal pada variasi dunia nyata yang sederhana. Apa yang celah ini ungkapkan tentang keterbatasan model bahasa besar saat ini?
Mereka tampaknya memiliki memori yang luar biasa dan dapat menggeneralisasi dengan baik. Benchmark sangat baik pada awal penelitian. Setelah Anda melewati ambang, Anda belajar benchmark dan tidak masalah. Kami telah sangat baik selama bertahun-tahun untuk mereset benchmark dan membuatnya lebih sulit untuk mendorong batas. Masalah dengan benchmark adalah bahwa pada titik tertentu, kami mulai overindexing dan akhirnya curang. Seluruh tren di sini adalah untuk membuat pesaing lebih jujur. Saya pribadi tidak terlalu memperhatikan benchmark setelah beberapa lompatan terjadi. Anda dapat memiliki produk yang baik yang tidak bahkan ada di sepuluh besar papan peringkat. Saya juga telah melihat banyak produk yang tidak seimbang yang sangat baik dalam benchmark.
Presentasi Anda menunjukkan bahwa model bahasa kecil yang dikombinasikan dengan skala inferensi dan arsitektur agenik dapat memungkinkan sistem AI yang kuat yang berjalan di luar pusat data hyperscale. Apakah desentralisasi ini dapat mengubah cara AI diterapkan di seluruh industri?
Kami melihat penekanan besar pada penerapan edge. Kami akan melihat perangkat yang lebih pintar di sekitar kita. Microsoft telah bekerja selama bertahun-tahun pada 1bit LLM, yang mencapai sekitar 30x kompresi, memungkinkannya untuk berjalan bahkan model frontier pada satu chip di masa depan. Kami telah melacak pekerjaan ini selama bertahun-tahun dan kemajuan itu luar biasa. Terutama di domain wearable.
Sesuatu yang dibahas di NeurIPS tahun lalu adalah ide menggabungkan model edge yang lemah dengan model frontier. Ini memungkinkan Anda untuk menyesuaikan kekuatan inferensi Anda berdasarkan bandwidth Anda dalam spektrum yang berkelanjutan. Workshop Telco pertama di NeurIPS mengungkapkan tren menuju penempatan GPU pada menara sel, yang menarik karena menara sel tidak merupakan pusat data atau perangkat edge. Itu memperkenalkan lapisan baru dalam hierarki komputasi.
Sesuatu yang lain yang keluar dari LLM adalah pelatihan model terdistribusi (dan saya tidak bermaksud Google melatih Gemini di pusat data jarak jauh.) Ada tren yang sangat menarik yang sedang meningkat pada entitas independen yang melatih model mereka sendiri dan pengguna menggabungkannya seperti Lego untuk membangun yang lebih besar dan lebih kuat. Ini adalah arsitektur modular yang sangat menjanjikan. Ini adalah bagaimana model besar dilatih. Tim yang berbeda membangun model khusus, dan pada akhirnya, mereka menyatukannya seperti blok Lego.
Setelah menganalisis ribuan kertas NeurIPS, di mana Anda pikir komunitas penelitian AI secara akurat memprediksi kemajuan, dan di mana mungkin mereka melewatkan pergeseran paling penting yang akan datang?
Komunitas penelitian tidak membuat prediksi. Peneliti memiliki penggerak mereka sendiri, rasa ingin tahu, pendanaan, kebetulan, dan tentu saja, insting. Mereka dapat selalu melewatkan arah yang menarik, tetapi hampir pasti seseorang akan menemukannya dan mengambilnya pada suatu titik di masa depan. Itu diharapkan dan itu sehat. Eksekutif, investor, dan insinyur diperlukan untuk mengidentifikasi tren yang muncul sehingga mereka dapat membuat keputusan yang tepat dan mengambil taruhan yang paling berpendidikan. Dalam jendela analisis lima tahun saya, ada tren yang diambil awal, dan sinyal lain yang terlewatkan. Untuk beberapa di antaranya, masih ada waktu untuk menunggangi gelombang alpha.
Pasar data adalah sesuatu yang telah saya amati selama bertahun-tahun, dan mereka baru saja melompat tahun ini. Komponen yang hilang adalah atribusi. Kami sekarang dapat mengidentifikasi data pelatihan yang berkontribusi pada kompetisi LLM secara langsung. Itu berarti Anda dapat membayar dividen. Ini telah menjadi kesempatan yang terlewatkan dari penerbit yang sedang dalam tindakan hukum dengan model frontier. Beberapa di antaranya harus menyerah pada perjanjian lisensi datar, sedangkan saya percaya mereka memiliki kesempatan untuk menghasilkan pendapatan yang lebih berkelanjutan dari model atribusi.
Ada revolusi yang akan datang dalam robotika. Model dunia yang diumumkan oleh NVIDIA dan lainnya melakukan simulasi fisik yang sangat akurat dan skalabel. Jadi, harapkan AI untuk menjadi lebih fisik di masa depan.
Arsitektur transformer akhirnya bergabung dengan model ruang keadaan seperti RNN, mamba, dll dan telah menghasilkan LLM kecil yang luar biasa. Kami sekarang tahu keterbatasan pasti dari transformer yang memainkan peran besar dalam kinerja, tetapi kami masih melewatkan langkah berikutnya. Itu akan datang ketika transformer telah terbukti sangat tangguh dan cukup tangguh. Apa yang kami tidak tahu adalah apakah itu akan menjadi manusia atau transformer yang merancang arsitektur baru dari LLM! Transformer menyatukan semua arsitektur yang terfragmentasi dalam NLP (ya, jangan lupa bahwa GenAI dimulai dari tugas NLP dasar, seperti klasifikasi entitas). Itu berhasil untuk matematika, tahun ini itu berhasil untuk tabel, tetapi itu belum berhasil untuk fisika. Saya menghitung lebih dari 15 arsitektur yang berbeda. Jadi, arsitektur baru yang menyatukan fisika mungkin juga merupakan yang akan menggantikan transformer dalam perjalanan AGI. Saya menghitung lebih dari 15 arsitektur yang berbeda. Jadi, arsitektur baru yang menyatukan fisika mungkin juga merupakan yang akan menggantikan transformer dalam perjalanan AGI. Saya menghitung lebih dari 15 arsitektur yang berbeda. Jadi, arsitektur baru yang menyatukan fisika mungkin juga merupakan yang akan menggantikan transformer dalam perjalanan AGI. Saya menghitung lebih dari 15 arsitektur yang berbeda. Jadi, arsitektur baru yang menyatukan fisika mungkin juga merupakan yang akan menggantikan transformer dalam perjalanan AGI.
Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi RelationalAI.












