Wawancara
Manuel Romero, Co-Founder and Chief Scientific Officer di Maisa – Interview Series

Manuel Romero, Co-Founder dan Chief Scientific Officer di Maisa, adalah seorang peneliti dan insinyur AI yang berfokus pada pengembangan sistem kecerdasan buatan yang andal dan kelas perusahaan. Dia mendirikan Maisa pada tahun 2024 untuk membangun AI yang dapat dipertanggungjawabkan, yang mampu menjalankan proses bisnis kompleks dengan transparansi dan kendali. Sebelum Maisa, Romero memegang peran senior di bidang teknik AI dan pembelajaran mesin di perusahaan-perusahaan termasuk Clibrain dan Narrativa, di mana dia berspesialisasi dalam pemrosesan bahasa alami dan sistem AI skala besar. Di awal karirnya, dia bekerja sebagai insinyur perangkat lunak *full-stack* dan spesialis DevOps sebelum beralih ke penelitian dan pengembangan AI tingkat lanjut, menjadi kontributor aktif bagi ekosistem AI sumber terbuka. Maisa AI mengembangkan “pekerja digital” otonom, yaitu agen AI yang dirancang untuk mengotomatisasi alur kerja perusahaan yang kompleks sambil menjaga kemampuan pelacakan, tata kelola, dan keandalan. Platform ini memungkinkan organisasi untuk membangun dan menerapkan agen AI menggunakan bahasa alami, memungkinkan otomatisasi di seluruh sistem internal dan sumber data tanpa pengkodean yang ekstensif. Dengan berfokus pada penalaran yang dapat diverifikasi dan eksekusi terstruktur, Maisa bertujuan untuk mengatasi keterbatasan umum yang terkait dengan sistem AI generatif dan membantu perusahaan menerapkan AI otonom secara aman dalam skala besar. Anda sering berfokus pada pemahaman “alasan” yang lebih mendalam di balik sistem AI. Dari sudut pandang teknis, apa yang mendorong Anda untuk mendirikan Maisa pada tahun 2024, dan celah apa dalam arsitektur AI perusahaan yang menurut Anda belum ditangani? Motivasi di balik pendirian Maisa berasal dari kesadaran bahwa sebagian besar tumpukan AI perusahaan dibangun di sekitar model, bukan sistem. Selama ledakan AI generatif, banyak perusahaan berfokus pada integrasi model bahasa besar ke dalam alur kerja yang ada. Namun, sistem ini sering kali rapuh, tidak transparan, dan sulit dioperasikan dalam skala besar. Mereka kekurangan:
- eksekusi deterministik di area yang penting.
- observabilitas dan kemampuan pelacakan yang kuat
- reproduktibilitas
Celah yang kami lihat adalah tidak adanya infrastruktur AI sejati untuk perusahaan. Perusahaan-perusahaan membangun aplikasi di sekitar API LLM, tetapi mereka kekurangan sesuatu yang setara dengan arsitektur komputer untuk pekerjaan berbasis pengetahuan. Maisa dibuat untuk mengatasi celah tersebut dengan merancang arsitektur yang berpusat pada Knowledge Processing Unit (KPU), sebuah sistem yang memungkinkan AI beroperasi secara andal di dalam alur kerja perusahaan yang nyata. Anda telah bekerja di bidang pemrosesan bahasa alami tingkat lanjut dan sistem generatif sebelum mendirikan Maisa. Bagaimana pengalaman-pengalaman tersebut membentuk pilihan arsitektur di balik platform ini? Pengalaman saya bekerja di bidang NLP dan NLG, khususnya seputar pelatihan dan pra-pelatihan model bahasa dan kemudian model bahasa besar (ratusan model), membuat sesuatu menjadi sangat jelas ketika mencoba membangun sistem nyata di atasnya. Arsitektur transformer sangatlah kuat, tetapi setidaknya datang dengan tiga keterbatasan mendasar yang harus diatasi untuk menggunakannya secara andal dalam produksi. Yang pertama adalah halusinasi. Model-model ini menghasilkan teks secara probabilistik dan dapat menghasilkan keluaran yang terdengar benar tetapi tidak didasarkan pada informasi yang diverifikasi. Yang kedua adalah keterbatasan konteks. Bahkan dengan jendela konteks yang lebih besar, model beroperasi dalam ruang token yang terbatas, yang menyulitkan penalaran atas kumpulan pengetahuan yang besar atau kompleks. Yang ketiga adalah informasi terkini. Model yang telah dilatih sebelumnya merepresentasikan cuplikan pengetahuan pada saat pelatihan, sementara lingkungan perusahaan memerlukan sistem yang dapat bernalar atas informasi yang terus berubah. Mengenali kendala-kendala ini membentuk banyak keputusan arsitektur di balik Maisa. Alih-alih mengandalkan model saja, kami berfokus pada pembangunan sistem yang menyediakan akses terstruktur ke pengetahuan, mekanisme validasi, dan eksekusi terkendali sehingga AI dapat beroperasi secara andal dalam alur kerja perusahaan yang nyata. Banyak perusahaan bereksperimen dengan AI generatif tetapi kesulitan untuk melampaui tahap percontohan. Dari perspektif desain sistem, apa alasan inti kegagalan penskalaan di banyak organisasi? Banyak perusahaan kesulitan melampaui percontohan AI generatif karena sebagian besar penerapan dibangun sebagai eksperimen, bukan sebagai sistem yang kokoh. Prototipe awal sering kali mengandalkan rekayasa *prompt*, orkestrasi ringan, dan jalur pengambilan sederhana, yang dapat menunjukkan nilai tetapi tidak menyediakan keandalan, observabilitas, atau kendali yang diperlukan untuk lingkungan produksi. Saat organisasi mencoba menskalakan sistem ini, mereka menghadapi masalah seperti keluaran yang tidak konsisten, kurangnya kemampuan pelacakan, kesulitan mengintegrasikan dengan alur kerja perusahaan, dan tata kelola yang terbatas atas perilaku AI. Pada intinya, masalahnya adalah bahwa model bahasa besar adalah generator probabilistik, sementara proses perusahaan memerlukan perilaku yang dapat diprediksi dan diaudit. Tanpa arsitektur yang menambahkan struktur di sekitar penalaran, validasi, eksekusi, dan pemantauan, sistem AI generatif tetap sulit untuk diskalakan melampaui kasus penggunaan yang terisolasi. Pekerja Digital Maisa dirancang untuk dapat diaudit dan terstruktur, bukan murni probabilistik. Apa artinya itu secara praktis bagi perusahaan yang mengevaluasi AI untuk penggunaan produksi? Ketika kami mengatakan Pekerja Digital Maisa dapat diaudit dan terstruktur, bukan murni probabilistik, maksudnya adalah AI beroperasi dalam sistem terkendali di mana tindakan dan penalarannya dapat dilacak dan diatur. Alih-alih mengizinkan model untuk secara bebas menghasilkan keluaran dan keputusan, sistem ini mengatur bagaimana AI berinteraksi dengan data, alat, dan alur kerja. Setiap langkah dalam proses dapat dicatat, diperiksa, dan divalidasi, dan tindakan dieksekusi melalui antarmuka yang ditentukan, bukan langsung dari keluaran model. Bagi perusahaan, ini berarti sistem AI dapat dipantau, diaudit, dan diintegrasikan ke dalam proses kritis dengan keyakinan yang lebih besar. Ini menggeser AI dari sekadar asisten *black-box* menjadi sistem yang perilakunya dapat dipahami, dikendalikan, dan dipercaya di lingkungan produksi. Sebagai arsitek Knowledge Processing Unit, bagaimana perbedaannya dengan lapisan orkestrasi atau mesin alur kerja tipikal yang dibangun di sekitar model bahasa besar? Knowledge Processing Unit berbeda dari lapisan orkestrasi tipikal karena dirancang untuk mengelola siklus hidup penuh penalaran berbasis AI, bukan hanya mengoordinasikan *prompt* dan panggilan model. Sebag besar kerangka kerja orkestrasi bertindak sebagai pengelola alur kerja yang merantai langkah-langkah seperti pengambilan, *prompting*, dan eksekusi alat. KPU beroperasi pada tingkat arsitektur yang lebih dalam dengan menyusun bagaimana pengetahuan diakses, bagaimana penalaran dilakukan, dan bagaimana tindakan dieksekusi dalam sistem. Ini memperlakukan pemrosesan pengetahuan sebagai lapisan komputasi inti, mengintegrasikan memori, validasi, dan eksekusi terkendali sehingga AI dapat beroperasi secara andal di dalam alur kerja perusahaan yang kompleks, bukan hanya menghasilkan respons. Di industri yang diatur, toleransi risiko rendah. Keputusan desain spesifik apa yang Anda buat untuk memastikan keluaran AI tetap andal dan tidak menyebarkan kesalahan di seluruh alur kerja kompleks? Di industri yang diatur, keandalan dan kendali sangat penting, jadi kami merancang sistem dengan beberapa pengaman untuk memastikan keluaran AI tetap dapat dipercaya. Salah satu prinsip kunci adalah eksekusi terstruktur, di mana AI tidak dapat langsung memicu tindakan kritis tanpa melewati antarmuka terkendali. Kami juga memasukkan lapisan validasi yang memeriksa keluaran model terhadap skema, aturan, atau mekanisme sekunder sebelum diterima. Selain itu, sistem menjaga observabilitas penuh, mencatat langkah-langkah penalaran, interaksi alat, dan keputusan sehingga dapat dilacak dan diaudit. Bersama-sama, pilihan desain ini membantu mencegah kesalahan menyebar melalui alur kerja dan memungkinkan organisasi mengoperasikan sistem AI dengan tingkat keandalan dan tata kelola yang diperlukan di lingkungan yang diatur. Apa kasus penggunaan awal yang paling menarik di mana Anda melihat Pekerja Digital beralih dari bantuan terpandu ke eksekusi penuh yang digerakkan AI? Beberapa kasus penggunaan awal yang paling menarik muncul dalam alur kerja yang intensif pengetahuan di mana prosesnya terdefinisi dengan baik tetapi masih memerlukan analisis dan pengambilan keputusan yang signifikan. Di area seperti tinjauan kepatuhan, operasi dukungan teknis, dan manajemen pengetahuan internal, Pekerja Digital dapat melampaui sekadar membantu manusia dan mulai menjalankan tugas terstruktur dari ujung ke ujung. Mereka dapat mengambil dan menganalisis volume besar informasi internal, menerapkan prosedur yang ditentukan, berinteraksi dengan sistem perusahaan melalui alat terkendali, dan menghasilkan keluaran yang langsung dimasukkan ke dalam alur kerja operasional. Pergeseran kunci terjadi ketika AI tidak hanya menghasilkan saran tetapi mampu menjalankan tindakan yang ditentukan secara andal dalam sistem yang diatur, memungkinkan organisasi mengotomatisasi bagian dari pekerjaan pengetahuan yang kompleks, bukan hanya meningkatkannya. Seiring pengawasan regulasi seputar AI menguat secara global, bagaimana Anda melihat infrastruktur AI inti berkembang untuk memenuhi persyaratan kepatuhan tanpa membatasi inovasi? Seiring pengawasan regulasi seputar AI meningkat, saya percaya kita akan melihat pergeseran dari arsitektur yang hanya memanggil API penyedia model dan mempercayai keluarannya secara membabi buta. Perusahaan dan regulator akan semakin menuntut sistem di mana perilaku AI dapat diamati, diaudit, dan diatur. Di sinilah arsitektur seperti Knowledge Processing Unit menjadi penting. Jenis arsitektur ini memungkinkan organisasi untuk menegakkan kontrol, melacak keputusan, dan memastikan bahwa keluaran AI andal sebelum mempengaruhi proses nyata. Seiring waktu, saya berharap sistem semacam ini menjadi fondasi standar untuk infrastruktur AI yang dapat dipercaya. Anda telah berbicara tentang etika dan akuntabilitas di samping pekerjaan teknis Anda. Bagaimana perspektif tersebut memengaruhi cara Anda mendekati pembangunan sistem AI yang transparan? Etika dan akuntabilitas, bagi saya, diterjemahkan langsung ke dalam pilihan desain sistem. Jika sistem AI akan berpartisipasi dalam alur kerja operasional nyata, mereka tidak dapat berfungsi sebagai *black-box* buram yang perilakunya tidak dapat diperiksa atau dipahami. Perspektif itu sangat memengaruhi cara saya mendekati pembangunan sistem AI. Transparansi, kemampuan pelacakan, dan pengawasan manusia perlu dibangun ke dalam arsitektur dari awal. Ini berarti memastikan bahwa langkah-langkah penalaran dapat diamati, keputusan dapat diaudit, dan tindakan dieksekusi melalui mekanisme terkendali. Ketika prinsip-prinsip ini tertanam di tingkat infrastruktur, sistem AI menjadi tidak hanya lebih dapat dipercaya tetapi juga lebih mudah bagi organisasi untuk diatur secara bertanggung jawab. Ke depan, apakah Anda percaya infrastruktur AI agen akan menjadi sefondasional infrastruktur cloud di dekade sebelumnya — dan apa yang perlu terjadi secara teknis agar pergeseran itu terwujud? Saya percaya infrastruktur AI agen memiliki potensi untuk menjadi sefondasional infrastruktur cloud selama dekade terakhir. Saat organisasi berusaha mengotomatisasi pekerjaan pengetahuan yang semakin kompleks, mereka akan membutuhkan sistem yang dapat mengoordinasikan penalaran, memori, dan eksekusi secara andal di banyak tugas dan sumber data. Namun, agar pergeseran itu terwujud, arsitektur yang mendasarinya harus matang melampaui integrasi model sederhana. Kita membutuhkan infrastruktur yang menyediakan penalaran terstruktur, akses andal ke pengetahuan perusahaan, observabilitas yang kuat, dan eksekusi tindakan yang terkendali. Ketika kemampuan-kemampuan itu dibangun ke dalam sistem inti, AI agen dapat berevolusi dari alat eksperimental menjadi infrastruktur andal yang diandalkan organisasi untuk menjalankan operasi kritis. Terima kasih atas wawancara yang luar biasa, pembaca yang ingin belajar lebih lanjut harus mengunjungi Maisa AI.












