Pemimpin pemikiran

Menelisik Laporan MIT NANDA Juli 2025: Mengapa Tingkat Kegagalan AI Pilot 95% Bukan Akhir

Published September 12, 2025

Updated May 18, 2026

Ilya Romanov

Saya adalah seorang optimis yang terbukti, dan saya selalu terbuka untuk setiap teknologi baru yang datang. Obsesi terbaru saya yang akan bertahan lama? AI.

MIT NANDA baru-baru ini menerbitkan makalah yang disebut ‘The GenAI Divide. State of AI in Business in 2025’, dan saya pikir makalah itu sangat layak dibaca. Makalah itu memberikan pandangan yang realistis tentang AI dan posisinya dalam bisnis saat ini. Berita di Linkedin mungkin tampak hampir histeris tentang bagaimana AI datang untuk mengubah segalanya, namun laporan itu menggambarkan gambaran yang berbeda.

Pertama-tama, apa itu MIT NANDA?

Networked Agents and Decentralized AI (disingkat menjadi NANDA) adalah inisiatif penelitian ambisius dari MIT Media Lab. Proyek ini melibatkan lebih dari 18 lembaga penelitian terkemuka dari 6 benua dan beberapa nama besar di industri teknologi—seperti Meta, Dell, Microsoft, dan lain-lain. Tujuan NANDA benar-benar futuristik, jika tidak revolusioner. Ambisi mereka adalah membangun infrastruktur dasar untuk Internet agen AI, yaitu jaringan terdesentralisasi di mana agen AI menemukan, memverifikasi, dan berkolaborasi dengan agen lain secara online melintasi batas organisasi. Secara fundamental, NANDA bekerja pada aturan yang jelas, protokol, pedoman, dan kerangka yang memungkinkan agen AI berinteraksi dengan agen lain atas nama manusia dan organisasi. Proyek NANDA adalah open-source, yang berarti mereka menerima pengusaha, visioner, teknolog, dan pembuat kebijakan sebagai kolaborator skala penuh. (Apakah Anda merasakan getaran Wikipedia?)

Alasan saya memberitahu Anda tentang ini adalah karena laporan MIT NANDA adalah hasil penelitian yang sangat berharga dalam hal AI. Penulisnya berada di garis depan dunia AI, dan temuan mereka harus dianggap serius (meskipun dengan sedikit skeptis).

Laporan itu disusun sejak Januari dan akhirnya diterbitkan pada Juli 2025. Laporan tersebut didasarkan pada tinjauan sistematis dari lebih dari 300 inisiatif AI yang diungkapkan secara publik dan wawancara dengan pemimpin dari 52 organisasi serta survei 153 pemimpin senior di empat konferensi industri utama.

5% Tingkat Keberhasilan AI Pilot

Laporan itu memperkenalkan istilah ‘The GenAI Divide’ yang menggambarkan gangguan yang terjadi (atau tidak terjadi) pada organisasi dan bahkan industri yang berhasil (atau tidak berhasil) menggunakan AI. Jika sebuah bisnis berada di ‘sisi yang salah dari pembagian’, menurut NANDA, bisnis itu gagal untuk benar-benar berubah, berkembang, dan memikirkan kembali struktur dan operasi bisnisnya. Untuk berada di sisi yang benar dari pembagian, maka, berarti memiliki hasil yang nyata dari penggunaan AI—“Investasi ini memperkuat GenAI Divide dengan mengarahkan sumber daya ke arah kasus penggunaan yang terlihat tetapi sering kurang transformatif, sementara peluang ROI tertinggi di fungsi back-office tetap tidak didanai”.

Alasan laporan itu mendapat perhatian besar adalah temuan utamanya. Ringkasan eksekutif menyatakan: “Meskipun $30–40 miliar dalam investasi perusahaan ke GenAI, laporan ini mengungkapkan hasil yang mengejutkan bahwa 95% organisasi tidak mendapatkan pengembalian investasi … Hanya 5% dari pilot AI terintegrasi yang mengekstrak jutaan dalam nilai, sementara sebagian besar besar tetap terjebak dengan tidak ada dampak P&L yang dapat diukur.” Tidak terlalu menjanjikan, bukan?

Batasan fundamental yang mencegah organisasi untuk mewujudkan nilai sebenarnya dari AI adalah apa yang laporan itu sebut sebagai ‘kesenjangan pembelajaran’. Sebagian besar sistem GenAI secara fundamental kekurangan kemampuan untuk mempertahankan umpan balik, beradaptasi dengan konteks, atau memperbaiki diri dari waktu ke waktu.

Sistem tidak belajar dari umpan balik. Dalam kenyataan, ini berarti seorang manajer memberi mereka set yang sama data berulang kali, namun tidak ada perbaikan dalam kinerja yang terjadi. Seorang manajer manufaktur mid-market menggambarkan mengunggah manual produk yang sama ke sistem AI mereka untuk memperbarui daftar checklist pengiriman, namun setiap iterasi menyalin penghilangan dan kesalahan yang sama, tanpa perbaikan yang signifikan dalam kualitas output meskipun beberapa sesi umpan balik.
Konteks manual yang berlebihan diperlukan setiap kali. Alat AI kekurangan memori antara sesi, sehingga setiap interaksi berarti memberi mereka kembali pengetahuan dan konteks sebelumnya. Alur kerja yang kompleks, tidak seperti tugas satu kali, berlarut-larut, gagal untuk bertindak sebagai dukungan yang dapat diandalkan untuk proyek yang sedang berlangsung. Laporan itu mengutip tim hukum perusahaan yang, untuk setiap draf kontrak, harus memasukkan kembali preferensi klien, catatan negosiasi sebelumnya, dan kendala regulasi ke dalam alat AI—mengubah apa yang seharusnya menjadi alur kerja yang membantu menjadi tugas yang memakan waktu yang mengurangi produktivitas dalam proyek multi-tahap yang kompleks.
Kustomisasi yang tidak memadai untuk beberapa proses bisnis. Sebagai gantinya, mendapatkan alat yang responsif yang menyesuaikan diri dengan konteks yang lebih luas, konteks yang lebih luas menyesuaikan diri dengan alat, memaksa pengguna untuk bekerja di sekitar sistem yang kaku. Seorang CIO mencatat bahwa alat analisis risiko AI yang disediakan vendor “terasa seperti kotak satu-ukuran”, memaksa tim untuk mengubah alur kerja pengapproval kredit mereka untuk memenuhi input yang kaku dari alat, bukan memiliki AI yang menyesuaikan diri dengan proses yang mapan. Ketidakcocokan itu akhirnya menyebabkan pilot yang ditinggalkan

Temuan Utama Saya dari Laporan NANDA

1. Ekonomi AI Bayangan Berkembang

Laporan itu memperkenalkan istilah ‘ekonomi AI bayangan’ untuk menggambarkan bagaimana karyawan menggunakan AI pada tingkat pribadi sebagai alat, bukan sebagai alat yang disetujui organisasi secara luas. Ini terdengar akrab bagi saya, sebenarnya. Seorang teman saya dari cabang merek otomotif Cina di CIS berbagi bahwa dia menggunakan ChatGPT untuk menulis konten dalam aplikasi (posting berita, iklan, dan lain-lain). Dia mengatakan bahwa di tingkat HQ tidak ada alat AI yang disetujui untuk penggunaan umum, jadi penggunaan AI-nya adalah pendorong dan penghemat waktu pribadi yang tidak benar-benar dia angkat dengan manajernya.

Laporan itu menyediakan angka yang sangat spesifik. Sementara hanya 40% perusahaan yang telah membeli langganan LLM resmi, pekerja dari lebih dari 90% perusahaan yang disurvei melaporkan penggunaan alat AI pribadi secara teratur untuk tugas kerja. Penggunaan bayangan ini sering memberikan ROI yang lebih baik daripada inisiatif perusahaan formal, mengungkapkan apa yang sebenarnya berhasil ketika individu memiliki akses ke alat yang fleksibel dan responsif.

2. Alokasi Investasi Mencerminkan Prioritas yang Tidak Tepat

Laporan itu mengungkapkan ketidaksesuaian yang signifikan antara investasi AI dan potensi ROI yang sebenarnya. Sekitar 50% dari anggaran GenAI mengalir ke fungsi penjualan dan pemasaran, terutama karena hasilnya dapat diukur dengan mudah dan selaras dengan KPI tingkat dewan. Namun, pengembalian tertinggi sering muncul dari otomatisasi back-office, seperti penghapusan BPO yang menyelamatkan hingga $10M per tahun, pengurangan 30% dalam biaya kreatif eksternal, dan $1M yang diselamatkan per tahun pada manajemen risiko yang disubkontrakkan. Investasi ini memperkuat GenAI Divide dengan mengarahkan sumber daya ke arah kasus penggunaan yang terlihat tetapi kurang transformatif.

Namun, keyakinan pribadi saya adalah ini. Dari apa yang saya ingat dari pengalaman saya di sebuah perusahaan perbankan internasional yang memiliki bank ritel di seluruh dunia, memperkenalkan alat yang menggali ke jantung organisasi, memakan data, dan (siapa tahu?) bocor informasi insider ke luar adalah risiko besar. Jadi saya mengerti mengapa mendaftar untuk pabrik konten AI untuk kreatif yang mudah untuk iklan Facebook adalah keputusan yang mudah, sedangkan gangguan back-end yang kompleks tidak diterima dengan antusias. Kecuali itu adalah perintah langsung dari tingkat C, mengimplementasikan alat AI yang mengganggu serius ke tulang punggung perusahaan akan memakan waktu setidaknya 12 bulan.

Saya beruntung memiliki kesempatan untuk melihat bagian dalam dari otomatisasi AI yang dibuat untuk tim penjualan sebuah perusahaan manufaktur jendela lokal. Mereka merekrut seorang freelancer dari n8n, dan dia membangun alat analisis dan obrolan AI yang ditenagai. Bisnis itu sekarang dapat menemukan bottleneck di funnel mereka lebih cepat, dan lebih banyak poin sakit terungkap karena AI membantu proses bisnis yang tertulis dan berbicara. Tingkat kepuasan mereka sangat tinggi, dengan lebih banyak data yang diproses lebih cepat.

3. Pembangunan Internal Kalah dengan Vendor Eksternal

Untuk jujur, temuan ini mengejutkan saya. Bertentangan dengan kepercayaan umum bahwa perusahaan harus membangun alat AI mereka sendiri, penelitian menunjukkan bahwa kemitraan strategis dengan vendor eksternal dua kali lebih mungkin mencapai penerapan dibandingkan dengan upaya pengembangan internal. Siapa yang akan berpikir, kan? Yah, jelas bukan saya.

Organisasi yang memperlakukan vendor AI seperti penyedia layanan bisnis—menuntut kustomisasi yang mendalam dan memegang mereka bertanggung jawab atas hasil operasional daripada benchmark model—mencapai tingkat keberhasilan yang jauh lebih tinggi dan waktu hingga nilai yang lebih cepat.

4. Investasi yang Lebih Tinggi Berarti Gangguan yang Lebih Tinggi? Tidak Benar.

Menggunakan Indeks Gangguan Pasar AI komposit, laporan itu mengungkapkan bahwa hanya dua industri—Teknologi dan Media & Telekom—menunjukkan tanda-tanda gangguan struktural yang jelas dari GenAI. Tujuh dari sembilan sektor utama menunjukkan aktivitas pilot yang signifikan tetapi perubahan struktural minimal, dengan industri seperti Kesehatan, Jasa Keuangan, dan Energi menunjukkan skor gangguan di bawah 0,5 pada skala 5 poin. Kesenjangan ini antara visibilitas investasi dan transformasi yang sebenarnya menggambarkan GenAI Divide pada tingkat industri.

Mengapa Tingkat Kegagalan 95% Sementara

Meskipun hasil interim yang tampaknya tidak berharapan, ada cahaya di ujung terowongan. Laporan itu menjelaskan bahwa GenAI Divide adalah sementara dan akan diatasi melalui perkembangan yang muncul.

NANDA sendiri adalah salah satu kontributor utama untuk dunia AI yang lebih terhubung. Mekanisme yang disebutkan dalam laporan adalah Protokol Konteks Model (atau MCP) dan Agen-ke-Agen (atau A2A) sebagai fondasi infrastruktur untuk interoperabilitas agen yang lancar dan koordinasi otonom di seluruh sistem.

Upaya NANDA dan alat ini adalah jalur menuju apa yang NANDA cari—Agentic Web, jaringan agen yang mampu koordinasi otonom di seluruh internet. Interaksi mereka akan dirancang untuk menggantikan alur kerja statis dengan sistem yang dinamis dan self-educating.

Apakah terdengar terlalu baik untuk dipercaya atau bahkan ajaib? Yah, Microsoft Copilot Studio’s Multi-Agent Orchestration adalah kemiripan terdekat dengan visi. Sistem ini membantu membangun pohon agen di mana agen Copilot utama memicu agen subordinat yang bertanggung jawab atas tugas-tugas tertentu seperti penjadwalan atau pembuatan dokumen. Setiap agen tetap dalam bidang keahlian mereka sambil berkoordinasi dengan yang lain. Untuk mengatakan dalam istilah yang lebih praktis, ketika pengguna meminta “Rencanakan peluncuran produk Q4 kami,” agen orkestrator secara otomatis mendelegasikan ke agen-agen khusus—satu menangani penelitian pasar, yang lain mengelola pembuatan timeline, dan yang ketiga berkoordinasi dengan alat manajemen proyek. Pekerjaan berlangsung secara sinkron, namun otonom.

Jadi, apa yang dilakukan laporan oleh NANDA? Jendela untuk menyeberangi GenAI Divide menyempit dengan cepat karena perusahaan mulai mengunci hubungan dengan vendor yang memiliki alat yang mampu belajar, menghasilkan gangguan, dan mengembangkan serta mengoptimalkan operasi bisnis di back-end, menambah kecepatan ke inti organisasi. Keberhasilan terletak pada membeli sistem agen AI daripada membangunnya dari awal secara internal. Ketika sistem pembelajaran agen, mengingat, dan self-sufficient menjadi lebih umum, tingkat kegagalan 95% saat ini akan memberi jalan bagi era baru di mana sistem AI berkolaborasi dengan lancar di seluruh vendor, domain, dan batas organisasi. Masa depan itu adalah ROI yang sebenarnya dari investasi saat ini.

Alternatif Pandangan tentang Adopsi AI

Proyek NANDA melakukan pekerjaan luar biasa dalam mengompilasi data dari berbagai sumber dan mewawancarai pemimpin dari berbagai bidang. Namun, apakah itu suara utama adopsi AI di seluruh dunia? Jika Anda, seperti saya, menemukan The GenAI Divide sedikit mematikan, jika tidak mengecewakan, saya telah menemukan pandangan alternatif tentang adopsi AI untuk menjaga api AI pribadi tetap menyala.

Jed Nykolle Harme dari IT Brief UK memecahkan CIO Playbook 2025 oleh Lenovo. Studi ini mencakup umpan balik dari pemimpin IT di seluruh EMEA (Eropa, Timur Tengah, dan Afrika), dan kesimpulannya jauh lebih menjanjikan. Ternyata industri ritel memimpin dalam hal kepuasan AI, di mana 96% kinerja pilot AI memenuhi atau melebihi harapan.
Sebelumnya saya mengungkapkan simpati dengan pemain pasar perusahaan besar yang menemukan AI sulit untuk diimplementasikan dan tidak terlalu terbuka untuk inkorporasi intensif. Lenovo, bagaimanapun, mempresentasikan gambaran yang berbeda dengan industri Perbankan, Jasa Keuangan, dan Asuransi (BFIS): meskipun memiliki tingkat adopsi AI terendah sebesar 7%, 33% dari mereka yang menguji AI melaporkan bahwa pilot melebihi harapan. Rahasia di balik tren positif ini adalah ‘pendekatan hati-hati’, seperti yang dikatakan Arabian Business.
Studi lain yang menenangkan IBM CEO Study dimulai dengan kata pengantar yang berani dari Wakil Ketua IBM Gary Cohn: “Seiring adopsi AI dipercepat… hasil akhir hanya akan datang kepada CEO yang memiliki keberanian untuk mengambil risiko sebagai kesempatan. … Ketika lingkungan bisnis tidak pasti, menggunakan AI dan data perusahaan untuk mengidentifikasi di mana Anda memiliki keunggulan adalah keunggulan kompetitif. Pada titik ini, pemimpin yang tidak menggunakan AI dan data mereka sendiri untuk maju membuat keputusan bisnis yang sadar untuk tidak bersaing.”
Studi CEO IBM menunjukkan beberapa fakta yang menginspirasi. Misalnya, pertumbuhan investasi AI diperkirakan lebih dari dua kali lipat dalam dua tahun ke depan, sehingga hampir 20% dari total anggaran IT akan dialokasikan untuk AI—komitmen ini menunjukkan bahwa meskipun ada tantangan yang terlihat dan terbukti, kepercayaan pada AI kuat dan, yang paling penting, ini adalah investasi strategis daripada pengeluaran reaktif.
Terakhir, 64% CEO dalam laporan setuju bahwa risiko ketinggalan memacu investasi dalam teknologi baru bahkan sebelum pemahaman yang jelas tentang dampaknya tercapai. Namun, tidak ada keputusan cepat. Sebagai gantinya, pengambil keputusan memilih ‘strategi penghalang’. Dalam istilah sederhana, ketika kompetitor meluncurkan bot obrolan AI untuk rekomendasi yang dipersonalisasi, Anda melakukan hal yang sama untuk situs web Anda. Anda mungkin tidak yakin tentang peningkatan pendapatan, tetapi Anda tahu bahwa jika Anda ketinggalan selama dua tahun lagi hingga ‘set data yang sempurna’ dikompilasi, Anda akan kehilangan momentum secara tidak dapat diubah. Jadi, aturannya sederhana: salin agresif, lalu lihat hasilnya.

Kesimpulan

Dalam kesimpulan, saya ingin menyatakan keyakinan pribadi saya dalam AI. Sebagai seorang wirausaha, seorang CMO, pengembang bisnis, dan mantan karyawan kantor di perbankan, saya melihat banyak cara AI dapat membantu mengoptimalkan anggaran, mengalirkan alur kerja, dan boost tim. Masa depan dipercepat dan diperkuat. Jika sebuah bisnis ingin bersaing, itu perlu menjadi AI-fluent. Sementara temuan yang saya sajikan kontroversial, saya yakin bahwa lanskap AI saat ini, dengan puncak dan lembahnya, adalah kerangka waktu pembelajaran alami, yang diulangi berulang kali dengan setiap teknologi baru.