Pemimpin pemikiran

Masalah Di Mana-mana: Mengapa “Data Di Mana-mana” Menjadi Tantangan Infrastruktur yang Mendefinisikan Era AI

mm

Pertanyaan paling konsekuensial dalam AI saat ini bukanlah model mana yang paling pintar. Pertanyaannya adalah di mana data berada, dan apakah kecerdasan dapat menjangkaunya.

Selama hampir satu dekade, industri AI beroperasi di bawah premis yang menenangkan: sentralisasi data, sentralisasi komputasi, dan kejeniusan akan mengikuti. Model hyperscaler — sentralisasi dataset pelatihan besar di kluster cloud besar dan menerapkan komputasi GPU besar untuk mengompresi mereka menjadi parameter model — menghasilkan hasil luar biasa, tetapi juga arsitektur yang sekarang terbebani oleh bobot keberhasilannya sendiri.

Ini disebut “masalah data di mana-mana”. Ketika AI bocor dari laboratorium penelitian dan masuk ke dalam jaringan operasional rumah sakit, pabrik, lembaga keuangan, dan pemerintah berdaulat, data yang harus memandu sistem ini secara inheren didistribusikan, terbatas yurisdiksi, dan tidak dapat dipindahkan. Regulator di Eropa bersikeras bahwa catatan keuangan warga negara mereka tidak boleh meninggalkan benua. Data uji klinis perusahaan farmasi di Basel tidak dapat secara hukum berbagi bucket cloud dengan dataset genomika dari Seoul.

Apapun kasusnya, kecerdasan harus pergi ke data. Data, dengan tegas, tidak akan datang ke kecerdasan.

Ekonomi Perubahan

Tegangan struktural ini diperparah oleh revolusi simultan dalam ekonomi AI. Industri ini mengalami perubahan besar dari pengeluaran berbasis pelatihan ke pengeluaran berbasis inferensi, dan implikasinya untuk arsitektur data sangat mendalam.

Deloitte memperkirakan bahwa beban inferensi menyumbang setengah dari semua komputasi AI pada 2025, angka yang akan melompat menjadi dua pertiga pada 2026. Rasio ini membalik dengan kecepatan yang mengagumkan. Analis memperkirakan bahwa pada 2026, permintaan inferensi akan melampaui permintaan pelatihan sebanyak 118 kali. Pada 2030, inferensi dapat menyumbang 75% dari total komputasi AI, mengemudi $7 triliun dalam investasi infrastruktur.

Matematika biaya sama-sama vertiginous. Untuk setiap $1 miliar yang dihabiskan untuk melatih model AI, organisasi menghadapi $15–20 miliar dalam biaya inferensi selama umur produksi model: rasio yang diilustrasikan dengan jelas oleh GPT-4, yang biaya pelatihannya sekitar $150 juta, tetapi biaya inferensi kumulatif mencapai $2,3 miliar pada akhir 2024. Pelatihan, yang dulunya menjadi obsesi utama investor dan petugas pengadaan AI, sekarang diformulasikan ulang sebagai biaya sekali pakai. Inferensi adalah biaya operasional kecerdasan yang berkelanjutan, dan sekarang merupakan item utama.

Namun, di sini terletak paradoks: biaya inferensi untuk sistem GPT-3.5-level turun lebih dari 280 kali lipat antara November 2022 dan Oktober 2024, dengan biaya perangkat keras menurun sekitar 30% per tahun dan efisiensi energi meningkat 40% per tahun. Harga turun; konsumsi mempercepat lebih cepat. Biaya inferensi per unit turun 100 kali lipat, sementara Microsoft dan Google melaporkan beban kerja AI tumbuh 31 kali lipat dalam setengah periode tersebut.

Di Mana Data Berada, Kecerdasan Harus Mengikuti

Ekonomi inferensi secara fundamental merubah persyaratan infrastruktur, dan tidak ada tempat lain yang lebih jelas daripada sekitar gravitasi data. Inferensi, tidak seperti pelatihan, bukanlah pekerjaan batch yang dijalankan sekali di pusat data. Ini adalah layanan terus-menerus, sensitif terhadap keterlambatan, dan didistribusikan secara geografis, dan hanya sebaik data yang dapat dijangkaunya pada saat kueri.

Ini adalah inti dari tantangan data di mana-mana.

Sebagai contoh, model bahasa yang berpikir tentang data telemetry ICU pasien secara langsung tidak dapat menunggu putaran 200 milidetik ke klaster eastern seaboard hyperscaler. Model penipuan layanan keuangan yang menjalankan inferensi pada titik transaksi tidak dapat mengekstrak data akun ke yurisdiksi di mana itu akan melanggar GDPR. Penerapan AI berdaulat tidak dapat bergantung pada infrastruktur yang dimiliki dan dioperasikan oleh entitas komersial asing.

Taksonomi Intensitas Data

Tidak semua sistem AI menghadapi tantangan ini secara identik, dan perlu dipertimbangkan taksonomi kasar karena ada beberapa jenis model AI dan kompleksitas. Mari kita pecah dengan tiga contoh utama: LLM, gambar, dan model fisik.

Model bahasa besar — keluarga Claude, GPT, dan Gemini — sebagian besar berurusan dengan token bahasa: relatif ringan, dapat dikompresi, dan dapat menerima teknik privasi-pemeliharaan seperti privasi diferensial atau pembelajaran federasi. Masalah data di mana-mana mereka sangat kompleks.

Model visual generatif menyajikan kasus yang lebih sulit. Sistem seperti Black Forest Labs’ FLUX.2 dapat menghasilkan gambar resolusi tinggi, fotorealistik dalam waktu kurang dari satu detik pada perangkat keras yang kuat, tetapi menghasilkan satu gambar memerlukan lebih banyak data dan komputasi daripada menghasilkan teks. Ketika AI visual bergerak melampaui alat kreatif ke inspeksi industri, pemindaian medis, dan analisis satelit, data yang mendasarinya sering kali besar, sensitif, dan sulit dipindahkan, meningkatkan kebutuhan untuk menjalankan AI di mana data sudah berada.

Kategori yang lebih kompleks adalah AI fisik. NVIDIA’s Jensen Huang telah menyatakan bahwa “AI fisik telah tiba, dan setiap perusahaan industri akan menjadi perusahaan robotika.” Model baru seperti NVIDIA’s Cosmos 3 bertujuan memberikan mesin pemahaman yang umum tentang dunia fisik dengan menggabungkan simulasi, visi, dan penalaran, sementara perusahaan seperti Physical Intelligence melatih robot pada data sensor dunia nyata – termasuk gaya, gerakan, dan input visual – untuk memungkinkan perilaku yang lebih adaptif dan otonom.

Kepercayaan, Penjelasan, dan Hasil

Ini adalah di mana tantangan data di mana-mana bergerak melampaui infrastruktur dan menjadi masalah tata kelola. Ketika AI diterapkan pada keputusan yang berisiko tinggi – dari diagnosis kesehatan hingga model risiko keuangan hingga sistem kontrol fisik – pertanyaan tentang di mana data berada semakin terkait dengan siapa yang bertanggung jawab atas hasilnya.

Di lingkungan regulasi saat ini, penjelasan tidak opsional. Undang-Undang AI UE, misalnya, mengharuskan sistem risiko tinggi untuk menunjukkan dasar untuk output mereka, yang sulit jika data yang memandu keputusan tersebut didistribusikan di seluruh sistem, yurisdiksi, dan kerangka regulasi yang berbeda.

Kepercayaan, oleh karena itu, menjadi prasyarat untuk adopsi skala besar. Kontrol atas lingkungan data menjadi sama pentingnya dengan kontrol atas model itu sendiri.

Generasi Berikutnya Infrastruktur AI

Resolusi dari tantangan data di mana-mana akan mendefinisikan peta kompetitif AI untuk dekade berikutnya. Inferensi federasi, lingkungan pengolahan data yang aman, model yang dioptimalkan untuk edge, dan sistem orkestrasi yang mempertimbangkan di mana data diizinkan untuk berada bukanlah fitur teknis khusus, tetapi prasyarat untuk ekspansi AI melampaui kasus penggunaan di mana data dapat disentralisasi secara bebas.

Perusahaan dan pemerintah yang membangun infrastruktur yang mampu menyediakan inferensi yang dapat dipercaya, dapat dijelaskan, dan berdaulat — kecerdasan yang mencapai data daripada meminta data untuk pergi ke sana — akan menguasai moat yang paling tahan lama di era AI. Melatih model yang lebih pintar semakin menjadi masalah yang sudah terpecahkan dan dikomodifikasi. Menerapkan model tersebut secara bertanggung jawab, di edge, melintasi batas yurisdiksi, melawan data yang tidak dapat dipindahkan, adalah masalah yang masih ada.

Data di mana-mana bukanlah slogan. Ini adalah masalah yang belum terpecahkan paling sulit dalam AI perusahaan. Dan ini akan menentukan apakah kemampuan luar biasa yang dibuka oleh investasi pelatihan selama dekade terakhir pernah diterjemahkan, skala besar, menjadi hasil yang dapat dipercaya oleh dunia.

Sebagai chief strategy officer, Abhas memimpin strategi perusahaan secara keseluruhan untuk Cloudera dan bertanggung jawab untuk menciptakan visi perusahaan, membangun model operasi target bisnis dan pelanggan, mengkomunikasikan hal tersebut dengan pemangku kepentingan melalui OKR yang jelas, dan melaksanakan inisiatif transformasional kunci untuk mewujudkan rencana tersebut. Ia juga bertanggung jawab untuk mengarahkan pertumbuhan dan inovasi serta membuat keputusan build/buy partner yang tepat, termasuk harga dan pengemasan, pengembangan perusahaan, dan akselerator inovasi Cloudera untuk meluncurkan produk baru. Sebelumnya, ia menjabat sebagai kepala staf dan wakil presiden untuk transformasi bisnis di perusahaan.

Sebelum merger Cloudera/Hortonworks, ia membantu meningkatkan upaya go-to-market Hortonworks sebagai kepala inovasi pelanggan dan manajemen nilai global. Sebagai konsultan manajemen terlatih, ia bersemangat untuk mengarahkan tindakan dan perubahan dalam masyarakat dan telah memimpin proyek dengan beberapa organisasi, termasuk Forum Ekonomi Dunia, Pendiri Masa Depan, dan organisasi nirlaba lainnya.