Terhubung dengan kami

Pemimpin Pikiran

Mengapa Para Otokrat AI Harus Ditantang untuk Berbuat Lebih Baik

mm

Jika kita telah belajar sesuatu dari Era AI, kita akan belajar bahwa industri ini tengah berjuang menghadapi tantangan daya yang signifikan. Tantangan ini bersifat harfiah—seperti menemukan cara untuk memenuhi permintaan energi yang sangat besar yang dibutuhkan pusat data AI—dan secara kiasan—seperti terkonsentrasinya kekayaan AI di tangan beberapa orang berdasarkan kepentingan komersial yang sempit daripada manfaat sosial yang lebih luas.

Paradoks Kekuatan AI: Biaya Tinggi, Kontrol Terpusat

Agar AI berhasil dan bermanfaat bagi manusia, ia harus ada di mana-mana. Agar ada di mana-mana, ia harus berkelanjutan secara ekonomi dan lingkungan. Itu bukan jalan yang kita tempuh sekarang. Perjuangan obsesif untuk AI yang lebih besar dan lebih cepat lebih didorong oleh perolehan kinerja jangka pendek dan dominasi pasar daripada oleh apa yang terbaik untuk AI yang berkelanjutan dan terjangkau.

Perlombaan untuk membangun sistem AI yang semakin canggih semakin cepat, tetapi hal itu disertai dengan biaya lingkungan yang tinggi. Chip AI mutakhir, seperti H100 milik Nvidia (hingga 700 watt), sudah mengonsumsi energi dalam jumlah yang signifikan. Tren ini diperkirakan akan terus berlanjut, dengan orang dalam industri memperkirakan bahwa arsitektur Blackwell generasi berikutnya milik Nvidia dapat mendorong konsumsi daya per chip hingga ke kisaran kilowatt, yang berpotensi melebihi 1,200 watt. Dengan para pemimpin industri mengantisipasi jutaan chip ini akan digunakan di pusat data di seluruh dunia, permintaan energi AI akan meroket.

Biaya Lingkungan dari Perlombaan Senjata AI

Mari kita bahas hal ini dalam konteks sehari-hari. Listrik yang mengaliri seluruh rumah Anda dapat menjalankan semua peralatan Anda dengan daya penuh secara bersamaan – tidak mungkin ada yang melakukannya. Sekarang bayangkan satu rak Nvidia 120kw yang membutuhkan daya yang sama – terutama jika ada ratusan atau ribuan rak di pusat data besar! Sekarang, 1,200 watt sama dengan 1.2 kw. Jadi, sebenarnya, kita berbicara tentang lingkungan berukuran sedang. Satu rak Nvidia 120kW – yang pada dasarnya berisi 100 chip yang haus daya – membutuhkan listrik yang cukup untuk memberi daya pada sekitar 100 rumah.

Lintasan ini mengkhawatirkan, mengingat keterbatasan energi yang dihadapi banyak komunitas. Pakar pusat data memperkirakan bahwa Amerika Serikat akan membutuhkan 18 hingga 30 gigawatt kapasitas baru selama lima hingga tujuh tahun ke depan, yang membuat perusahaan-perusahaan berjuang keras untuk menemukan cara menangani lonjakan tersebut. Sementara itu, industri saya terus menciptakan lebih banyak aplikasi AI generatif yang haus daya yang mengonsumsi energi jauh melampaui apa yang secara teoritis diperlukan untuk aplikasi tersebut atau apa yang layak bagi sebagian besar bisnis, apalagi yang diinginkan oleh planet ini.

Menyeimbangkan Keamanan dan Aksesibilitas: Solusi Pusat Data Hibrida

Otokrasi AI dan "perlombaan senjata" ini, yang terobsesi dengan kecepatan dan kekuatan mentah, mengabaikan kebutuhan praktis pusat data dunia nyata – yaitu, jenis solusi terjangkau yang mengurangi hambatan pasar bagi 75 persen organisasi AS yang belum mengadopsi AI. Dan mari kita hadapi, seiring dengan semakin banyaknya regulasi AI yang diluncurkan seputar privasi, keamanan, dan perlindungan lingkungan, semakin banyak organisasi akan menuntut pendekatan pusat data hibrida, menjaga data mereka yang paling berharga, pribadi, dan sensitif tetap aman di area di tempat yang sangat terlindungi, jauh dari AI dan serangan siber akhir-akhir ini. Baik itu catatan perawatan kesehatan, data keuangan, rahasia pertahanan nasional, atau integritas pemilu, masa depan AI perusahaan menuntut keseimbangan antara keamanan di tempat dan ketangkasan cloud.

Ini adalah tantangan sistemik yang signifikan dan tantangan yang membutuhkan kolaborasi yang berlebihan daripada persaingan yang berlebihan. Dengan fokus yang berlebihan pada GPU dan chip akselerator AI lainnya dengan metrik kapabilitas, kecepatan, dan kinerja mentah, kita kurang mempertimbangkan infrastruktur yang terjangkau dan berkelanjutan yang dibutuhkan pemerintah dan bisnis untuk mengadopsi kapabilitas AI. Ini seperti membangun pesawat ruang angkasa tanpa tempat untuk meluncurkannya atau meletakkan Lamborghini di jalan pedesaan.

Demokratisasi AI: Kolaborasi Industri

Meskipun menggembirakan bahwa pemerintah mulai mempertimbangkan regulasi – memastikan bahwa AI memberi manfaat bagi semua orang, bukan hanya kaum elit – industri kita membutuhkan lebih dari sekadar peraturan pemerintah.

Misalnya, Inggris memanfaatkan AI untuk meningkatkan kemampuan penegakan hukum dengan meningkatkan pembagian data antara lembaga penegak hukum untuk meningkatkan prediksi dan pencegahan kejahatan yang digerakkan oleh AI. Mereka berfokus pada transparansi, akuntabilitas, dan keadilan dalam penggunaan AI untuk kepolisian, memastikan kepercayaan publik dan kepatuhan terhadap hak asasi manusia – dengan alat seperti pengenalan wajah dan kepolisian prediktif untuk membantu dalam pendeteksian dan pengelolaan kejahatan.

Dalam industri yang sangat diatur seperti bioteknologi dan perawatan kesehatan, kolaborasi penting meliputi: Johnson & Johnson MedTech dan Nvidia bekerja sama untuk meningkatkan AI untuk prosedur pembedahan. Kolaborasi mereka bertujuan untuk mengembangkan kemampuan analisis dan pengambilan keputusan berbasis AI secara real-time di ruang operasi. Kemitraan ini memanfaatkan platform AI NVIDIA untuk memungkinkan penerapan aplikasi AI yang dapat diskalakan, aman, dan efisien dalam pengaturan layanan kesehatan.

Sementara itu, di Jerman, Merck telah membentuk aliansi strategis dengan Exscientia dan BenevolentAI untuk memajukan penemuan obat yang digerakkan oleh AI. Mereka memanfaatkan AI untuk mempercepat pengembangan kandidat obat baru, khususnya dalam onkologi, neurologi, dan imunologi. Tujuannya adalah untuk meningkatkan tingkat keberhasilan dan kecepatan pengembangan obat melalui kemampuan desain dan penemuan AI yang canggih.

Langkah pertama adalah mengurangi biaya penerapan AI untuk bisnis di luar BigPharma dan Big Tech, khususnya dalam fase inferensi AI—ketika bisnis memasang dan menjalankan model AI terlatih seperti Chat GPT, Llama 3 atau Claude di pusat data nyata setiap hari. Estimasi terkini menyarankan bahwa biaya untuk mengembangkan sistem generasi mendatang yang terbesar ini bisa mencapai sekitar $1 miliar, dengan biaya inferensi berpotensi 8-10 kali lebih tinggi.

Melonjaknya biaya penerapan AI dalam produksi harian membuat banyak perusahaan tidak dapat sepenuhnya mengadopsi AI—perusahaan yang “tidak memiliki”. menemukan bahwa hanya satu dari empat perusahaan yang berhasil meluncurkan inisiatif AI dalam 12 bulan terakhir dan 42% perusahaan belum melihat manfaat signifikan dari inisiatif AI generatif.

Untuk benar-benar mendemokratisasi AI dan membuatnya ada di mana-mana — artinya, adopsi bisnis yang meluas — industri AI kita harus mengubah fokus. Alih-alih berlomba untuk mendapatkan model dan chip AI terbesar dan tercepat, kita memerlukan upaya yang lebih kolaboratif untuk meningkatkan keterjangkauan, mengurangi konsumsi daya, dan membuka pasar AI untuk berbagi potensi penuh dan positifnya secara lebih luas. Perubahan sistemik akan meningkatkan semua pihak dengan membuat AI lebih menguntungkan bagi semua pihak dengan manfaat konsumen yang luar biasa.

Ada tanda-tanda yang menjanjikan bahwa pemotongan biaya AI dapat dilakukan – menurunkan hambatan finansial untuk mendukung inisiatif AI nasional dan global berskala besar. Perusahaan saya, NeuReality, bekerja sama dengan Qualcomm untuk mencapai hingga Pengurangan biaya 90% dan efisiensi energi 15 kali lebih baik untuk berbagai aplikasi AI di seluruh teks, bahasa, suara, dan gambar – komponen dasar AI. Anda mengetahui model-model AI tersebut di bawah istilah populer industri seperti visi komputer, AI percakapan, pengenalan suara, pemrosesan bahasa alami, AI generatif, dan model bahasa besar. Dengan berkolaborasi dengan lebih banyak penyedia perangkat lunak dan layanan, kita dapat terus menyesuaikan AI dalam praktik untuk meningkatkan kinerja dan menekan biaya.

Faktanya, kami berhasil menurunkan biaya dan daya per kueri AI dibandingkan dengan infrastruktur tradisional yang berpusat pada CPU yang saat ini menjadi andalan semua chip akselerator AI, termasuk GPU Nvidia. Peralatan Inferensi AI NR1-S kami mulai dikirimkan selama musim panas dengan akselerator Qualcomm Cloud AI 100 Ultra yang dipasangkan dengan NAPU NR1. Hasilnya adalah arsitektur NeuReality alternatif yang menggantikan CPU tradisional di pusat data AI – hambatan terbesar dalam pemrosesan data AI saat ini. Perubahan evolusioner itu sangat mendalam dan sangat diperlukan.

Melampaui Hype: Membangun Masa Depan AI yang Berkelanjutan dan Ekonomis

Mari kita melangkah lebih jauh dari sekadar sensasi AI dan mulai serius dalam mengatasi tantangan sistemik kita. Pekerjaan berat ada di depan mata di tingkat sistem, yang mengharuskan seluruh industri AI kita untuk bekerja sama—bukan melawan—satu sama lain. Dengan berfokus pada keterjangkauan, keberlanjutan, dan aksesibilitas, kita dapat menciptakan industri AI dan basis pelanggan yang lebih luas yang memberi manfaat bagi masyarakat dengan cara yang lebih besar. Itu berarti menawarkan pilihan infrastruktur yang berkelanjutan tanpa kekayaan AI yang terpusat di tangan segelintir orang, yang dikenal sebagai Big 7.

Masa depan AI bergantung pada upaya kolektif kita saat ini. Dengan memprioritaskan efisiensi energi dan aksesibilitas, kita dapat menghindari masa depan yang didominasi oleh infrastruktur AI yang haus daya dan oligarki AI yang berfokus pada kinerja mentah dengan mengorbankan manfaat yang meluas. Pada saat yang sama, kita harus mengatasi konsumsi energi yang tidak berkelanjutan yang menghambat potensi AI untuk merevolusi keselamatan publik, perawatan kesehatan, dan layanan pelanggan.

Dengan berbuat demikian, kami menciptakan siklus investasi dan profitabilitas AI yang kuat yang didorong oleh inovasi yang tersebar luas.

Siapa yang bersama kita?

Moshe Tanach adalah salah satu pendiri dan CEO NeuRealitasSebelum mendirikan NeuReality, ia adalah direktur teknik di Marvell dan Intel, yang memimpin produksi massal produk nirkabel dan jaringan yang kompleks. Ia juga menjabat sebagai AVP R&D di DesignArt-Networks (yang kemudian diakuisisi oleh Qualcomm), yang mengembangkan produk stasiun pangkalan 4G. Ia meraih gelar BSEE dari Technion, Israel, dengan predikat Cum Laude.