Pemimpin pemikiran

Munculnya LLMOps di Era AI

mm

Dalam lanskap IT yang berkembang cepat, MLOps—singkatan dari Machine Learning Operations—telah menjadi senjata rahasia bagi organisasi yang bertujuan untuk mengubah data kompleks menjadi wawasan yang kuat dan dapat diandalkan. MLOps adalah sekumpulan praktik yang dirancang untuk mempermudah siklus hidup pembelajaran mesin (ML)—membantu ilmuwan data, tim IT, pemangku kepentingan bisnis, dan ahli domain bekerja sama untuk membangun, mengirim, dan mengelola model ML secara konsisten dan dapat diandalkan. Ini muncul untuk mengatasi tantangan unik ML, seperti memastikan kualitas data dan menghindari bias, dan telah menjadi pendekatan standar untuk mengelola model ML di seluruh fungsi bisnis.

Dengan munculnya model bahasa besar (LLM), namun, tantangan baru telah muncul. LLM memerlukan daya komputasi yang besar, infrastruktur yang canggih, dan teknik seperti teknik perancangan prompt untuk beroperasi secara efisien. Kompleksitas ini telah memunculkan evolusi khusus dari MLOps yang disebut LLMOps (Large Language Model Operations).

LLMOps fokus pada mengoptimalkan siklus hidup LLM, dari pelatihan dan penyetelan hingga pengiriman, penskalaan, pemantauan, dan pemeliharaan model. Ini bertujuan untuk mengatasi tuntutan khusus LLM sambil memastikan mereka beroperasi secara efektif di lingkungan produksi. Ini termasuk pengelolaan biaya komputasi yang tinggi, penskalaan infrastruktur untuk mendukung model besar, dan mempermudah tugas seperti teknik perancangan prompt dan penyetelan.

Dengan pergeseran ini ke LLMOps, sangat penting bagi pemimpin bisnis dan IT untuk memahami manfaat utama dari LLMOps dan menentukan proses mana yang paling sesuai untuk digunakan dan kapan.

Manfaat Utama dari LLMOps

LLMOps membangun fondasi MLOps, menawarkan kemampuan yang ditingkatkan di beberapa area kunci. Tiga cara utama LLMOps memberikan manfaat yang lebih besar kepada perusahaan adalah:

  • Demokratisasi AI – LLMOps membuat pengembangan dan pengiriman LLM lebih mudah diakses oleh pemangku kepentingan non-teknis. Dalam alur kerja ML tradisional, ilmuwan data terutama menangani pembangunan model, sementara insinyur fokus pada pipa dan operasi. LLMOps menggeser paradigma ini dengan menggunakan model sumber terbuka, layanan propietary, dan alat kode rendah/tanpa kode. Alat-alat ini mempermudah pembangunan model dan pelatihan, memungkinkan tim bisnis, manajer produk, dan insinyur untuk bekerja sama lebih efektif. Pengguna non-teknis sekarang dapat bereksperimen dengan dan mengirim LLM menggunakan antarmuka yang intuitif, mengurangi hambatan teknis untuk adopsi AI.
  • Pengiriman Model yang Lebih Cepat: LLMOps mempermudah integrasi LLM dengan aplikasi bisnis, memungkinkan tim untuk mengirim solusi yang ditenagai AI lebih cepat dan menyesuaikan diri dengan permintaan pasar yang berubah. Misalnya, dengan LLMOps, bisnis dapat dengan cepat menyesuaikan model untuk mencerminkan umpan balik pelanggan atau pembaruan peraturan tanpa siklus pengembangan yang luas. Fleksibilitas ini memastikan bahwa organisasi dapat tetap memimpin tren pasar dan mempertahankan keunggulan kompetitif.
  • Munculnya RAGs – Banyak kasus penggunaan LLM di perusahaan melibatkan pengambilan data yang relevan dari sumber eksternal daripada hanya mengandalkan model pra-dilatih. LLMOps memperkenalkan pipa RAG (Retrieval-Augmented Generation), yang menggabungkan model pengambilan untuk mengambil data dari basis pengetahuan dengan LLM yang memeringkat dan merangkum informasi. Pendekatan ini mengurangi halusinasi dan menawarkan cara yang efektif biaya untuk memanfaatkan data perusahaan. Tidak seperti alur kerja ML tradisional, di mana pelatihan model adalah fokus utama, LLMOps mengalihkan perhatian ke pembangunan dan pengelolaan pipa RAG sebagai fungsi inti dalam siklus hidup pengembangan.

Pentingnya Memahami Kasus Penggunaan LLMOps

Dengan manfaat umum dari LLMOps, termasuk demokratisasi alat AI di seluruh perusahaan, sangat penting untuk melihat kasus penggunaan khusus di mana LLMOps dapat diterapkan untuk membantu pemimpin bisnis dan tim IT lebih baik memanfaatkan LLM:

  • Pengiriman Model yang Aman– Banyak perusahaan memulai pengembangan LLM mereka dengan kasus penggunaan internal, termasuk bot dukungan pelanggan otomatis atau generasi dan tinjauan kode untuk memperoleh kepercayaan pada kinerja LLM sebelum menskala ke aplikasi yang menghadap pelanggan. Kerangka LLMOps membantu tim untuk mempermudah pengiriman pipa yang bertahap dari kasus penggunaan ini dengan 1) mengotomatisasi pipa pengiriman yang mengisolasi lingkungan internal dari lingkungan yang menghadap pelanggan, 2) memungkinkan pengujian dan pemantauan yang terkendali di lingkungan yang diisolasi untuk mengidentifikasi dan mengatasi mode kegagalan, dan 3) mendukung kontrol versi dan kemampuan rollback sehingga tim dapat mengulangi pengiriman internal sebelum diluncurkan secara eksternal.
  • Pengelolaan Risiko Model – LLM saja memperkenalkan kekhawatiran yang meningkat seputar pengelolaan risiko model, yang selalu menjadi fokus kritis untuk MLOps. Transparansi ke dalam data apa LLM dilatih sering kabur, menimbulkan kekhawatiran tentang privasi, hak cipta, dan bias. Halusinasi data telah menjadi titik sakit besar dalam pengembangan model. Namun, dengan LLMOps, tantangan ini diatasi. LLMOps dapat memantau perilaku model secara waktu nyata, memungkinkan tim untuk 1) mendeteksi dan mendaftarkan halusinasi menggunakan pintasan yang telah ditetapkan sebelumnya, 2) mengimplementasikan loop umpan balik untuk terus memperbaiki model dengan memperbarui prompt atau melatih kembali dengan output yang diperbaiki, dan 3) menggunakan metrik untuk lebih memahami dan mengatasi ketidakpastian generatif.
  • Mengevaluasi dan Memantau Model– Mengevaluasi dan memantau LLM mandiri lebih kompleks daripada model ML mandiri. Tidak seperti model tradisional, aplikasi LLM sering spesifik konteks, memerlukan input dari ahli materi untuk evaluasi yang efektif. Untuk mengatasi kompleksitas ini, kerangka evaluasi otomatis telah muncul, di mana satu LLM digunakan untuk menilai yang lain. Kerangka ini membuat pipa untuk evaluasi terus-menerus, menggabungkan tes otomatis atau benchmark yang dikelola oleh sistem LLMOps. Pendekatan ini melacak kinerja model, menandai anomali, dan memperbaiki kriteria evaluasi, mempermudah proses menilai kualitas dan keandalan output generatif.

LLMOps menyediakan tulang punggung operasional untuk mengelola kompleksitas tambahan dari LLM yang tidak dapat dikelola oleh MLOps sendiri. LLMOps memastikan bahwa organisasi dapat mengatasi titik sakit seperti ketidakpastian output generatif dan munculnya kerangka evaluasi baru, semuanya sambil memungkinkan pengiriman yang aman dan efektif. Dengan ini, sangat penting bahwa perusahaan memahami pergeseran ini dari MLOps ke LLMOps untuk mengatasi tantangan unik LLM di dalam organisasi mereka sendiri dan menerapkan operasi yang benar untuk memastikan keberhasilan dalam proyek AI mereka.

Menghadap Masa Depan: Mengadopsi AgentOps

Sekarang bahwa kita telah memasuki LLMOps, sangat penting untuk mempertimbangkan apa yang ada di depan untuk kerangka operasional saat AI terus berinovasi. Saat ini di garis depan ruang AI adalah AI agen – yang merupakan program otomatis penuh dengan kemampuan penalaran kompleks dan memori yang menggunakan LLM untuk memecahkan masalah, membuat rencana untuk melakukannya, dan melaksanakan rencana tersebut. Deloitte memprediksi bahwa 25% perusahaan yang menggunakan AI generatif kemungkinan akan mengirimkan agen AI pada 2025, tumbuh menjadi 50% pada 2027. Data ini menunjukkan pergeseran yang jelas ke AI agen di masa depan – pergeseran yang telah dimulai karena banyak organisasi telah mulai menerapkan dan mengembangkan teknologi ini.

Dengan ini, AgentOps adalah gelombang berikutnya dari operasi AI yang perusahaan harus siapkan.

AgentOps menggabungkan elemen AI, otomatisasi, dan operasi dengan tujuan untuk memperbaiki cara tim mengelola dan menskala proses bisnis. Ini fokus pada memanfaatkan agen pintar untuk meningkatkan alur kerja operasional, menyediakan wawasan waktu nyata, dan mendukung pengambilan keputusan di berbagai industri. Menerapkan kerangka AgentOps secara signifikan meningkatkan konsistensi perilaku agen AI dan respons terhadap situasi yang tidak biasa, dengan tujuan untuk meminimalkan downtime dan kegagalan. Ini akan menjadi penting karena lebih banyak organisasi mulai mengirim dan menggunakan agen AI dalam alur kerja mereka.

AgentOps adalah komponen yang diperlukan untuk mengelola generasi berikutnya dari sistem AI. Organisasi harus fokus pada memastikan observabilitas sistem, jejak, dan pemantauan yang ditingkatkan untuk mengembangkan agen AI yang inovatif dan berpikiran maju. Saat otomatisasi berkembang dan tanggung jawab AI tumbuh, integrasi efektif dari AgentOps sangat penting bagi organisasi untuk mempertahankan kepercayaan pada AI dan menskala operasi yang kompleks dan khusus.

Namun, sebelum perusahaan dapat mulai bekerja dengan AgentOps, mereka harus memiliki pemahaman yang jelas tentang LLMOps – yang telah diuraikan di atas – dan bagaimana kedua operasi bekerja bersama. Tanpa pendidikan yang tepat seputar LLMOps, perusahaan tidak akan dapat membangun fondasi yang ada saat bekerja menuju implementasi AgentOps.

Sebagai kepala petugas strategi, Abhas memimpin strategi perusahaan secara keseluruhan untuk Cloudera dan bertanggung jawab untuk menciptakan visi perusahaan, membangun model operasi target bisnis dan pelanggan, berkomunikasi dengan para pemangku kepentingan kunci, dan melaksanakan inisiatif transformasional kunci.