Connect with us

Pemimpin pemikiran

Panduan untuk Memahami, Membangun, dan Mengoptimalkan Agen yang Memanggil API

mm

Peran Kecerdasan Buatan dalam perusahaan teknologi berkembang dengan cepat; kasus penggunaan AI telah berkembang dari pemrosesan informasi pasif ke agen proaktif yang dapat mengeksekusi tugas. Menurut survei adopsi AI global yang dilakukan oleh Georgian dan NewtonX pada Maret 2025, 91% eksekutif teknis di perusahaan pertumbuhan dan perusahaan besar dilaporkan menggunakan atau berencana menggunakan agen AI yang proaktif.

Agen yang memanggil API adalah contoh utama dari pergeseran ini ke arah agen. Agen yang memanggil API menggunakan Model Bahasa Besar (LLM) untuk berinteraksi dengan sistem perangkat lunak melalui Antarmuka Pemrograman Aplikasi (API) mereka.

Misalnya, dengan menerjemahkan perintah bahasa alami menjadi panggilan API yang tepat, agen dapat mengambil data waktu nyata, mengotomatisasi tugas rutin, atau bahkan mengontrol sistem perangkat lunak lain. Kemampuan ini mengubah agen AI menjadi perantara yang berguna antara niat manusia dan fungsionalitas perangkat lunak.

Perusahaan saat ini menggunakan agen yang memanggil API di berbagai domain, termasuk:

  • Aplikasi Konsumen: Asisten seperti Siri dari Apple atau Alexa dari Amazon dirancang untuk mempermudah tugas sehari-hari, seperti mengontrol perangkat rumah pintar dan membuat reservasi.
  • Alur Kerja Perusahaan: Perusahaan telah mengirimkan agen API untuk mengotomatisasi tugas berulang seperti mengambil data dari CRM, menghasilkan laporan, atau mengkonsolidasikan informasi dari sistem internal.
  • Pengambilan Data dan Analisis: Perusahaan menggunakan agen API untuk mempermudah akses ke dataset propietary, sumber daya berlangganan, dan API publik untuk menghasilkan wawasan.

Dalam artikel ini, saya akan menggunakan pendekatan yang berfokus pada teknik untuk memahami, membangun, dan mengoptimalkan agen yang memanggil API. Materi dalam artikel ini didasarkan sebagian pada penelitian dan pengembangan praktis yang dilakukan oleh Laboratorium AI Georgian. Pertanyaan yang memotivasi sebagian besar penelitian Laboratorium AI di bidang agen yang memanggil API adalah: “Jika suatu organisasi memiliki API, apa cara paling efektif untuk membangun agen yang dapat berinteraksi dengan API tersebut menggunakan bahasa alami?”

Saya akan menjelaskan bagaimana agen yang memanggil API bekerja dan bagaimana untuk berhasil merancang dan mengembangkan agen tersebut untuk kinerja. Akhirnya, saya akan menyediakan alur kerja sistematis yang tim teknik dapat gunakan untuk mengimplementasikan agen yang memanggil API.

I. Definisi Kunci:

  • API atau Antarmuka Pemrograman Aplikasi: Sebuah set aturan dan protokol yang memungkinkan aplikasi perangkat lunak yang berbeda untuk berkomunikasi dan bertukar informasi.
  • Agen: Sebuah sistem AI yang dirancang untuk memahami lingkungannya, membuat keputusan, dan mengambil tindakan untuk mencapai tujuan tertentu.
  • Agen yang Memanggil API: Sebuah agen AI khusus yang menerjemahkan instruksi bahasa alami menjadi panggilan API yang tepat.
  • Agen Pembangkit Kode: Sebuah sistem AI yang membantu dalam pengembangan perangkat lunak dengan menulis, memodifikasi, dan meng-debug kode. Meskipun terkait, fokus saya di sini terutama pada agen yang memanggil API, meskipun AI juga dapat membantu membangun agen tersebut.
  • MCP (Protokol Konteks Model): Sebuah protokol, terutama dikembangkan oleh Anthropic, yang mendefinisikan bagaimana LLM dapat terhubung ke dan menggunakan alat dan sumber daya eksternal.

II. Tugas Inti: Menerjemahkan Bahasa Alami ke dalam Tindakan API

Fungsi fundamental dari agen yang memanggil API adalah untuk menafsirkan permintaan bahasa alami pengguna dan mengubahnya menjadi satu atau beberapa panggilan API yang tepat. Proses ini biasanya melibatkan:

  1. Pengenalan Niat: Memahami tujuan pengguna, bahkan jika diekspresikan dengan ambigu.
  2. Pemilihan Alat: Mengidentifikasi titik akhir API yang tepat—atau “alat”—dari sekumpulan pilihan yang tersedia yang dapat memenuhi niat.
  3. Pengambilan Parameter: Mengidentifikasi dan mengekstrak parameter yang diperlukan untuk panggilan API yang dipilih dari kueri pengguna.
  4. Eksekusi dan Pembuatan Respons: Membuat panggilan API, menerima respons, dan kemudian mensintesis informasi ini menjadi jawaban yang koheren atau melakukan tindakan selanjutnya.

Pertimbangkan permintaan seperti, “Hai Siri, apa cuaca hari ini?” Agen harus mengidentifikasi kebutuhan untuk memanggil API cuaca, menentukan lokasi pengguna saat ini (atau mengizinkan spesifikasi lokasi), dan kemudian merumuskan panggilan API untuk mengambil informasi cuaca.

Untuk permintaan “Hai Siri, apa cuaca hari ini?”, contoh panggilan API mungkin terlihat seperti:

GET /v1/cuaca?lokasi=New%20York&satuan=metrik

Tantangan awal yang inheren dalam proses terjemahan ini termasuk ketidakjelasan bahasa alami dan kebutuhan agen untuk mempertahankan konteks di seluruh interaksi multi-langkah.

Misalnya, agen sering harus “mengingat” bagian sebelumnya dari percakapan atau hasil panggilan API sebelumnya untuk menginformasikan tindakan saat ini. Kehilangan konteks adalah mode kegagalan umum jika tidak dikelola secara eksplisit.

III. Merancang Solusi: Komponen dan Protokol Kunci

Membangun agen yang memanggil API yang efektif memerlukan pendekatan arsitektur yang terstruktur.

1. Mendefinisikan “Alat” untuk Agen

Untuk LLM menggunakan API, kemampuan API tersebut harus dijelaskan kepadanya dengan cara yang dapat dipahami. Setiap titik akhir API atau fungsi sering direpresentasikan sebagai “alat.” Definisi alat yang kuat mencakup:

  • Deskripsi bahasa alami yang jelas tentang tujuan dan fungsionalitas alat.
  • Spesifikasi yang tepat tentang parameter input (nama, tipe, apakah itu diperlukan atau opsional, dan deskripsi).
  • Deskripsi tentang output atau data yang dikembalikan alat.

2. Peran Protokol Konteks Model (MCP)

MCP adalah pengaktif kritis untuk penggunaan alat yang lebih terstandar dan kuat oleh LLM. Ini menyediakan format terstruktur untuk mendefinisikan bagaimana model dapat terhubung ke alat dan sumber daya eksternal.

Standarisasi MCP bermanfaat karena memungkinkan integrasi alat yang lebih mudah, mempromosikan penggunaan kembali definisi alat di seluruh agen atau model yang berbeda. Selanjutnya, ini adalah praktik terbaik untuk tim teknik, dimulai dengan spesifikasi API yang didefinisikan dengan baik, seperti spesifikasi OpenAPI. Alat seperti Stainless.ai dirancang untuk membantu mengonversi spesifikasi OpenAPI ini menjadi konfigurasi MCP, mempermudah proses membuat API “siap agen”.

3. Kerangka Agen & Pilihan Implementasi

Beberapa kerangka dapat membantu dalam membangun agen itu sendiri. Ini termasuk:

  • Pydantic: Meskipun tidak secara eksklusif merupakan kerangka agen, Pydantic berguna untuk mendefinisikan struktur data dan memastikan keamanan tipe untuk input dan output alat, yang penting untuk keandalan. Banyak implementasi agen khusus menggunakan Pydantic untuk integritas struktural ini.
  • mcp_agent dari LastMile: Kerangka ini dirancang khusus untuk bekerja dengan MCP, menawarkan struktur yang lebih beropini yang selaras dengan praktik untuk membangun agen yang efektif seperti yang dijelaskan dalam penelitian dari tempat-tempat seperti Anthropic.
  • Kerangka Internal: Juga semakin umum untuk menggunakan agen pembangkit kode AI (menggunakan alat seperti Cursor atau Cline) untuk membantu menulis kode boilerplate untuk agen, alat, dan logika sekitarnya. Pengalaman Laboratorium AI Georgian bekerja dengan perusahaan pada implementasi agen menunjukkan ini dapat sangat baik untuk membuat kerangka kustom minimal.

IV. Teknik untuk Keandalan dan Kinerja

Memastikan bahwa agen membuat panggilan API dengan andal dan berkinerja baik memerlukan upaya teknik yang terfokus. Dua cara untuk melakukan ini adalah (1) pembuatan dan validasi dataset dan (2) teknik prompt dan optimasi.

1. Pembuatan Dataset & Validasi

Pelatihan (jika berlaku), pengujian, dan optimasi agen memerlukan dataset berkualitas tinggi. Dataset ini harus terdiri dari kueri bahasa alami yang representatif dan urutan panggilan API yang diharapkan atau hasilnya.

  • Pembuatan Manual: Mengkurasi dataset secara manual memastikan presisi dan relevansi yang tinggi tetapi dapat memakan waktu.
  • Generasi Sintetis: Menghasilkan data secara programatik atau menggunakan LLM dapat menskalakan pembuatan dataset, tetapi pendekatan ini menyajikan tantangan signifikan. Penelitian Laboratorium AI Georgian menemukan bahwa memastikan kebenaran dan kompleksitas realistis dari panggilan API dan kueri yang dihasilkan sintetis sangat sulit. Seringkali, pertanyaan yang dihasilkan terlalu sepele atau mustahil kompleks, membuatnya sulit untuk mengukur kinerja agen yang halus. Validasi data sintetis yang cermat sangat penting.

Untuk evaluasi kritis, dataset yang lebih kecil, berkualitas tinggi, dan diverifikasi secara manual sering menyediakan wawasan yang lebih dapat diandalkan daripada dataset sintetis besar yang bising.

2. Teknik Prompt & Optimasi

Kinerja agen berbasis LLM sangat dipengaruhi oleh prompt yang digunakan untuk memandu penalaran dan pemilihan alat.

  • Prompt yang efektif melibatkan mendefinisikan tugas agen dengan jelas, memberikan deskripsi alat yang tersedia, dan membangun prompt untuk mendorong ekstraksi parameter yang akurat.
  • Optimasi sistematis menggunakan kerangka seperti DSPy dapat meningkatkan kinerja secara signifikan. DSPy memungkinkan Anda untuk mendefinisikan komponen agen (misalnya, modul untuk generasi pemikiran, pemilihan alat, pemformatan parameter) dan kemudian menggunakan pendekatan seperti compiler dengan contoh tembakan dari dataset Anda untuk menemukan prompt atau konfigurasi yang dioptimalkan untuk komponen ini.

V. Jalur yang Direkomendasikan untuk Agen API yang Efektif

Mengembangkan agen AI yang memanggil API yang kuat adalah disiplin teknik iteratif. Berdasarkan temuan penelitian Laboratorium AI Georgian, hasilnya dapat ditingkatkan secara signifikan dengan menggunakan alur kerja sistematis seperti berikut:

  1. Mulai dengan Definisi API yang Jelas: Mulai dengan spesifikasi OpenAPI yang terstruktur dengan baik untuk API yang akan diakses agen.
  2. Standarisasi Akses Alat: Konversi spesifikasi OpenAPI ke dalam MCP. Alat seperti Stainless.ai dapat memfasilitasi ini, membuat cara standar untuk agen Anda memahami dan menggunakan API.
  3. Implementasikan Agen: Pilih kerangka atau pendekatan yang sesuai. Ini mungkin melibatkan menggunakan Pydantic untuk pemodelan data dalam struktur agen khusus atau menggunakan kerangka seperti mcp_agent dari LastMile yang dirancang di sekitar MCP.
    • Sebelum melakukan ini, pertimbangkan untuk menghubungkan MCP ke alat seperti Claude Desktop atau Cline, dan secara manual menggunakan antarmuka ini untuk merasakan seberapa baik agen generik dapat menggunakannya, berapa banyak iterasi yang biasanya diperlukan untuk menggunakan MCP dengan benar, dan detail lain yang mungkin dapat menghemat waktu Anda selama implementasi.
  4. Kurasi Dataset Evaluasi Berkualitas: Buat secara manual atau validasi dataset yang teliti dari kueri dan interaksi API yang diharapkan. Ini sangat penting untuk pengujian dan optimasi yang dapat diandalkan.
  5. Optimalkan Prompt dan Logika Agen: Gunakan kerangka seperti DSPy untuk memperbaiki prompt agen dan logika internal, menggunakan dataset Anda untuk mengarahkan perbaikan dalam akurasi dan keandalan.

VI. Contoh Ilustratif dari Alur Kerja

Berikut adalah contoh sederhana yang mengilustrasikan alur kerja yang direkomendasikan untuk membangun agen yang memanggil API:

Langkah 1: Mulai dengan Definisi API yang Jelas

Bayangkan API untuk mengelola Daftar Tugas sederhana, didefinisikan dalam OpenAPI:

openapi: 3.0.0

info:

judul: API Daftar Tugas

versi: 1.0.0

jalur:

/tugas:

pos:

ringkas: Tambahkan tugas baru

badan permintaan:

diperlukan: true

konten:

aplikasi/json:

skema:

tipe: objek

properti:

deskripsi:

tipe: string

respon:

‘201’:

deskripsi: Tugas dibuat dengan sukses

dapatkan:

ringkas: Dapatkan semua tugas

respon:

‘200’:

deskripsi: Daftar tugas

Langkah 2: Standarisasi Akses Alat

Konversi spesifikasi OpenAPI ke dalam konfigurasi Protokol Konteks Model (MCP). Menggunakan alat seperti Stainless.ai, ini mungkin menghasilkan:

Nama Alat Deskripsi Parameter Input Deskripsi Output
Tambah Tugas Menambahkan tugas baru ke Daftar Tugas. `deskripsi` (string, diperlukan): Deskripsi tugas. Konfirmasi pembuatan tugas.
Dapatkan Tugas Mengambil semua tugas dari Daftar Tugas. Tidak ada Daftar tugas dengan deskripsi mereka.

Langkah 3: Implementasikan Agen

Menggunakan Pydantic untuk pemodelan data, buat fungsi yang sesuai dengan alat MCP. Kemudian, gunakan LLM untuk menafsirkan kueri bahasa alami dan memilih alat dan parameter yang tepat.

Langkah 4: Kurasi Dataset Evaluasi Berkualitas

Buat dataset:

Kueri Panggilan API yang Diharapkan Hasil yang Diharapkan
“Tambah ‘Beli bahan makanan’ ke daftar saya.” `Tambah Tugas` dengan `deskripsi` = “Beli bahan makanan” Konfirmasi pembuatan tugas.
“Apa yang ada di daftar saya?” `Dapatkan Tugas` Daftar tugas, termasuk “Beli bahan makanan”

Langkah 5: Optimalkan Prompt dan Logika Agen

Gunakan DSPy untuk memperbaiki prompt, fokus pada instruksi yang jelas, pemilihan alat, dan ekstraksi parameter menggunakan dataset yang dikurasi untuk evaluasi dan perbaikan.

Dengan mengintegrasikan blok bangunan ini – dari definisi API yang terstruktur dan protokol alat standar hingga praktik data yang ketat dan optimasi sistematis – tim teknik dapat membangun agen AI yang memanggil API yang lebih mampu, andal, dan mudah dipertahankan.

Rodrigo Ceballos Lentini adalah AI Tech Lead di Georgian’s AI Lab, di mana ia membantu perusahaan portofolio mencapai hasil yang nyata dari proyek AI generatif dan agen. Rodrigo memegang Gelar Master di Sistem Saraf dan Komputasi dengan fokus pada Komputer Visi dari ETH Zürich.