Terhubung dengan kami

Pemimpin Pikiran

Mikrodosis pada AI Rendah Halusinogen

Agen Force sudah ada di sini. Salesforce menyelesaikan edisi lain dari laporan tahunannya Konferensi Dreamforce September ini. Bergabung dengan kerumunan peserta — dan kerumunan Waymos yang mengantar mereka di sekitar San Francisco yang sangat bersih — kita masing-masing sekarang memiliki sekelompok agen di ujung jari kita untuk mengubah pekerjaan, yang dikontrol dengan rapi dalam ekosistem Salesforce. Sementara Dreamforce selalu menjadi tontonan untuk pernyataan pemasarannya yang diasah tentang masa depan, tahun ini memberikan visi yang tak terduga menarik tentang bagaimana agen berbasis AI akan merevolusi tempat kerja dan pengalaman pelanggan.

Mari kita kurangi ekspektasi kita sedikit lebih lama. Benioff merenungkan pidato utamanya, "Mengapa agen kita begitu rendah halusinogen?" Ya, mereka memiliki data, metadata, alur kerja, dan beragam layanan untuk dihubungkan; dan selama sistem Anda hanya ada di Salesforce, kedengarannya cukup ideal. Salesforce mungkin telah atau belum menemukan rekayasa cepat, klaim yang juga dibuat Benioff dalam pidato utamanya mungkin mengingatkan kita pada monolog Dr. Evil "Austin Powers" tentang ayahnya yang menemukan tanda tanya. Namun, dapatkah Salesforce memenuhi visi Agentforce? Jika mereka berhasil, itu akan menjadi masalah besar bagi cara kerja.

Namun, mari kita bersikap realistis: sistem dan data kita tidak semuanya ada di dalam Salesforce. Jika masa depan pekerjaan ditentukan oleh sekelompok agen yang bekerja bersama, seberapa jauh taman berpagar dan ekosistem tertutup benar-benar dapat membantu kita dalam memberikan hasil di seluruh bisnis kita? Tentu saja Apple, Microsoft, Amazon, dan banyak lainnya ingin memanfaatkan peluang agen besar di depan kita. Namun, karena setiap gelombang kemajuan teknis telah memunculkan berbagai bentuk perdebatan tertutup vs. terbuka, pada akhirnya kita akan membutuhkan standar bagi agen untuk bekerja sama satu sama lain lintas batas. Jika tidak, hanya sebagian dari bisnis Anda yang akan memenuhi peluang ini.

Seperti yang sering kita lakukan ketika dihadapkan dengan teka-teki terbuka/tertutup, mari kita lihat web terbuka sebagai jalan ke depan. Sama seperti aplikasi di ponsel Anda memerlukan tampilan web untuk mengaktifkan rangkaian hasil aplikasi seluler yang tak terbatas, hal yang sama akan diperlukan di perbatasan multi-agen yang akan datang. Alat seperti Slack menyediakan kerangka kerja UI seperti Block Kit yang dapat mendukung antarmuka pengguna untuk interaksi agen yang sederhana, tetapi tidak cocok untuk menangani kedalaman pengalaman pengguna modern. Ambil Clockwise Prism sebagai contoh. Kami telah membangun agen penjadwalan tingkat berikutnya untuk menemukan waktu untuk rapat bahkan jika tidak ada "ruang kosong" saat ini di kalender besok. Saat menghubungkannya ke agen lain untuk mendapatkan rapat yang mustahil dengan prospek penjualan terpanas Anda, Anda memerlukan cara untuk mengonfirmasi atau menjelajahi segudang opsi penjadwalan yang canggih dan canggih. Menyediakan tampilan web untuk melakukan ini adalah jalan yang jelas ke depan.

Sepanjang pidato utamanya, Benioff mengulang mantra bahwa Anda tidak menginginkan agen DIY dalam bisnis Anda. Dan dia benar. Perusahaan menginginkan alur kerja yang terkontrol dan disederhanakan yang memberikan nilai yang dapat diulang. Namun, mereka tidak ingin terjebak dalam silo. Inilah sebabnya kita memerlukan standar terbuka untuk masa depan multi-agen. Kita memerlukan cara yang dapat diandalkan bagi agen untuk berinteraksi satu sama lain, untuk melintasi batas di seluruh aplikasi dan ekosistem, dan melakukannya dengan cara yang membuat bisnis tetap memegang kendali atas pengalaman produk mereka.

Anda mungkin akan memulai sekumpulan agen kerja dari dalam tiket Atlassian Jira yang terhubung ke kasus pelanggan Salesforce seperti halnya Anda ingin memulai sekumpulan agen secara terbalik yang berasal dari dalam Salesforce yang terhubung ke Atlassian. Agar agen dapat bekerja sama terlepas dari asal permintaan kerja dan dalam sejumlah arah dengan pengalaman pengguna yang konsisten, sekali lagi diperlukan standar untuk melakukan hal ini.

Apa lagi yang harus direpresentasikan dalam standar ini? Di luar Salesforce, ekosistem multi-agen saat ini adalah dunia yang sangat liar. Setiap hari kita melihat inovasi dan cara baru untuk menghubungkan dan membangun sistem AI dan alur kerja agen. Satu keterkaitan baru-baru ini antara kerangka kerja AI LangChain dan alat yang disebut Assitant-UI menghasilkan hal ini wawasan:

“UX sangat penting bagi agen. Semua orang menginginkan agen dengan streaming, UI generatif, dan human-in-the-loop dalam aplikasi mereka.”

Memang, kami telah membahas betapa pentingnya pengalaman pengguna bagi agen. Dan jelas agen harus dapat dengan cepat mengalirkan respons mereka saat bekerja dengan agen lain. Namun, bagaimana dengan UI generatif dan keterlibatan manusia dalam aplikasi mereka?

Mari kita mulai dengan keterlibatan manusia; area lain yang disetujui secara luas. Sementara Salesforce dan yang lain berbicara banyak tentang otomatisasi, hal itu selalu didasarkan pada kebutuhan untuk dapat membawa kembali manusia ke pusat ketika diperlukan. Kami juga mempelajari pelajaran ini di Clockwise, dan telah membangun pengalaman agen penjadwalan kami di sekitar konsep inti untuk dapat memeriksa kembali dengan pengguna dengan serangkaian opsi penjadwalan yang diusulkan. Ketika Anda melakukan pekerjaan yang kompleks, sungguh menakjubkan untuk mencapai otomatisasi penuh, tetapi itu dimulai dengan melibatkan pengguna dan membuat mereka tetap terlibat. Setiap standar harus dibangun di sekitar kemampuan opsional untuk memeriksa dan mengonfirmasi dengan pengguna sebelum melanjutkan, dan akhirnya memungkinkan otomatisasi penuh ketika keyakinan cukup tinggi.

Lalu bagaimana dengan UI generatif? Di sini saya mengusulkan bahwa yang dibutuhkan tidak mesti UI generatif, tetapi "UI asli". Yang penting adalah agen tersebut menghasilkan UI yang asli dan dikendalikan oleh layanan/agen yang menanggapi permintaan tersebut. Hanya layanan asli yang akan memiliki konteks dan pemahaman yang diperlukan untuk merender antarmuka pengguna yang terkait dengan permintaan agen. Apakah UI tersebut dirender menggunakan AI generatif atau mekanisme non-AI lainnya, diserahkan kepada layanan yang menanggapi sebagai detail implementasi. Jadi di sini, kami pikir standar terbuka harus memungkinkan layanan yang menanggapi untuk mengendalikan dan mengirimkan UI asli ke permintaan agen.

Apa yang akan terjadi selanjutnya? Kami bersemangat untuk terus meneliti seperti apa masa depan multi-agen yang terbuka. Kami telah membuat draf sesuatu yang kami sebut Protokol Multi-Agen Terbuka (OMAP) dan kami bersemangat untuk terus mendorong pembicaraan ini. Tidak lama lagi akan ada jenis pekerjaan yang sama sekali baru di luar sana di mana orang menggunakan agen untuk melakukan pekerjaan dengan cara yang hebat dan efisien. Era deskripsi pekerjaan Agen Orkestrator sudah di depan mata, dan sementara Salesforce menggambarkan jalur yang menarik ke depan, kita akan membutuhkan cara standar bagi agen untuk saling terhubung melampaui batas.

Gary Lerhaupt adalah Co-Founder dan CTO dari Searah jarum jam. Pada tahun 2024, ia membantu membangun Prism, kalender cerdas Clockwise yang didukung oleh AI. Sebelumnya, ia adalah VP Teknik di RelateIQ (diakuisisi oleh Salesforce). Ia meraih gelar Sarjana Sains Komputer dari Ohio State, dan gelar Magister Sains Komputer dari Universitas Stanford.