Connect with us

Leaders d’opinion

Microdosing sur l’IA à faible hallucinogénèse

mm

L’Agentforce est arrivé. Salesforce a clôturé une autre édition de sa conférence annuelle Dreamforce ce septembre. Rejoignant les nuées de participants — et les nuées de Waymos qui les transportaient autour d’un San Francisco extra-proprement nettoyé — nous avons maintenant chacun une nuée d’agents à nos doigts pour transformer le travail, soigneusement contrôlés dans l’écosystème Salesforce. Alors que Dreamforce est toujours un spectacle pour ses annonces de marketing affûtées sur l’avenir, cette année a fourni une vision inattendument convaincante de la façon dont les agents basés sur l’IA sont sur le point de révolutionner le lieu de travail et l’expérience client.

Tempons nos attentes pendant un peu plus longtemps. Benioff a réfléchi dans sa conférence principale, « Pourquoi nos agents seraient-ils si peu hallucinogènes ? » Oui, ils ont les données, les métadonnées, les flux de travail et une vaste gamme de services pour se connecter ; et tant que vos systèmes ne vivent qu’à l’intérieur de Salesforce, cela sonne plutôt idéal. Salesforce peut ou non avoir inventé l’ingénierie de prompt, une affirmation que Benioff a également faite dans la conférence principale, évoquant peut-être la monologue de « Austin Powers » Dr. Evil sur son père ayant inventé le point d’interrogation. Mais Salesforce peut-il répondre à la vision d’Agentforce ? Si c’est le cas, ce sera un grand événement pour la façon dont le travail est accompli.

Soyons réalistes cependant : nos systèmes et nos données ne vivent pas tous à l’intérieur de Salesforce. Si l’avenir du travail est défini par des groupes d’agents travaillant ensemble, jusqu’où les jardins clos et les écosystèmes fermés peuvent-ils vraiment nous amener à livrer des résultats à travers nos entreprises ? Certes, Apple et Microsoft et Amazon et une multitude d’autres veulent s’emparer de l’énorme opportunité d’agents qui se présente à nous. Mais à mesure que chaque vague de progrès technique a apporté différents parfums de débats ouverts/fermés, nous allons finalement avoir besoin d’une norme pour les agents travaillant ensemble avec d’autres à travers les frontières. Sinon, seules des parties de votre entreprise rencontreront cette opportunité.

Comme nous le faisons souvent lorsqu’on est confronté au dilemme ouvert/fermé, regardons le web ouvert comme une voie à suivre. Tout comme les applications sur votre téléphone ont besoin d’une vue web pour permettre une infinité de résultats d’applications mobiles, la même chose sera nécessaire dans la prochaine frontière multi-agents. Des outils comme Slack fournissent des cadres d’interface utilisateur comme Block Kit qui peuvent alimenter l’interface utilisateur pour une interaction d’agent simple, mais cela n’est pas conçu pour gérer la profondeur des expériences utilisateur modernes. Prenez Clockwise Prism comme exemple. Nous avons construit un agent de planification de niveau supérieur pour trouver du temps pour une réunion même s’il n’y a pas d’espace blanc actuel sur le calendrier de demain. Lorsque vous le connectez à d’autres agents pour obtenir cette réunion impossible avec vos prospects de vente les plus chauds, vous aurez besoin d’un moyen de confirmer ou d’explorer une myriade d’options de planification sophistiquées et puissantes. Fournir une vue web pour cela est la voie à suivre.

Tout au long de sa conférence principale, Benioff a répété la devise que vous ne voulez pas d’agents DIY dans votre entreprise. Et il a raison. Les entreprises veulent des flux de travail contrôlés et simplifiés qui livrent une valeur répétitive. Et pourtant, elles ne veulent pas être coincées dans un silo. C’est pourquoi nous avons besoin d’une norme ouverte pour l’avenir multi-agents. Nous avons besoin d’un moyen fiable pour que les agents interagissent les uns avec les autres, pour traverser les frontières des applications et des écosystèmes et le faire d’une manière qui maintient les entreprises en contrôle de leur expérience de produit.

Vous pourriez être tout aussi susceptible de lancer un ensemble d’agents de travail à partir d’un ticket Atlassian Jira connecté à un cas client Salesforce que vous le feriez à l’inverse, en partant de Salesforce connecté à Atlassian. Pour que les agents travaillent ensemble, quel que soit l’endroit d’où provient la demande de travail et dans n’importe quelle direction avec une expérience utilisateur cohérente, une norme pour le faire est nécessaire.

Qu’est-ce qui devrait être représenté dans cette norme ? En dehors de Salesforce, l’écosystème multi-agents d’aujourd’hui est un excitant Far West. Chaque jour, nous voyons de nouvelles innovations et des moyens de connecter et de construire des systèmes et des flux de travail d’agents. Un récent lien entre le cadre d’IA LangChain et un outil appelé Assitant-UI a apporté cette perspective :

“L’UX est crucial pour les agents. Tout le monde veut des agents avec une interface utilisateur générative, en streaming, et un humain dans la boucle dans leur application.”

En effet, nous avons déjà couvert à quel point l’expérience utilisateur est cruciale pour les agents. Et clairement, les agents doivent être capables de diffuser rapidement leurs réponses lorsqu’ils travaillent avec d’autres agents. Mais qu’en est-il de l’interface utilisateur générative et de l’humain dans la boucle dans leur application ?

Commençons par l’humain dans la boucle ; un autre domaine de large accord. Alors que Salesforce et d’autres parlent beaucoup de l’automatisation, cela est toujours ancré dans le besoin de pouvoir ramener un humain au centre lorsque cela est nécessaire. Nous avons appris cette leçon nous-mêmes à Clockwise, et avons construit notre expérience d’agent de planification autour d’un concept central de pouvoir revenir vers l’utilisateur avec une proposition de options de planification. Lorsque vous faites un travail complexe, c’est incroyable d’arriver à une automatisation complète, mais cela commence sur la base de l’implication de l’utilisateur et de son maintien dans la boucle. Toute norme doit être construite autour d’une capacité facultative de vérifier et de confirmer avec l’utilisateur avant de procéder, et éventuellement permettre une automatisation complète lorsque la confiance est suffisamment élevée.

Et qu’en est-il de l’interface utilisateur générative ? Ici, je proposerais que ce qui est nécessaire n’est pas nécessairement une interface utilisateur générative, mais une « interface utilisateur native ». Ce qui est important, c’est que l’agent produit une interface utilisateur qui est native et contrôlée par le service/agent qui répond à la demande. Seul le service natif aura le contexte et la compréhension nécessaires pour rendre une interface utilisateur qui relie l’agent à la demande. Que cette interface utilisateur soit rendue à l’aide d’une intelligence artificielle générative ou d’un autre mécanisme non-IA est laissé au service répondant comme détail d’implémentation. Et donc, ici, nous pensons que la norme ouverte doit permettre au service répondant de contrôler et de livrer une interface utilisateur native à une demande d’agent.

Que se passe-t-il ensuite ? Nous sommes excités de continuer à examiner ce que pourrait ressembler un avenir multi-agents ouvert. Nous avons créé un brouillon de quelque chose que nous appelons Protocole multi-agents ouvert (OMAP) et nous sommes impatients de continuer à faire avancer la conversation. Ce ne sera pas long avant qu’il y ait entièrement de nouveaux types d’emplois où les gens utilisent des agents pour faire du travail de manière puissante et rationalisée. L’ère de la description de travail d’Orchestrateur d’agents est sur nous, et alors que Salesforce peint un chemin convaincant vers l’avant, nous aurons besoin d’une norme pour que les agents se connectent au-delà des frontières.

Gary Lerhaupt est le co-fondateur et le CTO de Clockwise. En 2024, il a aidé à construire Prism, le calendrier intelligent de Clockwise alimenté par l'IA. Il était auparavant le VP de l'ingénierie chez RelateIQ (acquis par Salesforce). Il possède un BS en informatique de l'Ohio State, et un master en informatique de l'Université Stanford.