Inteligencia Artificial
Las barreras para los desarrolladores se reducen a medida que OpenAI simplifica la creación de agentes de IA
OpenAI ha lanzado recientemente un conjunto de nuevas herramientas para desarrolladores destinado a facilitar la creación Agentes de inteligencia artificial que puede realizar tareas complejas de forma autónoma. Anunciada la semana pasada, la actualización introduce una API de Respuestas, un SDK de Agentes de código abierto y herramientas integradas para búsqueda web, búsqueda de archivos y control informático. Todo ello diseñado para optimizar la interacción de los sistemas de IA con la información y las aplicaciones del mundo real.
OpenAI describe a estos agentes como «sistemas que realizan tareas de forma independiente en nombre de los usuarios», lo que significa que pueden llevar a cabo procesos de varios pasos, como investigar un tema o actualizar una base de datos, con mínima intervención humana. El objetivo de la empresa es facilitar que desarrolladores y empresas implementen potentes asistentes basados en IA, ampliando así el acceso a capacidades avanzadas de IA.
API de respuestas: simplificando las interacciones de los agentes
El elemento central del anuncio de OpenAI es la nueva API de Respuestas, que sirve como interfaz unificada para crear agentes de IA. Esta API... Combina las capacidades conversacionales de la API de finalización de chat de OpenAI Con la funcionalidad de uso de herramientas de su API de Asistentes anterior. En la práctica, esto significa que una sola llamada a la API ahora puede gestionar tareas complejas de varios pasos que pueden implicar el uso de diversas herramientas o fuentes de conocimiento.
OpenAI afirma que la API de respuestas se creó para simplificar el desarrollo de agentes al reducir la necesidad de código personalizado y modificaciones rápidas. “La API de respuestas está diseñada para desarrolladores que desean combinar fácilmente modelos OpenAI y herramientas integradas en sus aplicaciones, sin la complejidad de integrar múltiples API o proveedores externos”. La compañía explicó en su publicación de blog sobre el anuncio. Anteriormente, los desarrolladores solían tener que orquestar múltiples llamadas a la API y crear instrucciones elaboradas para que un agente de IA hiciera algo útil, lo cual era complejo y requería mucho tiempo. Con la nueva API, un agente puede, por ejemplo, mantener una conversación con un usuario, buscar información mediante una búsqueda web y luego escribir un resumen, todo dentro de un mismo flujo de trabajo.
Cabe destacar que la API de Respuestas está disponible para todos los desarrolladores sin costo adicional más allá de las tarifas de uso estándar. Además, es retrocompatible: OpenAI confirmó que seguirá ofreciendo soporte para su popular API de Finalizaciones de Chat para casos de uso sencillos, mientras que la antigua API de Asistentes se descontinuará gradualmente a mediados de 2026, ya que sus funciones se integrarán en la API de Respuestas.
El SDK de agentes de código abierto optimiza la orquestación del flujo de trabajo
El lanzamiento también incluye el SDK de Agentes, un conjunto de herramientas para gestionar los flujos de trabajo de uno o varios agentes de IA que interactúan. En una iniciativa destacada, OpenAI ha abierto este SDK, lo que permite a desarrolladores y empresas inspeccionar el código e incluso integrar modelos que no son de OpenAI en sus sistemas de agentes. Esta flexibilidad permite a una empresa coordinar un agente que utiliza GPT-4 de OpenAI junto con otro agente basado en un modelo de IA diferente, todo dentro del mismo marco.
El SDK de Agentes se centra en la orquestación del flujo de trabajo; básicamente, en el seguimiento de lo que hace un agente y cómo asigna tareas. Ofrece mecanismos integrados para aspectos como:
- Agentes configurables: configurar agentes de IA con roles predefinidos o instrucciones para tareas específicas.
- Transferencias inteligentes: pasar tareas entre múltiples agentes o procesos según el contexto (por ejemplo, un agente recopila datos y luego otro agente los analiza).
- Barandillas de seguridad: garantizar que el agente permanezca dentro de ciertos límites, con herramientas de validación de entrada y moderación de contenido para evitar salidas no deseadas.
- Rastreo y observabilidad: herramientas para monitorear y depurar las acciones de un agente paso a paso, lo que ayuda a los desarrolladores a comprender las decisiones y mejorar el rendimiento.
Según OpenAI, este kit de herramientas puede simplificar casos de uso complejos, como bots de atención al cliente, asistentes de investigación de varios pasos, flujos de trabajo de generación de contenido, agentes de revisión de código o automatización de la prospección de ventas. Al publicar el SDK como código abierto, OpenAI también fomenta las contribuciones de la comunidad y su adopción en entornos empresariales, donde la transparencia y la capacidad de autoalojar componentes suelen ser importantes. Entre los primeros usuarios, se incluyen empresas como Coinbase y Caja Ya he experimentado con el SDK de agentes para construir Investigación impulsada por IA y herramientas de extracción de datos.
Las herramientas integradas mejoran la funcionalidad de la IA
Para que los agentes de IA sean más funcionales desde el primer momento, la API de Respuestas de OpenAI incluye tres herramientas integradas que conectan la IA con datos y acciones externas. Estas herramientas amplían significativamente las funciones de un agente, yendo más allá de la simple generación de texto.
Las herramientas integradas disponibles en el lanzamiento son:
- Búsqueda Web: Permite a un agente de IA realizar búsquedas web en tiempo real y recuperar información actualizada, con las fuentes citadas. Esto significa que un agente puede responder preguntas utilizando las últimas noticias o datos de internet y proporcionar las referencias necesarias para mayor transparencia. Esta herramienta es útil para crear agentes como asistentes de investigación, guías de compras o planificadores de viajes que necesitan información en tiempo real.
- Búsqueda de archivos: Permite a un agente examinar rápidamente grandes colecciones de documentos o datos proporcionados por un desarrollador para encontrar información relevante. Se trata básicamente de una herramienta de consulta de bases de conocimiento privadas: un agente podría usarla para responder preguntas de soporte al cliente consultando documentos de políticas o para facilitar la investigación legal recuperando fragmentos de una biblioteca de archivos. Esta herramienta puede implementarse en escenarios como bots de atención al cliente o asistentes internos de la empresa que necesitan consultar información confidencial.
- Uso de la computadora: Una nueva capacidad (actualmente en fase preliminar de investigación) que permite a un agente de IA realizar acciones en una computadora como si fuera un usuario humano operando la máquina. Impulsada por el modelo de agente que usa computadora (CUA) de OpenAI, esta herramienta traduce las intenciones de la IA en acciones de teclado y ratón para navegar por software, sitios web u otras interfaces digitales. En esencia, permite la automatización de tareas que no cuentan con una API sencilla, por ejemplo, ingresar datos en un sistema heredado, navegar por una aplicación web para realizar pruebas o consultar información en una interfaz gráfica.
Al integrar estas herramientas, los agentes de IA no solo pueden analizar un problema, sino también actuar, ya sea buscando información, recuperando datos específicos o manipulando un entorno digital. Esto amplía considerablemente la funcionalidad del agente y lo hace mucho más útil para aplicaciones del mundo real.
OpenAI prevé que los desarrolladores combinen estas herramientas según sea necesario; por ejemplo, un agente podría usar la búsqueda web para recopilar información pública y la búsqueda de archivos para extraer datos internos, y luego usar esa información combinada para redactar un informe o ejecutar una tarea. Todo esto se puede orquestar a través de la API de Respuestas de forma unificada, en lugar de requerir servicios separados o integración manual.
Implicaciones más amplias para la adopción y la accesibilidad de la IA
Los analistas afirman que este lanzamiento podría acelerar la adopción de agentes de IA en todos los sectores al reducir los obstáculos técnicos. Para las empresas, el atractivo de estas nuevas herramientas reside en la capacidad de automatizar y escalar procesos sin necesidad de un desarrollo personalizado exhaustivo.
Tareas rutinarias como la recuperación de información, el procesamiento de formularios o la entrada de datos entre aplicaciones, que podrían haber requerido un gran esfuerzo de codificación o múltiples sistemas de software, ahora pueden ser gestionadas por agentes de IA que utilizan los componentes básicos de OpenAI. Las herramientas de búsqueda integradas, por ejemplo, permiten a las empresas integrar la IA en sus bases de datos de conocimiento o en la web casi al instante, y la herramienta informática ofrece una forma de interactuar con aplicaciones heredadas que no tienen API. Por otro lado, el código abierto del SDK de Agentes ofrece a las empresas un mayor control, permitiéndoles integrar estos agentes de IA en su infraestructura existente e incluso utilizar diferentes modelos de IA según sea necesario.
La iniciativa de OpenAI forma parte de una carrera más amplia para dotar a los desarrolladores de capacidades de creación de agentes. Empresas tecnológicas y startups competidoras han estado implementando sus propias plataformas de agentes de IA, y el completo conjunto de herramientas de OpenAI podría ayudarle a destacar. De hecho, este momento coincide con un aumento del interés en los agentes de IA autónomos a nivel mundial; por ejemplo, la startup china Monica atrajo recientemente la atención con su agente. Manus, afirmando que podría superar al agente prototipo de OpenAI en ciertas tareas. Al publicar componentes clave de su plataforma y ofrecer herramientas integradas, OpenAI parece estar respondiendo a la presión competitiva y, al mismo tiempo, fomentando una mayor adopción de la IA.
Desde una perspectiva de accesibilidad, estas herramientas podrían democratizar la creación de sistemas avanzados de IA. Empresas más pequeñas e incluso desarrolladores individuales podrían ahora encontrar viable la creación de un asistente o flujo de trabajo basado en IA sin necesidad de un gran equipo de investigación. El enfoque integrado (donde una sola llamada a la API puede gestionar múltiples pasos) y la disponibilidad de ejemplos en la documentación de OpenAI reducen las barreras de entrada para los recién llegados. OpenAI también proporciona una interfaz de observabilidad para que los desarrolladores puedan rastrear e inspeccionar lo que hace el agente, lo cual es crucial para la depuración y generar confianza en los resultados de IA. Se espera que este enfoque en la usabilidad y la seguridad (con medidas de seguridad y monitorización) anime a más empresas a experimentar con agentes de IA, sabiendo que tienen control y supervisión.
Los agentes de IA podrían volverse tan comunes y esenciales como tener presencia en internet. Las herramientas más recientes de OpenAI, al facilitar el desarrollo de agentes, podrían ayudar a hacer realidad esa visión, permitiendo que una comunidad mucho más amplia de desarrolladores y organizaciones creen sus propios agentes.












