Inteligencia artificial

La IA como investigador: el primer artículo de investigación revisado por pares escrito sin humanos

Publicado el 30 de agosto de 2025

Actualizado el 18 de mayo de 2026

Por

Dr. Tehseen Zia

La inteligencia artificial ha cruzado otro hito significativo que desafía nuestra comprensión de lo que las máquinas pueden lograr de manera independiente. Por primera vez en la historia científica, un sistema de IA ha escrito un artículo de investigación completo que pasó la revisión por pares en una conferencia académica sin ninguna asistencia humana en el proceso de escritura. Este avance podría ser un cambio fundamental en la forma en que se lleva a cabo la investigación científica en el futuro.

Logro histórico

Un artículo producido por The AI Scientist-v2 pasó el proceso de revisión por pares en un taller de una conferencia internacional de IA de primer nivel. La investigación se presentó en un taller de ICLR 2025, que es uno de los lugares más prestigiosos en el campo del aprendizaje automático. El artículo fue generado por una versión mejorada del original AI Scientist, llamado The AI Scientist-v2.

El artículo aceptado, titulado “Regularización composicional: obstáculos inesperados en la mejora de la generalización de las redes neuronales“, recibió calificaciones impresionantes de los revisores humanos. De los tres artículos presentados para revisión, uno recibió calificaciones que lo colocaron por encima del umbral de aceptación. Este avance es un progreso significativo, ya que la IA puede ahora participar en el proceso fundamental de descubrimiento científico que ha sido exclusivamente humano durante siglos.

El equipo de investigación de Sakana AI, trabajando con colaboradores de la Universidad de Columbia Británica y la Universidad de Oxford, llevó a cabo este experimento. Obtuvieron la aprobación del comité de revisión institucional y trabajaron directamente con los organizadores de la conferencia ICLR para asegurarse de que el experimento siguiera los protocolos científicos adecuados.

Cómo funciona The AI Scientist-v2

The AI Scientist-v2 ha logrado este éxito gracias a varios avances importantes sobre su predecesor. A diferencia de su predecesor, AI Scientist-v2 elimina la necesidad de plantillas de código escritas por humanos, puede trabajar en diversos dominios de aprendizaje automático y emplea una metodología de búsqueda en árbol para explorar múltiples direcciones de investigación simultáneamente.

El sistema opera a través de un proceso de extremo a extremo que imita la forma en que trabajan los investigadores humanos. Comienza formulando hipótesis científicas basadas en el dominio de investigación que se le ha asignado. La IA luego diseña experimentos para probar estas hipótesis, escribe el código necesario para realizar los experimentos y los ejecuta automáticamente.

Lo que hace que este sistema sea particularmente avanzado es su uso de la metodología de búsqueda en árbol agente. Este enfoque permite que la IA explore múltiples direcciones de investigación simultáneamente, al igual que los investigadores humanos podrían considerar varios enfoques para resolver un problema. Esto implica ejecutar experimentos a través de la búsqueda en árbol agente, analizar los resultados y generar un borrador del artículo. Un agente de gestión de experimentos dedicado coordina todo este proceso para asegurarse de que la investigación se mantenga enfocada y productiva.

El sistema también incluye un componente de revisor de IA mejorado que utiliza modelos de lenguaje de visión para proporcionar comentarios sobre el contenido y la presentación visual de los hallazgos de investigación. Esto crea un proceso de refinamiento iterativo donde la IA puede mejorar su propio trabajo basado en los comentarios, similar a cómo los investigadores humanos refinan sus manuscritos basados en la entrada de colegas.

Qué hizo que este artículo de investigación fuera especial

El artículo aceptado se centró en un problema desafiante en el aprendizaje automático llamado generalización composicional. Esto se refiere a la capacidad de las redes neuronales para entender y aplicar conceptos aprendidos en nuevas combinaciones que nunca han visto antes. The AI Scientist-v2 investigó métodos de regularización novedosos que podrían mejorar esta capacidad.

Resulta interesante que el artículo también informara resultados negativos. La IA descubrió que ciertos enfoques que hipotetizó que mejorarían el rendimiento de las redes neuronales en realidad crearon obstáculos inesperados. En la ciencia, los resultados negativos son valiosos porque evitan que otros investigadores sigan caminos improductivos y contribuyen a nuestra comprensión de lo que no funciona.

La investigación siguió rigurosos estándares científicos en todo el proceso. The AI Scientist-v2 realizó múltiples corridas experimentales para asegurar la validez estadística, creó visualizaciones claras de sus hallazgos y citó adecuadamente el trabajo previo relevante. Formateó el manuscrito completo según los estándares académicos y escribió discusiones exhaustivas de su metodología y hallazgos.

Los investigadores humanos que supervisaron el proyecto realizaron su propia revisión exhaustiva de los tres artículos generados. Encontraron que, aunque el artículo aceptado era de la calidad de un taller, contenía algunos problemas técnicos que lo impedirían ser aceptado en la pista principal de la conferencia. Esta evaluación honesta demuestra las limitaciones actuales mientras reconoce el progreso significativo logrado.

Capacidades técnicas y mejoras

The AI Scientist-v2 demuestra varias capacidades técnicas notables que lo distinguen de los sistemas de investigación automatizados anteriores. El sistema puede trabajar en diversos dominios de aprendizaje automático sin necesidad de plantillas de código preescritas. Esta flexibilidad significa que puede adaptarse a nuevas áreas de investigación y generar enfoques experimentales originales en lugar de seguir patrones predeterminados.

La metodología de búsqueda en árbol es una innovación significativa en la automatización de la investigación de IA. En lugar de perseguir una sola dirección de investigación, el sistema puede mantener múltiples hipótesis simultáneamente y asignar recursos computacionales basados en la promesa que muestra cada dirección. Este enfoque imita cómo los investigadores humanos experimentados a menudo mantienen varias líneas de investigación mientras se enfocan en las vías más prometedoras.

Otra mejora crucial es la integración de modelos de lenguaje de visión para revisar y refinar los elementos visuales de los artículos de investigación. Las figuras y visualizaciones científicas son fundamentales para comunicar los hallazgos de investigación de manera efectiva. La IA ahora puede evaluar y mejorar sus propias visualizaciones de datos de manera iterativa.

El sistema también demuestra comprensión de las convenciones de escritura científica. Estructura adecuadamente los artículos con secciones apropiadas, mantiene una terminología consistente en todo el manuscrito y crea un flujo lógico entre las diferentes partes de la narrativa de investigación. La IA muestra conciencia de cómo presentar la metodología, discutir las limitaciones y contextualizar los hallazgos dentro de la literatura existente.

Limitaciones y desafíos actuales

A pesar de este logro histórico, varias limitaciones importantes restringen las capacidades actuales de la investigación generada por IA. La empresa dijo que ninguno de sus estudios generados por IA pasó su barra interna para los estándares de publicación en la pista principal de la conferencia ICLR. Esto indica que, aunque la IA puede producir investigación de la calidad de un taller, alcanzar los niveles más altos de publicación científica sigue siendo un desafío.

Las tasas de aceptación proporcionan un contexto importante para evaluar este logro. El artículo fue aceptado en una pista de taller, que generalmente tiene estándares menos estrictos que la pista principal de la conferencia (60-70% de tasa de aceptación versus 20-30% de tasa de aceptación típica de las pistas principales de la conferencia). Si bien esto no disminuye la importancia del logro, sugiere que producir investigación verdaderamente innovadora sigue estando más allá de las capacidades actuales de la IA.

The AI Scientist-v2 también demostró algunas debilidades que los investigadores humanos identificaron durante su proceso de revisión. El sistema ocasionalmente cometió errores de citación, atribuyendo hallazgos de investigación a autores o publicaciones incorrectas. También luchó con algunos aspectos del diseño experimental que los expertos humanos habrían abordado de manera diferente.

Quizás lo más importante es que la investigación generada por IA se centró en mejoras incrementales en lugar de descubrimientos que cambian el paradigma. El sistema parece más capaz de realizar investigaciones exhaustivas dentro de marcos de investigación establecidos que de proponer formas completamente nuevas de pensar sobre los problemas científicos.

El camino adelante

La revisión por pares exitosa de la investigación generada por IA es el comienzo de una nueva era en la investigación científica. A medida que los modelos de base continúan mejorando, podemos esperar que The AI Scientist y sistemas similares produzcan investigación cada vez más sofisticada que se acerca y potencialmente excede las capacidades humanas en muchos dominios.

El equipo de investigación anticipa que las versiones futuras serán capaces de producir artículos dignos de ser aceptados en conferencias y revistas de primer nivel. La progresión lógica sugiere que los sistemas de IA pueden contribuir eventualmente a descubrimientos innovadores en campos que van desde la medicina hasta la física y la química.

Este desarrollo también plantea importantes preguntas sobre la ética de la investigación y los estándares de publicación. La comunidad científica debe desarrollar nuevas normas para manejar la investigación generada por IA, incluyendo cuándo y cómo revelar la participación de la IA y cómo evaluar este trabajo junto con la investigación generada por humanos.

La transparencia demostrada por el equipo de investigación en este experimento proporciona un valioso modelo para la evaluación futura de las capacidades de investigación automatizadas. Al trabajar abiertamente con los organizadores de la conferencia y sometiendo su trabajo generado por IA a los mismos estándares que la investigación humana, han establecido importantes precedentes para el desarrollo responsable de capacidades de investigación automatizadas.

En resumen

La aceptación de un artículo escrito por IA en un taller de aprendizaje automático de primer nivel es un avance significativo en las capacidades de la IA. Aunque el trabajo aún no está al nivel de una conferencia de primer nivel, demuestra una trayectoria clara hacia la IA como contribuyente serio al descubrimiento científico. El desafío ahora radica no solo en avanzar en la tecnología, sino también en dar forma a los marcos éticos y académicos que gobernarán esta nueva frontera de la investigación.

Dr. Tehseen Zia

El Dr. Tehseen Zia es un profesor asociado titular en la Universidad COMSATS de Islamabad, con un doctorado en Inteligencia Artificial de la Universidad Técnica de Viena, Austria. Especializado en Inteligencia Artificial, Aprendizaje Automático, Ciencia de Datos y Visión por Computadora, ha hecho contribuciones significativas con publicaciones en revistas científicas reputadas. El Dr. Tehseen también ha liderado varios proyectos industriales como investigador principal y ha servido como consultor de Inteligencia Artificial.