Anuncios

Claude Fable 5 convierte la inteligencia artificial de frontera en una utilidad medida

mm

Claude Fable 5 ya está disponible, y la historia de la capacidad es genuina. Stripe informó que lo utilizó para ejecutar una migración de código en todo el código base de 50 millones de líneas en un solo día, lo que equivale a dos meses de trabajo de un equipo, comprimido en uno. Anthropic afirma que puede ejecutarse durante días dentro de un arnés de agente sin que un humano lo supervise. Si realiza trabajo de horizonte largo y de alto riesgo, este es el modelo al que recurre cuando el trabajo es genuinamente difícil.

Pero la parte del lanzamiento de hoy que cambia la forma en que un operador planea no es la capacidad. Son las tres cosas que Anthropic adjuntó a ella: el precio, la implementación y la política de datos. Juntas marcan el final de la fase de todo lo que puedes comer de la inteligencia artificial de frontera.

El nivel superior con tarifa plana se está desempacando

Fable 5 cuesta $10 por millón de tokens de entrada y $50 por millón de tokens de salida. Eso es el doble de la tarifa estándar de Opus 4.8 y coincide exactamente con el precio de modo rápido de Opus 4.8. El nivel superior de la línea ahora cuesta dinero real por token, y eso es antes de considerar cuántos tokens quema realmente una ejecución de agente de varios días.

La implementación hace que el cambio sea explícito. Hasta el 22 de junio de 2026, Fable 5 se incluye en los planes Pro, Max, Team y Enterprise con base en asientos sin costo adicional. El 23 de junio, Anthropic lo elimina de esos planes, y después de esa fecha, utilizarlo se basa en créditos de uso, y lo restaurarán a las suscripciones más adelante “cuando la capacidad lo permita”. En los planes de API y Enterprise con base en consumo, está completamente medido desde el primer día.

Lea la implementación por lo que es. El modelo más capaz es demasiado caro para calcular y demasiado demandado para regalarlo dentro de un asiento mensual plano, por lo que se está cobrando como un recurso medido. Sus $20 o $200 al mes le compran los niveles estándar. La frontera es un grifo con un medidor ahora, y el medidor es el punto.

Esto no es una queja sobre los márgenes de Anthropic. Según informes, están pagando más de mil millones de dólares al mes por capacidad de centro de datos y corriendo la misma crisis de cálculo que todos los demás; la economía es lo que es. Pero “el mejor modelo está incluido en mi plan” era una suposición de funcionamiento real para mucha gente, y a partir del 23 de junio deja de ser cierto en la parte superior.

La decisión de nivel de modelo ahora es una línea de presupuesto

Aquí es donde se vuelve práctico. El movimiento reflejo cuando aterriza un nuevo modelo de frontera es apuntar todo a él. Con el precio de la frontera medido, ese movimiento reflejo es cómo se quema un presupuesto.

Nivele el trabajo en su lugar. La mayoría de lo que una operación ejecuta, como borradores, resúmenes, código rutinario, las cien pequeñas llamadas que componen una tubería real, no necesita un modelo de clase Mythos. Ejécutelo en Sonnet o Opus, donde siempre se ha ejecutado bien. Reserve Fable 5 para los trabajos que realmente lo necesitan: la migración de horizonte largo, la ejecución de investigación de varios días, el problema donde un modelo más débil se estanca y el premio genuinamente paga por sí mismo. La migración de Stripe es exactamente de ese tipo, dos meses en un día vale $50 por millón todo el día.

Esa es toda la disciplina. Coincida el modelo con el trabajo, y el precio deja de ser aterrador porque solo está pagando tarifas de frontera en las vueltas donde la capacidad de frontera cambia el resultado.

Lea la política de retención antes de pasar datos de cliente a través de ella

El tercer cambio es el que más probablemente muerda en silencio. Anthropic está cambiando la forma en que maneja los datos de los clientes de negocios en estos modelos: ahora requiere retención de datos de 30 días en todo el tráfico a modelos de clase Mythos, como Fable 5, Mythos 5 y cualquier cosa a ese nivel de capacidad en el futuro, en superficies de primera y tercera parte.

Estos son “modelos cubiertos” que no están disponibles con retención de datos cero, por lo que efectivamente no hay opt-out. Anthropic no entrenará con los datos ni los utilizará para nada fuera de la seguridad, registra todo acceso humano y elimina los datos después de 30 días en casi todos los casos. La razón es defendible: un modelo tan capaz es un objetivo, y los datos retenidos son cómo atrapan ataques de jailbreak y multi-solicitud novedosos.

Pero “nosotros conservamos todo durante 30 días, sin opt-out” es un hecho de gobernanza, no una nota al pie. Si ejecuta trabajo de cliente, material confidencial o cualquier cosa bajo un contrato que prometió retención cero, esa promesa y esta política ahora chocan. Cualquiera que esté construyendo agentes que deben satisfacer reglas de gobernanza de datos reales tiene que cuadrar esto antes de enrutar un solo token sensible a través de Fable 5. Para algunas cargas de trabajo, la respuesta honesta va a ser: mantenga esa tubería en un modelo con una política de retención que realmente pueda vivir con ella, y ahorre Fable para el trabajo donde está bien.

El verdadero cambio

Quite las victorias de las pruebas de referencia y hoy es un evento de precios y políticas tanto como de capacidad. El modelo de frontera es más capaz que cualquier cosa que pudiera obtener antes, más caro de ejecutar, medido en lugar de empaquetado, y conserva sus datos durante un mes ya sea que le guste o no.

Es un tipo diferente de trato, la capacidad de frontera como una herramienta medida a la que se recurre deliberadamente, no un grifo que se deja corriendo porque vino con el plan.

Los operadores que internalizan eso temprano obtendrán las victorias de meses en un día sin la factura sorpresa. Los que apuntan todo al nivel superior por reflejo están a punto de aprender lo que cuesta.

Alex McFarland es un periodista y escritor de inteligencia artificial que explora los últimos desarrollos en inteligencia artificial. Ha colaborado con numerosas startups y publicaciones de inteligencia artificial en todo el mundo.