Annunci

Claude Fable 5 rende la frontiera AI un’utilità a misura

mm

Claude Fable 5 è stato rilasciato, e la storia delle capacità è autentica. Stripe ha segnalato di utilizzarlo per eseguire una migrazione su larga scala su 50 milioni di linee di codice in un solo giorno — due mesi di lavoro di un team, compressi in uno. Anthropic afferma che può funzionare per giorni all’interno di un sistema di gestione senza la necessità di un controllo umano. Se si eseguono lavori a lungo termine e ad alto rischio, questo è il modello da utilizzare quando il lavoro è realmente difficile.

Ma la parte del lancio di oggi che cambia la pianificazione di un operatore non è la capacità. Sono le tre cose che Anthropic ha allegato ad esso: il prezzo, il lancio e la politica dei dati. Insieme segnano la fine della fase di tutti-i-can-eat della frontiera AI.

La fascia superiore a tariffa fissa sta essere scorporata

Fable 5 costa 10 dollari per milione di token di input e 50 dollari per milione di token di output. È il doppio del tasso standard di Opus 4.8 e si posiziona esattamente al prezzo della modalità veloce di Opus 4.8. La parte superiore della gamma ora costa denaro vero per token, e questo prima di considerare quanti token una corsa agente di lunga durata brucia effettivamente.

Il lancio rende esplicito il passaggio. Fino al 22 giugno 2026, Fable 5 è incluso nei piani Pro, Max, Team e basati su posti a sedere aziendali senza costi aggiuntivi. Il 23 giugno, Anthropic lo rimuove da questi piani — dopo di che, utilizzarlo funziona con crediti di utilizzo, e li ripristinerà alle iscrizioni in seguito “quando la capacità lo consente”. Sui piani API e aziendali basati sul consumo, è completamente a misura dal primo giorno.

Leggi il lancio per quello che è. Il modello più capace è troppo costoso per il calcolo e troppo richiesto per essere dato via all’interno di un abbonamento mensile piatto, quindi è stato prezziato come una risorsa a misura. I tuoi 20 o 200 dollari al mese ti comprano le fasce standard. La frontiera è un rubinetto con un contatore su di esso ora, e il contatore è il punto.

Non è una lamentela sui margini di Anthropic. Stanno pagando oltre un miliardo di dollari al mese per la capacità dei data center e stanno correndo la stessa crisi di calcolo come tutti gli altri; l’economia è quella che è. Ma “il miglior modello è incluso nel mio piano” era un’ipotesi di funzionamento reale per molte persone, e a partire dal 23 giugno non sarà più vero nella parte superiore.

La decisione di tiering del modello è ora una linea di budget

Ecco dove diventa pratico. Il movimento riflesso quando un nuovo modello di frontiera arriva è puntare tutto su di esso. Con il prezzo della frontiera a misura, quel riflesso è come bruciare un budget.

Scalare il lavoro invece. La maggior parte di ciò che un’operazione esegue — stesura, riassunto, codice di routine, le cento piccole chiamate che compongono una vera pipeline — non richiede un modello di classe Mythos. Esegui quello su Sonnet o Opus, dove ha sempre funzionato bene. Riserva Fable 5 per i lavori che lo richiedono effettivamente: la migrazione a lungo termine, la corsa di ricerca di più giorni, il problema in cui un modello più debole si blocca e il premium si paga effettivamente da solo. La migrazione di Stripe è proprio di quella forma — due mesi in un giorno valgono 50 dollari per milione tutto il giorno.

Questo è l’intero disciplinare. Abbinare il modello al lavoro, e il prezzo smette di essere spaventoso perché si paga solo le tariffe della frontiera sulle rotazioni in cui la capacità della frontiera cambia il risultato.

Leggi la politica di conservazione prima di instradare i dati del cliente attraverso di essa

Il terzo cambiamento è quello più probabile da mordere silenziosamente. Anthropic sta cambiando il modo in cui gestisce i dati dei clienti aziendali su questi modelli: ora richiede 30 giorni di conservazione dei dati su tutto il traffico ai modelli di classe Mythos — Fable 5, Mythos 5 e tutto ciò che è al livello di capacità in futuro — su superfici di prima e terza parte.

Questi sono “modelli coperti” che non sono disponibili con zero conservazione dei dati, quindi non c’è effettivamente alcuna opzione per rinunciare. Anthropic non utilizzerà i dati per l’addestramento o per alcun altro scopo al di fuori della sicurezza, registra tutti gli accessi umani e cancella i dati dopo 30 giorni nella maggior parte dei casi. La ragione è difendibile: un modello così capace è un bersaglio, e i dati conservati sono come catturano le nuove evasioni e gli attacchi multi-richiesta.

Ma “conserviamo tutto per 30 giorni, nessuna opzione per rinunciare” è un fatto di governance, non una nota a piè di pagina. Se si eseguono lavori di clienti, materiali riservati o qualsiasi cosa sotto un contratto che ha promesso zero conservazione, quella promessa e questa politica ora collidono. Chiunque stia costruendo agenti che devono soddisfare regole di governance dei dati reali deve quadrare questo prima di instradare un singolo token sensibile attraverso Fable 5. Per alcuni carichi di lavoro la risposta onesta sarà: mantieni quella pipeline su un modello con una politica di conservazione che puoi effettivamente vivere, e salva Fable per il lavoro in cui è fine.

Il vero spostamento

Togli le vittorie del benchmark e oggi è un evento di prezzo e politica tanto quanto di capacità. Il modello di frontiera è più capace di qualsiasi cosa si potesse ottenere prima, più costoso da eseguire, a misura invece di incluso, e conserva i tuoi dati per un mese che tu lo voglia o no.

È un tipo diverso di accordo — la capacità di frontiera come uno strumento a misura che si utilizza deliberatamente, non un rubinetto che si lascia aperto perché è venuto con il piano.

Gli operatori che interiorizzano questo precocemente otterranno le vittorie da mesi-in-un-giorno senza la fattura a sorpresa. Quelli che puntano tutto al livello superiore per riflesso stanno per imparare cosa costa.

Alex McFarland è un giornalista e scrittore di intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup di intelligenza artificiale e pubblicazioni in tutto il mondo.