Connect with us

Kunstig intelligens

Claude 3.7 Sonnet er Anthropics AI-genopstand

mm

Anthropic har udgivet Claude 3.7 Sonnet, en højt tillyst opgradering af deres large language model (LLM) familie. Beskrevet som virksomhedens “mest intelligente model til dato” og den første hybrid reasoning AI på markedet, introducerer Claude 3.7 Sonnet nogle store forbedringer over sin forgænger (Claude 3.5 Sonnet) i hastighed, reasoning og reel-verden opgavepræstation. 

Udgivelsen kommer midt i en række hurtige fremskridt fra konkurrenter som OpenAI og xAI’s nylige Grok 3, hvilket får mange AI-entusiaster (herunder mig) til at se denne lancering som Anthropics svar på de seneste innovationer. Den nye model sigter mod at kombinere hurtige konversationsbesvarelser med dybere analytisk tænkning i ét system – en samlet tilgang, der kan vise os, hvordan fremtidens interaktion med AI vil se ud. 

Langt ventet opgradering af en elsket AI-assistent

For mange regelmæssige AI-brugere havde Claude 3.5 Sonnet allerede været et gå-til-værktøj. Det blev betragtet som en af de bedste derude. Men i de seneste måneder har Anthropic stået under stigende pres. AI-industrien er gået amok med nye funktioner og modeller – OpenAI’s ChatGPT fik stemme, multi-step reasoning-evner og dyb forskning. Grok 3 gjorde sin debut med realtids-X-data, og andre platforme som Perplexity og Gemini holdt udgivelserne kørende. Mange iagttagere begyndte at bemærke, at Anthropic var ved at falde bagud. Fællesskabet havde ivrigt ventet Anthropics svar, med forventninger om, at en ny Claude-model var på vej.

Claude 3.7 Sonnet ankom endelig for at møde disse forventninger. Det er et betydeligt spring fremad fra Claude 3.5, snarere end en mindre justering. Anthropic præsenterer det som en omfattende opgradering: hurtigere, smartere og mere alsidig.

Modellens hastighed og outputkvalitet er slående. I mine egne tests fandt jeg, at det var utrolig hurtigt i forhold til den foregående version, og bearbejdede lange tekstindtastninger næsten øjeblikkeligt. Givet Anthropics langsomme opdateringscyklus, føles 3.7-udgivelsen som en lang ventet indhentning, der genskaffer Claudes position i AI-løbet. Claude 3.7 doublerer på, hvad der gjorde brugerne elskede Claude 3.5 – exceptionel præstation i praktiske opgaver – mens det tilføjer innovative reasoning-funktioner under panseret.

Hybrid Reasoning: Hurtige svar og dyb tænkning i ét

Den mest fremtrædende funktion i Claude 3.7 Sonnet er dens hybrid reasoning-kapacitet. I simple vendinger kan denne model fungere i to tilstande: en standardtilstand for næsten øjeblikkelige svar og en ny “udvidet tænkning”-tilstand, hvor den arbejder sig igennem problemer trin for trin, og viser sin tankerække til brugeren.

I stedet for at udgive en separat Claude reasoning-udgave har Anthropic integreret både hurtig og reflekterende tænkning i én AI. “Ligesom mennesker bruger ét hjerte til både hurtige svar og dyb refleksion, mener vi, at reasoning bør være en integreret funktion… snarere end en separat model i sig selv,” forklarede virksomheden i sin meddelelse, og understregede en samlet tilgang for en ubrudt brugeroplevelse.

I praksis betyder dette, at brugerne kan vælge, når de ønsker et hurtigt svar, og når de vil lade Claude overveje i længere tid. En enkel omstiller låser brugeren til udvidet tilstand, hvis et spørgsmål kræver detaljeret analyse eller multi-step logik. I standardtilstand fungerer Claude 3.7 Sonnet som en forbedret version af 3.5 – hurtigere og mere raffineret, men med den velkendte hurtige konversationsstil. I udvidet tilstand “selvreflekterer” AI’en, før den besvarer, og skriver sin tænkning ud intern og gør den synlig for at nå mere præcise eller komplekse løsninger.

Tankerækken ruller ud skridt for skridt på skærmen, en funktion der er blevet populær i andre avancerede AI-systemer og nu endelig kommer til Claude.

Alex McFarland/Unite.AI

Anthropics filosofi her modsiger bevidst nogle konkurrenter. OpenAI har for eksempel tilbudt separate modeller eller tilstande, som nogle finder forvirrende at håndtere. Claude 3.7’s alt-i-ét-tilgang er ment til at simplificere tingene for brugerne. At skifte mellem tilstande er direkte, og prompt-stilen forbliver den samme. Power-brugere kan endda finjustere, hvor meget AI’en tænker: gennem API’et kan udviklere angive en token-budget for reasoning, og fortælle Claude, hvor længe den skal tænke (fra bare få skridt op til en massiv 128k-token tænkeproces) før den endeligt besvarer. Denne granulerede kontrol låser én til at afveje hastighed mod grundighed påkrævet.

Nøgleforbedringer i Claude 3.7 Sonnet:

Her er nogle af de vigtigste forbedringer, vi ser fra Claude 3.7 Sonnet:

  • Hybrid Reasoning-tilstande – Tilbyder både øjeblikkelige svar og en udvidet tænkning-tilstand, hvor AI’en arbejder sig igennem problemer trin for trin med synlig reasoning. Brugerne vælger tilstanden per forespørgsel, og samler hurtig chat og dyb analyse i ét system.
  • Samlet model-filosofi – Integrerer hurtig og reflekterende tænkning i én AI “hjerne” for let brug. Dette modsiger rivaler, der kræver multiple modeller eller plugins, og reducerer kompleksiteten for slutbrugeren.
  • Hastighed og responsivitet – Leverer svar hurtigere end Claude 3.5. Tidlige tests viser mærkbart hurtigere præstation i standardtilstand.
  • Udvidet tænkekontrol – Gennem API’et kan brugerne begrænse eller udvide AI’ens tænkelængde (op til 128.000 tokens) for at afveje hastighed mod kvalitet efter behov. Dette sikrer, at udvidet tilstand kun bruges, så meget som nødvendigt.
  • Fokus på reel-verden opgaver – Ifølge virksomheden var Claudes 3.7 træning rettet mod praktiske forretnings- og kreative opgaver snarere end svære matematikolympiade-puzzler. Modellen udmærker sig ved hverdagsproblemløsning og opgaver, der afspejler almindelige brugs Tilfælde.
  • Kodning og værktøjbrug – Stærkere præstation i programmeringsopgaver, især front-end webudvikling. Anthropic lancerede endda et ledsagende værktøj, Claude Code, der giver udviklere mulighed for at bruge Claude fra kommandolinjen til at skrive og korrigere kode. Tidlige benchmarks viser, at Claude 3.7 topprer listen over at løse reelle software-problemer.

Begrænsninger og hvad der kommer herefter for AI-brugere

Trods al denne ophidselse er Claude 3.7 Sonnet ikke uden begrænsninger, og det er ikke en tryllestav for alle AI-udfordringer. For det første har Anthropic bevidst nedtonet visse domæner i træningen af denne model. De “optimerede noget mindre for matematik- og datalogi-konkurrence-problemer” til fordel for mere hverdagslige forretningsopgaver. Dette betyder, at selv om Claude 3.7 kan løse matematik- og kodningsspørgsmål (ofte bedre end 3.5 kunne), kan det måske ikke toppe listen over hver enkelt akademisk benchmark eller puzzle. Brugere, hvis behov er rettet mod komplekse matematikbeviser eller specialiserede kodningskonkurrencer, kan stadig finde områder, hvor Claudes svar kræver dobbelttjek eller hvor en konkurrents model, der er tilpasset til den niche, gør det bedre. Anthropic synes at have accepteret dette kompromis og sigter mod at gøre modellen praktisk nyttig snarere end teoretisk dygtig.

Derudover introducerer udvidet tænkning-tilstand noget kompleksitet. Det er instrinsisk langsommere end standardtilstanden; når AI’en er i dyb tanke, vil brugerne bemærke en kort pause, mens den arbejder sig igennem sin tænkning. Dette er forventet – ved at afveje hastighed mod grundighed – men det betyder, at brugerne må beslutte, når de faktisk har brug for den ekstra kraft. I mange hverdagslige chatspørgsmål vil standardtilstanden være tilstrækkelig og mere effektiv. Der er også det faktum, at udvidet tænkning kan overgøre og give mere, end man faktisk har brug for. I nogle tilfælde kan dette overvælde eller afvige fra emnet. Anthropic må sikre, at AI’ens villighed til at “gå stort” med ideer forbliver relevant og på tema. Brugere kan lære at stille mere præcise spørgsmål eller angive token-grænser for at begrænse ude af vej-afstikkere.

Bottom Line

Claude 3.7 Sonnets udgivelse er en erklæring om, at Anthropic er meget i spillet sammen med OpenAI, Google/DeepMind og nye spillere som xAI. For AI-entusiaster og udviklere tilføjer det en top-model til at eksperimentere med, en model der tilbyder en unik vending med sin hybrid reasoning.

I den konkurrerende AI-industri kan Anthropics seneste træk også påvirke, hvordan virksomheder positionerer deres modeller. Ved ikke at gøre et massivt model-størrelses-spring eller en glitzy multi-modal demo, men i stedet forfiner brugeroplevelsen (samling af tilstande, hastighed, praktiske brugs Tilfælde), skaber Anthropic en niche, der fokuserer på brugervenlighed og pålidelighed. 

Samlet set er Claude 3.7 Sonnet et afgørende øjeblik for Anthropic. Det er en udvikling af Claude-serien, der viser, at virksomheden lærer af fællesskabets behov – doublerer på styrker, mens det adresserer svagheder. Der er stadig områder at overvåge (og fremtidige Claude-iterationer at forvente), men denne udgivelse har klart genskabt Anthropics brugerbase. 

Alex McFarland er en AI-journalist og forfatter, der udforsker de seneste udviklinger inden for kunstig intelligens. Han har samarbejdet med talrige AI-startups og publikationer verden over.