Liity verkostomme!

Tekoäly

Claude 3.7 Sonnet on Anthropicin AI Resurgence

mm
(Alex McFarland/Unite AI)

Anthropic on julkaissut Claude 3.7 sonetti, sen odotettu päivitys suuri kielimalli (LLM) perhe. Yrityksen "tähän mennessä älykkäimmäksi malliksi" ja markkinoiden ensimmäiseksi hybridi-päättelyälyksi arvioitu Claude 3.7 Sonnet esittelee joitain merkittäviä parannuksia edeltäjäänsä (Claude 3.5 sonetti) nopeudessa, päättelyssä ja todellisten tehtävien suorittamisessa. 

Käyttöönotto tapahtuu kilpailijoiden, kuten OpenAI:n ja xAI:n viimeaikaisten, nopean kehityksen keskellä Grokki 3, sai monet tekoälyn harrastajat (mukaan lukien minä) pitämään tätä julkaisua Anthropicin vastauksena viimeaikaisiin innovaatioihin. Uuden mallin tavoitteena on yhdistää nopeat keskusteluvastaukset syvempään analyyttiseen ajatteluun yhdeksi järjestelmäksi – yhtenäinen lähestymistapa, joka voisi näyttää meille, miltä tulevaisuuden vuorovaikutus tekoälyn kanssa näyttää. 

Kauan odotettu päivitys rakkaaksi tekoälyavustajaksi

Monille tavallisille tekoälykäyttäjille Claude 3.5 Sonnet oli jo ollut suosittu työkalu. Sitä pidettiin yhtenä parhaista. Viime kuukausina Anthropic on kuitenkin kohdannut kasvavaa painetta. Tekoälyteollisuus on tullut hulluksi uusien ominaisuuksien ja mallien myötä – OpenAI:n ChatGPT on saanut äänen, monivaiheiset päättelykyvyt ja syvällinen tutkimus. Grok 3 teki debyyttinsä reaaliaikaisella X-datalla ja muilla alustoilla, kuten hämmennys ja Kaksoset piti julkaisuja tulossa. Monet tarkkailijat alkoivat huomata, että Anthropic alkoi jäädä jälkeen. Yhteisö oli odottanut innokkaasti Anthropicin vastausta ja odotti, että uusi Claude-malli olisi tulossa minä päivänä tahansa.

Claude 3.7 Sonnet saapui vihdoin täyttämään nämä odotukset. Se on merkittävä harppaus eteenpäin Claude 3.5:stä, eikä pieni säätö. Anthropic mainitsee sen kattavana päivityksenä: nopeampi, älykkäämpi ja monipuolisempi.

Mallin nopeus ja tulostuslaatu ovat silmiinpistäviä. Omissa testeissäni huomasin sen olevan uskomattoman nopea viimeiseen versioon verrattuna, ja se käsittelee pitkiä tekstinsyöttöjä lähes välittömästi. Ottaen huomioon Anthropicin hitaan päivityssyklin, 3.7-julkaisu tuntuu kauan odotetulta umpeutumiselta. takaisin Clauden asema tekoälykilpailussa. Claude 3.7 kaksinkertaistaa sen, mikä sai käyttäjät rakastamaan Claude 3.5:tä – poikkeuksellista suorituskykyä käytännön tehtävissä – samalla kun konepellin alle on lisätty innovatiivisia päättelykykyjä.

Hybridipäättely: nopeat vastaukset ja syvällinen ajattelu yhdessä

Claude 3.7 Sonnetin pääominaisuus on sen hybridipäättelykyky. Yksinkertaisesti sanottuna tämä malli voi toimia kahdessa tilassa: vakiotilassa lähes välittömiä vastauksia varten ja uudessa "laajennettu ajattelu" -tilassa, jossa se käsittelee ongelmat askel askeleelta ja näyttää sen. ajatusketju käyttäjälle.

Sen sijaan, että olisi julkaissut erillisen Clauden päättelypainoksen, Anthropic on yhdistänyt sekä nopean että syvällisen ajattelun yhdeksi tekoälyksi. "Aivan kuten ihmiset käyttävät yksittäisiä aivoja sekä nopeisiin reaktioihin että syvään pohdiskeluun, uskomme, että päättelyn tulisi olla integroitu ominaisuus… eikä kokonaan erillinen malli." yhtiö selitti tiedotteessaan ilmoitus, joka korostaa yhtenäistä lähestymistapaa saumattoman käyttökokemuksen saavuttamiseksi.

Käytännössä tämä tarkoittaa, että käyttäjät voivat päättää, milloin he haluavat nopean vastauksen ja milloin Clauden pohditaan pitkään. Yksinkertaisen kytkimen avulla voit vaihtaa laajennettuun tilaan, jos kysymys vaatii yksityiskohtaista analyysiä tai monivaiheista logiikkaa. Vakiotilassa Claude 3.7 Sonnet toimii kuin 3.5:n parannettu versio – nopeampi ja hienostuneempi, mutta tutulla nopealla keskustelutyylillä. Laajennetussa tilassa tekoäly "heijastaa itseään" ennen vastaamista ja kirjoittaa päättelyprosessinsa sisäisesti (ja tekee sen näkyväksi) saadakseen tarkempia tai monimutkaisempia ratkaisuja.

Ajatusketju vierii askel askeleelta näytöllä, ominaisuus, josta on tullut suosittu muissa edistyneissä tekoälyjärjestelmissä ja joka nyt vihdoin tulee Claudelle.

Alex McFarland / Unite AI

Anthropicin filosofia on tässä tarkoituksella ristiriidassa joidenkin kilpailijoiden kanssa. Esimerkiksi OpenAI on tarjonnut erillisiä malleja tai tiloja, joiden jongleeraaminen on joidenkin mielestä hämmentävää. Claude 3.7:n all-in-one-lähestymistavan tarkoituksena on yksinkertaistaa asioita käyttäjien kannalta. Vaihtaminen tilojen välillä on yksinkertaista, ja kehotteen tyyli pysyy samana. Tehokäyttäjät voivat jopa hienosäätää, kuinka paljon tekoäly ajattelee: API:n kautta kehittäjät voivat asettaa token-budjetin perusteluille ja kertoa Claudelle, kuinka kauan hänen on pohdittava (vain muutamasta vaiheesta massiiviseen 128 XNUMX tunnuksen ajatteluprosessiin) ennen vastauksen viimeistelyä. Tämä rakeinen ohjaus mahdollistaa yhden nopeuden ja perusteellisuuden tarpeen vaatiessa.

Tärkeimmät parannukset Claude 3.7 Sonetissa:

Tässä on joitain tärkeimmistä Claude 3.7 Sonnetin parannuksista:

  • Hybridipäättelytilat – Tarjoaa sekä välittömiä vastauksia että Extended Thinking -tilan, jossa tekoäly käsittelee ongelmat vaiheittain näkyvän päättelyn avulla. Käyttäjät valitsevat tilan kyselyä kohden, mikä yhdistää nopean keskustelun ja syväanalyysin yhdessä järjestelmässä.
  • Yhtenäinen mallifilosofia – Integroi nopean ja pohdiskelevan ajattelun yhteen tekoälyn "aivoon" käytön helpottamiseksi. Tämä eroaa kilpailijoista, jotka vaativat useita malleja tai laajennuksia, mikä vähentää monimutkaisuutta loppukäyttäjälle.
  • Nopeus ja reagointikyky – Vastaa nopeammin kuin Claude 3.5. Varhaiset testit osoittavat huomattavasti tehokkaampaa suorituskykyä vakiotilassa.
  • Laajennettu ajattelun hallinta – API:n avulla käyttäjät voivat rajoittaa tai laajentaa tekoälyn päättelyn pituutta (jopa 128,000 XNUMX merkkiä) tasapainottaakseen nopeutta ja laatua tarpeen mukaan. Tämä varmistaa, että laajennettua tilaa käytetään vain niin paljon kuin on tarpeen.
  • Reaalimaailman tehtävien keskittyminen – Yrityksen mukaan Claude 3.7:n koulutus siirtyi käytännön bisnes- ja luoviin tehtäviin pikemminkin kuin hankalaan matematiikkaolympiapulmiin. Malli on erinomainen jokapäiväisessä ongelmanratkaisussa ja tehtävissä, jotka heijastavat yleisiä käyttötapauksia.
  • Koodaus ja työkalujen käyttö – Vahvempi suorituskyky ohjelmointitehtävissä, erityisesti etupään web-kehityksessä. Anthropic julkaisi jopa kumppanityökalun, Claude Code, jonka avulla kehittäjät voivat käyttää Claudea komentoriviltä koodin kirjoittamiseen ja korjaamiseen. Varhaiset vertailuarvot osoittavat Claude 3.7:n kärkilistat todellisten ohjelmistoongelmien ratkaisemisessa.

Rajoitukset ja mitä seuraavaksi tekoälykäyttäjille

Kaikesta jännityksestä huolimatta Claude 3.7 Sonnet ei ole rajaton, eikä se ole taikaluoti kaikkiin tekoälyhaasteisiin. Ensinnäkin Anthropic vähensi tietoisesti tiettyjä alueita tätä mallia harjoittaessaan. He "optimoivat hieman vähemmän matematiikan ja tietojenkäsittelytieteen kilpailuongelmiin" ja suosivat arkipäiväisempiä yritystehtäviä. Tämä tarkoittaa, että vaikka Claude 3.7 pystyy varmasti ratkaisemaan matematiikka- ja koodauskysymyksiä (usein paremmin kuin 3.5 voisi), se ei välttämättä ole tulostaulukon kärjessä jokaisessa akateemisessa vertailussa tai arvoituksessa. Käyttäjät, joiden tarpeet suuntautuvat kohti monimutkaisia ​​matemaattisia todisteita tai erikoistuneita koodauskilpailuja, saattavat silti löytää alueita, joissa Clauden vastaukset vaativat kaksinkertaista tarkistusta tai joilla kilpailijan kyseiseen markkinarakoon viritetty malli toimii paremmin. Anthropic näyttää hyväksyneen tämän kompromissin ja kohdistanut mallin käytännön hyötyyn teoreettisen kyvykkyyden sijaan.

Lisäksi Extended Thinking -tila, vaikka se on tehokas, tuo jonkin verran monimutkaisuutta. Se on luonnostaan ​​hitaampi kuin vakiotila; Kun tekoäly on syvästi pohdiskelemassa, käyttäjät huomaavat lyhyen tauon, kun se toimii perustelunsa läpi. Tämä on odotettavissa – kaupankäyntinopeus perusteelliseksi – mutta se tarkoittaa, että käyttäjien on päätettävä, milloin he todella tarvitsevat lisätehoa. Monissa jokapäiväisissä chat-kyselyissä vakiotila riittää ja on tehokkaampi. On myös se tosiasia, että laajennettu päättely voi joskus liioitella sitä ja tarjota paljon enemmän kuin todellisuudessa tarvitset. Joissakin tapauksissa tämä voi ylittää tai poiketa tieltä. Anthropicin on varmistettava, että tekoälyn halukkuus "mennä isosti" ideoiden kanssa pysyy ajantasaisena ja ajankohtaisena. Käyttäjät voivat oppia antamaan tarkempia ohjeita tai asettamaan merkkirajoja karanneiden tangenttien hillitsemiseksi.

Bottom Line

Claude 3.7 Sonnetin julkaisu kertoo, että Anthropic on mukana pelissä OpenAI:n, Googlen/DeepMindin ja uusien pelaajien, kuten xAI:n, rinnalla. Tekoälyharrastajille ja -kehittäjille se lisää kokeiltavaksi toisen huippuluokan mallin, joka tarjoaa ainutlaatuisen käänteen hybridiperustelullaan.

Kilpailevassa tekoälyteollisuudessa Anthropicin uusin siirto saattaa vaikuttaa myös siihen, miten yritykset asemoitavat mallinsa. Päättämällä olla tekemättä massiivista mallikoon hyppyä tai kimaltelevaa multimodaalista demoa, vaan hiomalla käyttökokemus (tilojen yhdistäminen, nopeus, käytännön käyttötapaukset), Anthropic on luomassa käytettävyyteen ja luotettavuuteen keskittyvää markkinarakoa. 

Kaiken kaikkiaan Claude 3.7 Sonnet on keskeinen hetki Anthropicille. Se on Claude-sarjan evoluutio, joka osoittaa, että yritys oppii yhteisön tarpeista – kaksinkertaistaa vahvuudet ja korjaa heikkoudet. On vielä katsottavaa (ja tulevia Claude-iteraatioita ennakoitavissa), mutta tämä julkaisu on selvästi lisännyt Anthropicin käyttäjäkuntaa. 

Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.