Tekoäly
Cerebras esittelee maailman nopeimman tekoälyratkaisun: 20x nopeus murto-osalla hinnasta

Aivojärjestelmät, korkean suorituskyvyn tekoälylaskennan edelläkävijä, on esitellyt uraauurtavan ratkaisun, joka mullistaa tekoälyn päättelyn. 27. elokuuta 2024 yhtiö ilmoitti lanseeraavansa Cerebras Inferencen, maailman nopeimman tekoälyn päättelypalvelun. Cerebras Inference tarjoaa 20-kertaisen nopeuden murto-osalla kustannuksista, ja sen suorituskykymittarit ovat kääpiöarvoja perinteisten GPU-pohjaisten järjestelmien vertailussa.
Ennennäkemätön nopeus ja kustannustehokkuus
Cerebras Inference on suunniteltu tarjoamaan poikkeuksellista suorituskykyä erilaisissa tekoälymalleissa, erityisesti nopeasti kehittyvässä segmentissä. suuria kielimalleja (LLM:t). Se käsittelee esimerkiksi 1,800 3.1 merkkiä sekunnissa Llama 8 450B -mallissa ja 3.1 tokenia sekunnissa Llama 70 20B -mallissa. Tämä suorituskyky ei ole vain 10 kertaa nopeampi kuin NVIDIA GPU-pohjaiset ratkaisut, vaan myös huomattavasti halvemmalla. Cerebras tarjoaa tämän palvelun alkaen vain 3.1 sentistä miljoonalta tokenilta Llama 8 60B -mallissa ja 3.1 sentillä miljoonalta tokenilta Llama 70 100B -mallissa, mikä edustaa XNUMX-kertaista parannusta hinta-suorituskykyyn verrattuna nykyiseen GPU-pohjaiseen tarjontaan.
Tarkkuuden säilyttäminen nopeuden rajoja ylittäen
Yksi Cerebras Inferencen vaikuttavimmista ominaisuuksista on sen kyky säilyttää huippuluokan tarkkuus samalla kun se tarjoaa vertaansa vailla olevaa nopeutta. Toisin kuin muut lähestymistavat, jotka uhraavat tarkkuuden nopeuden vuoksi, Cerebrasin ratkaisu pysyy 16-bittisessä toimialueella koko päättelyajon ajan. Tämä varmistaa, että suorituskyvyn lisäykset eivät tule tekoälymallin tulosteiden laadun kustannuksella, mikä on ratkaiseva tekijä tarkkuuteen keskittyville kehittäjille.
Micah Hill-Smith, Artificial Analysis -yrityksen perustaja ja toimitusjohtaja, korosti tämän saavutuksen merkitystä: "Cerebras toimittaa Meta Llama 3.1 8B- ja 70B AI -malleille suuruusluokkaa nopeampia nopeuksia kuin GPU-pohjaiset ratkaisut. Mittaamme nopeuksia, jotka ovat yli 1,800 3.1 lähtömerkkiä sekunnissa Llama 8 446B:ssä ja yli 3.1 lähtömerkkiä sekunnissa Llama 70 XNUMXB:ssä – uusi ennätys näissä vertailuissa.
Tekoälyn päättelyn kasvava merkitys
AI johtopäätös on nopeimmin kasvava tekoälylaskennan segmentti, jonka osuus kaikista tekoälylaitteistomarkkinoista on noin 40 %. Nopeiden tekoälypäätelmien tulo, kuten Cerebras tarjoaa, muistuttaa laajakaistainternetin käyttöönottoa – avaa uusia mahdollisuuksia ja ennakoi uutta aikakautta tekoälysovelluksille. Cerebras Inferencen avulla kehittäjät voivat nyt rakentaa seuraavan sukupolven tekoälysovelluksia, jotka vaativat monimutkaista, reaaliaikaista suorituskykyä, kuten tekoälyagentteja ja älykkäitä järjestelmiä.
Andrew Ng, DeepLearning.AI:n perustaja, korosti nopeuden merkitystä tekoälyn kehityksessä: "DeepLearning.AI:ssa on useita agenttityönkulkuja, jotka edellyttävät LLM:n toistuvaa kehotusta tuloksen saamiseksi. Cerebras on rakentanut vaikuttavan nopean päättelykyvyn, joka on erittäin hyödyllinen tällaisissa työkuormissa."
Laaja teollisuuden tuki ja strategiset kumppanuudet
Cerebras on saanut vahvan tuen alan johtajilta ja on muodostanut strategisia kumppanuuksia nopeuttaakseen tekoälysovellusten kehitystä. Kim Branson, AI/ML-johtaja GlaxoSmithKlinessa, varhaisessa Cerebras-asiakkaassa, korosti tämän tekniikan muuntavia mahdollisuuksia: "Nopeus ja mittakaava muuttavat kaiken."
Muut yritykset, kuten LiveKit, hämmennys, ja Meter, ovat myös ilmaisseet innostusta Cerebras Inferencen vaikutuksista heidän toimintaansa. Nämä yritykset hyödyntävät Cerebrasin laskentaominaisuuksia luodakseen reagoivampia, ihmisen kaltaisia tekoälykokemuksia, parantaakseen käyttäjien vuorovaikutusta hakukoneissa ja parantaakseen verkonhallintajärjestelmiä.
Aivopäätelmä: Tasot ja saavutettavuus
Cerebras Inference on saatavilla kolmelle kilpailukykyisesti hinnoiteltulle tasolle: Free, Developer ja Enterprise. Free Tier tarjoaa ilmaisen API-pääsyn runsailla käyttörajoituksilla, joten se on laajan käyttäjien saatavilla. Kehittäjätaso tarjoaa joustavan, palvelimettoman käyttöönottovaihtoehdon, ja Llama 3.1 -mallien hinta on 10 senttiä ja 60 senttiä miljoonalta tokenilta. Enterprise Tier palvelee organisaatioita, joiden työtaakka on jatkuvaa. Se tarjoaa hienosäädettyjä malleja, mukautettuja palvelutasosopimuksia ja erityistukea, ja hinnoittelu on saatavilla pyynnöstä.
Tehoaivojen päättely: Wafer Scale Engine 3 (WSE-3)
Cerebras Inferencen ytimessä on Cerebras CS-3 -järjestelmä, jonka voimanlähteenä on alan johtava Wafer Scale Engine 3 (WSE-3). Tämä tekoälyprosessori on kooltaan ja nopeudeltaan vertaansa vailla, ja se tarjoaa 7,000 100 kertaa enemmän muistin kaistanleveyttä kuin NVIDIAn H3. WSE-XNUMX:n massiivinen mittakaava mahdollistaa sen, että se pystyy käsittelemään monia samanaikaisia käyttäjiä, mikä varmistaa rakkuloiden nopeuden suorituskyvystä tinkimättä. Tämän arkkitehtuurin avulla Cerebras voi sivuuttaa kompromisseja, jotka tyypillisesti vaivaavat GPU-pohjaisia järjestelmiä, ja tarjoaa luokkansa parhaan suorituskyvyn tekoälyn työkuormille.
Saumaton integrointi ja kehittäjäystävällinen API
Cerebras Inference on suunniteltu kehittäjiä ajatellen. Siinä on API, joka on täysin yhteensopiva OpenAI Chat Completions API:n kanssa, mikä mahdollistaa helpon siirron minimaalisilla koodimuutoksilla. Tämä kehittäjäystävällinen lähestymistapa varmistaa, että Cerebras Inferencen integrointi olemassa oleviin työnkulkuihin on mahdollisimman saumatonta, mikä mahdollistaa tehokkaiden tekoälysovellusten nopean käyttöönoton.
Cerebras Systems: Innovaatioiden edistäminen eri toimialoilla
Cerebras Systems ei ole vain johtava tekoälyn laskennassa, vaan myös keskeinen toimija eri aloilla, mukaan lukien terveydenhuolto, energia, hallinto, tieteellinen tietojenkäsittely ja rahoituspalvelut. Yrityksen ratkaisut ovat auttaneet läpimurtoja sellaisissa laitoksissa kuin National Laboratories, Aleph Alpha, The Mayo Clinic ja GlaxoSmithKline.
Tarjoamalla vertaansa vailla olevan nopeuden, skaalautuvuuden ja tarkkuuden, Cerebras antaa näiden alojen organisaatioille mahdollisuuden käsitellä joitain haastavimmista tekoälyn ja sen jälkeisistä ongelmista. Cerebras on innovaatioiden edelläkävijä, olipa kyse lääkekehityksen nopeuttamisesta terveydenhuollossa tai tieteellisen tutkimuksen laskentakyvyn parantamisesta.
Johtopäätös: Uusi aikakausi tekoälyn päättelylle
Cerebras Systems asettaa uuden standardin tekoälyn päättelylle Cerebras Inferencen julkaisun myötä. Tarjoamalla 20 kertaa perinteisiä GPU-pohjaisia järjestelmiä nopeamman nopeuden murto-osalla kustannuksista, Cerebras ei ainoastaan tee tekoälyä helpommin saavutettavaksi, vaan myös tasoittaa tietä seuraavan sukupolven tekoälysovelluksille. Huipputeknologiansa, strategisten kumppanuuksiensa ja innovaatioihin sitoutumisensa ansiosta Cerebras on valmis johtamaan tekoälyteollisuuden uuteen ennennäkemättömän suorituskyvyn ja skaalautuvuuden aikakauteen.
Lisätietoja Cerebras Systemsistä ja Cerebras Inference -sovelluksen kokeilemisesta on osoitteessa www.cerebras.ai.