Liity verkostomme!

Mitä DeepSeek voi opettaa meille tekoälyn kustannuksista ja tehokkuudesta

Ajatusten johtajat

Mitä DeepSeek voi opettaa meille tekoälyn kustannuksista ja tehokkuudesta

mm

Suloisen valaslogon ansiosta DeepSeekin äskettäinen julkaisu olisi voinut olla vain uusi ChatGPT-poisto. Se, mikä teki siitä niin uutisarvoisen – ja mikä sai kilpailijoiden osakkeet jumiin – oli se, kuinka vähän sen luominen maksoi. Se heitti tehokkaasti apinaavaimen Yhdysvaltojen käsitykseen investoinneista, jotka tarvitaan tehokkaan Large Language Model (LLM) kouluttamiseen.

DeepSeek käytti väitetysti vain 6 miljoonaa dollaria tekoälymallinsa kouluttamiseen. Vertaa sitä raportoituihin 80–100 miljoonaan dollariin, jonka OpenAI käytti Chat GPT-4:ään, tai miljardiin dollariin, jonka he ovat varaanneet GPT-1:lle. DeepSeek kyseenalaistaa tämän investointitason ja jättää suuret toimijat, kuten Nvidian – jonka osakkeen arvo putosi 5 miljardia dollaria yhdessä päivässä – TSMC:n ja Microsoftin tyrmistyneenä tekoälyn pitkän aikavälin taloudellisesta kannattavuudesta. Jos tekoälymalleja on mahdollista kouluttaa huomattavasti vähemmän kuin aiemmin oletettiin, mitä tämä tarkoittaa tekoälyn kokonaiskulutukselle?

Vaikka DeepSeekin häiriintyminen on johtanut tärkeisiin keskusteluihin, jotkin keskeiset kohdat näyttävät häviävän sekoitusvaiheessa. Uutiset kuitenkin tuovat esiin enemmän keskittymistä innovaatiokustannuksiin ja tekoälyn mahdollisiin taloudellisiin vaikutuksiin. Tässä on kolme tärkeää oivallusta tästä uutisesta:

1. DeepSeekin 6 miljoonan dollarin hintalappu on harhaanjohtava

Yritysten on ymmärrettävä infrastruktuurinsa kokonaiskustannukset (TCO). Vaikka DeepSeekin 6 miljoonan dollarin hintalappu on heitetty paljon, se on luultavasti vain sen esikoulutusajon hinta eikä koko sen investointi. Kokonaiskustannukset – ei vain juoksemisesta, vaan DeepSeekin rakentamisesta ja harjoittelusta – ovat todennäköisesti paljon korkeammat. Toimialaanalyytikkoyritys Puolianalyysi paljasti, että DeepSeekin takana oleva yritys käytti 1.6 miljardia dollaria laitteistoihin tehdäkseen LLM:stään todellisuutta. Todennäköinen hinta on siis jossain puolivälissä.

Olivat todelliset kustannukset mitkä tahansa, DeepSeekin tulo on luonut painopisteen kustannustehokkaaseen innovaatioon, joka voi olla muutosta. Innovaatioita vauhdittavat usein rajoitukset, ja DeepSeekin menestys korostaa tapaa, jolla innovaatio voi tapahtua, kun suunnittelutiimit optimoivat resurssejaan todellisten rajoitusten edessä.

2. Päätelmä tekee tekoälystä arvokkaan, ei koulutus

On tärkeää kiinnittää huomiota siihen, kuinka paljon tekoälymallin koulutus maksaa, mutta koulutus muodostaa pienen osan tekoälymallin rakentamisen ja käytön kokonaiskustannuksista. Päättely – Tekoäly muuttaa ihmisten työskentely-, vuorovaikutustapa- ja elämäntapaa moninaisilla tavoilla – tässä tekoälystä tulee todella arvokasta.

Tämä tuo esiin Jevonsin paradoksin, talousteorian, jonka mukaan teknologian edistyessä resurssin käyttöä tehostetaan, resurssin kokonaiskulutus voi itse asiassa kasvaa. Toisin sanoen koulutuskustannusten pienentyessä päätelmien ja agenttien kulutus kasvaa, ja kokonaiskulutus seuraa perässä.

Tekoälyn tehokkuus voi itse asiassa johtaa tekoälyn kulutuksen nousuun, jonka pitäisi nostaa kaikkia veneitä, ei vain kiinalaisia. Olettaen, että he ajavat tehokkuusaaltoa, myös OpenAI:n ja Nvidian kaltaiset yritykset hyötyvät.

3. Se mikä on totta, on se, että yksikkötalous on tärkeintä

Tekoälyn tehostaminen ei tarkoita vain kustannusten alentamista; kyse on myös yksikkötalouden optimoinnista. The Motley Fool ennustaa, että tämä vuosi tulee olemaan tekoälyn tehokkuuden vuosi. Jos he ovat oikeassa, yritysten tulisi kiinnittää huomiota tekoälyn koulutuskustannusten ja tekoälyn kulutuskustannusten alentamiseen.

Tekoälyä rakentavien tai käyttävien organisaatioiden on tunnettava yksikkönsä talous sen sijaan, että ne erottelevat vaikuttavia lukuja, kuten DeepSeekin 6 miljoonan dollarin koulutuskustannukset. Todellinen tehokkuus edellyttää kaikkien kustannusten kohdentamista, tekoälyn ohjaaman kysynnän seurantaa ja kustannusten ja arvon jatkuvaa seurantaa.

Pilviyksiköiden taloustiede (CUE) liittyy pilven tuottaman tuoton mittaamiseen ja maksimoimiseen. CUE vertaa pilvikulujasi tuotto- ja kysyntämittareihin ja paljastaa, kuinka tehokkaita pilvikulutuksesi ovat, kuinka se on muuttunut ajan myötä ja (jos sinulla on oikea alusta) parhaat tavat lisätä tehokkuutta.

CUE:n ymmärtäminen on vieläkin hyödyllisempää tekoälykontekstissa, koska se on luonnostaan ​​kalliimpaa kuin hyperskaalaajien myymät perinteiset pilvipalvelut. Agenttisovelluksia rakentavat yritykset voivat laskea tapahtumakohtaiset kustannukset (esim. laskun hinta, toimituskulut, kauppakohtainen hinta jne.) ja käyttää tätä arvioidakseen tiettyjen tekoälypohjaisten palvelujen, tuotteiden ja ominaisuuksien sijoitetun pääoman tuottoprosenttia. Tekoälykulujen kasvaessa yritysten on pakko tehdä tämä; mikään yritys ei voi heittää loputtomasti dollareita kokeelliseen innovaatioon ikuisesti. Lopulta sen on oltava liiketaloudellisesti järkevää.

Kohti suurempaa tehokkuutta

Kuinka merkityksellinen 6 miljoonan dollarin luku onkaan, DeepSeek on saattanut tarjota vedenjakajahetken, joka herättää teknologiateollisuuden tehokkuuden väistämättömään tärkeyteen. Toivotaan, että tämä avaa tulvaportit kustannustehokkaille koulutus-, päätelmä- ja agenttisovelluksille, jotka vapauttavat tekoälyn todellisen potentiaalin ja ROI:n.

Phil Pergola on toimitusjohtaja CloudZero. Hän on taitava B2B-ohjelmistopäällikkö, jolla on kokemusta merkittävästä liikevaihdon kasvusta ja positiivisista liiketoimintatuloksista asiakkaan koko elinkaaren ajan – hankinnassa, käyttöönottoon, käyttöönotossa, laajentamisessa ja säilyttämisessä.