Liderii gândirii
Ce ne poate învăța DeepSeek despre costul și eficiența AI

Cu logo-ul său drăguț de balenă, recenta lansare a DeepSeek ar fi putut să nu fie altceva decât o altă imitație ChatGPT. Ceea ce a făcut-o atât de demn de știri – și ceea ce a făcut ca acțiunile concurenților să se dezvolte – a fost cât de puțin a costat crearea. A aruncat efectiv o cheie de maimuță în noțiunea SUA cu privire la investiția necesară pentru a antrena un model de limbă mare (LLM) care funcționează înalt.
Se presupune că DeepSeek a cheltuit doar 6 milioane de dolari pentru a-și antrena modelul AI. Juxtapuneți asta cu 80-100 de milioane USD raportate pe care OpenAI le-a cheltuit pe Chat GPT-4 sau cu 1 miliard USD pe care l-au alocat pentru GPT-5. DeepSeek pune sub semnul întrebării acest nivel de investiții și îi lasă pe jucători mari precum Nvidia – a căror valoare acțiunilor a scăzut cu 600 de miliarde de dolari într-o singură zi – TSMC și Microsoft îngrijorați de viabilitatea financiară pe termen lung a AI. Dacă este posibil să antrenați modele AI pentru mult mai puțin decât se presupunea anterior, ce anume înseamnă acest lucru pentru cheltuielile AI în general?
Deși întreruperea DeepSeek a dus la discuții importante, unele puncte cheie par să se piardă în amestec. Cu toate acestea, ceea ce aduc știrile este un accent mai mare pe cât de mult costă inovația și pe posibilul impact economic al AI. Iată trei perspective importante care decurg din această știre:
1. Eticheta de preț de 6 milioane USD a DeepSeek este înșelătoare
Companiile trebuie să înțeleagă costul total de proprietate (TCO) al infrastructurii lor. Deși prețul de 6 milioane de dolari al DeepSeek a fost aruncat foarte mult, acesta este probabil costul doar al cursei sale de pre-antrenament, mai degrabă decât întreaga investiție. Costul total – nu numai al rulării, ci și al construirii și antrenării DeepSeek – este probabil mult mai mare. Firma de analisti de industrie Semianaliză a dezvăluit că compania din spatele DeepSeek a cheltuit 1.6 miliarde de dolari pe hardware pentru a-și transforma LLM în realitate. Deci, costul probabil este undeva la mijloc.
Oricare ar fi costul adevărat, apariția DeepSeek a creat un accent pe inovarea eficientă din punct de vedere al costurilor, care ar putea fi transformatoare. Inovația este adesea stimulată de limitări, iar succesul DeepSeek subliniază modul în care inovația poate avea loc atunci când echipele de ingineri își optimizează resursele în fața constrângerilor din lumea reală.
2. Inferența este ceea ce face AI valoroasă, nu antrenamentul
Este important să acordați atenție cât de mult costă antrenamentul cu modelul AI, dar instruirea reprezintă o mică parte din costul total pentru construirea și rularea unui model AI. deducție — multiplele moduri în care AI schimbă modul în care oamenii lucrează, interacționează și trăiesc — este locul în care AI devine cu adevărat valoroasă.
Acest lucru aduce în discuție paradoxul Jevons, o teorie economică care sugerează că, pe măsură ce progresele tehnologice fac utilizarea unei resurse mai eficientă, consumul total al acelei resurse poate crește de fapt. Cu alte cuvinte, pe măsură ce costurile de formare scad, inferența și consumul agentic vor crește, iar cheltuielile generale vor urma exemplul.
Eficiența AI poate duce, de fapt, la un val în creștere al cheltuielilor AI, care ar trebui să ridice toate bărcile, nu doar pe cele chinezești. Presupunând că vor merge pe valul de eficiență, companii precum OpenAI și Nvidia vor beneficia și ele.
3. Ceea ce rămâne adevărat este că economia unității contează cel mai mult
Eficientizarea AI nu înseamnă doar reducerea costurilor; este, de asemenea, despre optimizarea economiei unității. Motley Fool prognozează că anul acesta va fi anul eficienței AI. Dacă au dreptate, companiile ar trebui să acorde atenție reducerii costurilor de formare în AI, precum și a costurilor de consum de AI.
Organizațiile care construiesc sau folosesc IA trebuie să-și cunoască economia unității, mai degrabă decât să evidențieze cifre impresionante, cum ar fi costul de formare de 6 milioane USD al DeepSeek. Eficiența reală presupune alocarea tuturor costurilor, urmărirea cererii bazate pe inteligență artificială și monitorizarea constantă a raportului cost-preț.
Economia unității cloud (CUE) are de-a face cu măsurarea și maximizarea profitului generat de cloud. CUE compară costurile dvs. cloud cu valorile veniturilor și ale cererii, dezvăluind cât de eficiente sunt cheltuielile dvs. în cloud, cum s-au schimbat acestea de-a lungul timpului și (dacă aveți platforma potrivită) cele mai bune modalități de a crește această eficiență.
Înțelegerea CUE are o utilitate și mai mare într-un context AI, având în vedere că este în mod inerent mai costisitor de consumat decât serviciile tradiționale cloud vândute de hyperscalers. Companiile care construiesc aplicații agentice și-ar putea calcula costul pe tranzacție (de exemplu, costul pe factură, costul pe livrare, costul pe tranzacție etc.) și să-l folosească pentru a evalua rentabilitatea investiției pentru anumite servicii, produse și caracteristici bazate pe AI. Pe măsură ce cheltuielile cu inteligența artificială cresc, companiile vor fi forțate să facă acest lucru; nicio companie nu poate arunca nesfârșite dolari în inovația experimentală pentru totdeauna. În cele din urmă, trebuie să aibă sens în afaceri.
Spre o eficiență mai mare
Oricât de semnificativă ar fi cifra de 6 milioane de dolari, DeepSeek poate să fi oferit un moment decisiv care trezește industria tehnologiei la importanța inevitabil a eficienței. Să sperăm că acest lucru deschide porțile pentru instruire, inferență și aplicații agentice rentabile care deblochează adevăratul potențial și rentabilitatea investiției AI.