Spojte se s námi

Co nás může DeepSeek naučit o nákladech a efektivitě umělé inteligence

Myšlenkové vůdce

Co nás může DeepSeek naučit o nákladech a efektivitě umělé inteligence

mm

Se svým roztomilým logem velryby nemohlo nedávné vydání DeepSeek znamenat nic jiného než další knockoff ChatGPT. Díky tomu, že byl tak zajímavý – a co poslalo akcie konkurentů na frak – bylo to, jak málo stálo jeho vytvoření. Efektivně to vhodilo do americké představy o investici, kterou je zapotřebí k trénování vysoce funkčního modelu velkého jazyka (LLM), klíčový klíč.

DeepSeek údajně utratil pouhých 6 milionů dolarů na trénování svého modelu AI. Srovnejte to s nahlášenými 80–100 miliony dolarů, které OpenAI utratila za Chat GPT-4, nebo s 1 miliardou dolarů, kterou vyčlenila na GPT-5. DeepSeek tuto úroveň investic zpochybňuje a nechává velké hráče, jako je Nvidia – jejíž hodnota akcií se za jeden den propadla o 600 miliard dolarů – TSMC a Microsoft znepokojovat dlouhodobou finanční životaschopností AI. Pokud je možné trénovat modely umělé inteligence za podstatně méně, než se dříve předpokládalo, co to znamená pro celkové výdaje na umělou inteligenci?

I když přerušení DeepSeek vedlo k důležitým diskusím, zdá se, že některé klíčové body se při míchání ztrácejí. Novinky však přináší větší zaměření na to, kolik stojí inovace a možný ekonomický dopad AI. Zde jsou tři důležité poznatky vyplývající z této novinky:

1. Cenovka DeepSeek 6 milionů dolarů je zavádějící

Společnosti musí pochopit celkové náklady na vlastnictví (TCO) své infrastruktury. I když cena 6 milionů dolarů DeepSeek byla hodně hozena, to jsou pravděpodobně náklady pouze na jeho předtréninkový běh spíše než na celou jeho investici. Celkové náklady – nejen na běh, ale i na vybudování a trénink DeepSeek – jsou pravděpodobně mnohem vyšší. Analytická firma v oboru Semianalýza odhalil, že společnost stojící za DeepSeek utratila 1.6 miliardy dolarů za hardware, aby se její LLM stala realitou. Pravděpodobná cena je tedy někde uprostřed.

Ať už jsou skutečné náklady jakékoli, příchod DeepSeek vytvořil zaměření na nákladově efektivní inovace, které by mohly být transformační. Inovace jsou často podporovány omezeními a úspěch DeepSeek podtrhuje způsob, jakým může k inovacím dojít, když technické týmy optimalizují své zdroje tváří v tvář omezením v reálném světě.

2. Inference je to, co dělá AI hodnotnou, nikoli školení

Je důležité věnovat pozornost tomu, kolik stojí školení modelu AI, ale školení představuje malou část celkových nákladů na vytvoření a provoz modelu AI. Odvození — mnoho způsobů, jak umělá inteligence mění způsob, jakým lidé pracují, interagují a žijí — je místo, kde se AI stává skutečně cennou.

To přináší Jevonsův paradox, ekonomickou teorii, která naznačuje, že jak technologický pokrok zefektivňuje využití zdroje, může se ve skutečnosti zvýšit celková spotřeba tohoto zdroje. Jinými slovy, jak budou klesat náklady na školení, zvýší se inference a spotřeba agentů a celkové výdaje budou následovat.

Účinnost umělé inteligence může ve skutečnosti vést k nárůstu výdajů na umělou inteligenci, což by mělo zvednout všechny lodě, nejen čínské. Za předpokladu, že se vezou na vlně efektivity, budou z toho těžit i společnosti jako OpenAI a Nvidia.

3. Pravda zůstává, že na ekonomice jednotky nejvíce záleží

Zefektivnění umělé inteligence neznamená pouze snižování nákladů; jde také o optimalizaci ekonomiky jednotky. Motley Fool předpovídá, že to bude letos rok účinnosti AI. Pokud mají pravdu, společnosti by měly věnovat pozornost snižování nákladů na školení AI a také nákladů na spotřebu AI.

Organizace, které vytvářejí nebo používají AI, potřebují znát ekonomiku své jednotky, spíše než vyzdvihovat působivá čísla, jako jsou náklady na školení DeepSeek ve výši 6 milionů dolarů. Skutečná efektivita znamená alokovat všechny náklady, sledovat poptávku řízenou umělou inteligencí a neustále sledovat poměr nákladů k hodnotě.

Ekonomika cloudových jednotek (CUE) má co do činění s měřením a maximalizací zisku poháněného cloudem. CUE porovnává vaše náklady na cloud s metrikami příjmů a poptávky a odhaluje, jak efektivní jsou vaše cloudové výdaje, jak se to v průběhu času měnilo a (pokud máte správnou platformu) nejlepší způsoby, jak tuto efektivitu zvýšit.

Pochopení CUE má ještě větší užitečnost v kontextu AI, protože je ze své podstaty dražší na spotřebu než tradiční cloudové služby prodávané hyperscalery. Společnosti vytvářející agentní aplikace by mohly vypočítat své náklady na transakci (např. náklady na účet, náklady na dodávku, náklady na obchod atd.) a použít je k posouzení návratnosti investic do konkrétních služeb, produktů a funkcí řízených umělou inteligencí. S rostoucími výdaji na umělou inteligenci to budou společnosti nuceny dělat; žádná společnost nemůže házet nekonečné dolary na experimentální inovace navždy. Nakonec to musí dávat obchodní smysl.

Směrem k vyšší efektivitě

Jakkoli je číslo 6 milionů dolarů smysluplné, DeepSeek mohl poskytnout zlomový okamžik, který probudí technologický průmysl k nevyhnutelnému významu efektivity. Doufejme, že to otevře stavidla pro nákladově efektivní školení, odvození a agentní aplikace, které odemknou skutečný potenciál a ROI AI.

Phil Pergola je generálním ředitelem společnosti CloudZero. Je uznávaným B2B softwarovým manažerem se zkušenostmi s významným růstem tržeb a pozitivními obchodními výsledky v průběhu celého životního cyklu zákazníka – akvizice, onboarding, přijetí, expanze a udržení.