Spojte se s námi

Oznámení

Cerebras představuje Qwen3‑235B: Nová éra rychlosti, škálovatelnosti a nákladů umělé inteligence

mm

Zveřejněno

 on

Cerebras systémy oficiálně zahájena Qwen3‑235B, špičkový model umělé inteligence s plnou podporou kontextu 131,000 30 tokenů, který nastavuje nový standard pro výkon v oblasti uvažování, generování kódu a podnikových aplikací umělé inteligence. Model, nyní dostupný prostřednictvím Cerebras Inference Cloud, nabízí funkce, které konkurují nejpokročilejším hraničním systémům – a přitom pracuje XNUMXkrát rychleji a má desetinové náklady oproti dnešním předním modelům s uzavřeným zdrojovým kódem.

Umělá inteligence v reálném čase dosahuje průlomové rychlosti

Umělá inteligence bývá historicky pomalá a velkým modelům často trvalo minutu nebo i déle, než odpoví na složité dotazy. Cerebras toto úzké místo eliminuje. Je poháněn vlastním… Wafer-Scale Engine 3 (WSE‑3), Qwen3‑235B dosahuje 1,500 tokenů za sekundu, světový rekord v odvozování na hranicích s využitím umělé inteligence.

Tato úroveň výkonu transformuje uživatelský zážitek – snižuje latenci z 60–120 sekund na pouhých 0.6 sekundy, a to i při zpracování úloh složitého uvažování nebo spouštění vícekrokových pracovních postupů, jako je generování s rozšířeným vyhledáváním (RAG). Podle výsledků benchmarků od Artificial Analysis se žádný jiný poskytovatel – otevřený ani uzavřený – v současné době s touto rychlostí odvozování pro model na hraniční úrovni nevyrovná.

Nový standard v kontextu: 131 tisíc tokenů pro reálné aplikace

Současně s touto verzí Cerebras rozšířil okno kontextu modelu z 32 tisíc na plných 131 tisíc tokenů podporovaných modelem Qwen3‑235B. Tento skok ve velikosti kontextu umožňuje modelu přijímat a analyzovat obrovské objemy dat – zahrnující kompletní kódové základny, úložiště s více dokumenty a dlouhé technické materiály.

Zatímco 32K kontext umožňuje základní generování úloh, 131K otevírá dveře vývoji na produkční úrovni. Umělá inteligence nyní může fungovat jako spolupracovník na hlubokém kódu, syntetizuje desítky souborů a spravuje složité závislosti v reálném čase – což ji činí ideální pro podnikové použití v softwarovém inženýrství, analýze dokumentů a vědeckých výpočtech.

Proč je Cerebras jiný: Hardware navržený pro umělou inteligenci od základů

Společnost Cerebras Systems, založená týmem průkopnických počítačových architektů, výzkumníků v oblasti umělé inteligence a systémových inženýrů, zvolila radikálně odlišný přístup k řešení problémů škálování generativní umělé inteligence. Místo spoléhání se na clustery GPU postavila společnost Cerebras účelový superpočítač umělé inteligence na základě vlastního čipu: Wafer-Scale Engine 3.

Tento čip je v oboru jedinečný. Má velikost talíře a obsahuje stovky tisíc jader optimalizovaných pro umělou inteligenci s pamětí na čipu o velikosti desítek gigabajtů. Tato konstrukce umožňuje, aby výpočetní a paměťové procesory fungovaly vedle sebe, čímž se eliminuje latence, omezení šířky pásma a složitost orchestrace tradičních řešení s více grafickými procesory.

Shlukováním jeho Systémy CS-3Společnost Cerebras dokáže vytvářet superpočítače s umělou inteligencí, které jsou schopné snadno spouštět modely s biliony parametrů, a to vše bez technické zátěže distribuovaných výpočtů. Tento jednotný přístup je základem rekordních rychlostí inference a umožňuje nové vysoce kontextové funkce.

Efektivita ministerstva hospodářství umožňuje dramatické snížení nákladů

Qwen3‑235B je vyroben s použitím směs odborníků (MŽP) architektura – návrh modelu, který aktivuje pouze podmnožinu interních expertů v závislosti na vstupu, což vede k výrazně vyšší výpočetní efektivitě.

Díky tomu může Cerebras nabídnout model za cenu, která výrazně podbízí alternativy s uzavřeným zdrojovým kódem. Konkrétně je inference k dispozici za 0.60 USD za milion vstupních tokenů a 1.20 USD za milion výstupních tokenů, což představuje více než 90% snížení nákladů ve srovnání s proprietárními modely od OpenAI, Anthropic nebo Google.

Bezproblémová integrace s Cline ve VS Code

Aby společnost Cerebras předvedla rychlost a reálné využití Qwen3‑235B, navázala partnerství s... Cline, přední agent pro kódování v Microsoft Visual Studio Code, který má v současnosti nainstalovánu více než 1.8 milionu vývojářů.

Uživatelé Cline již mají přístup k Qwen3‑32B s 64K kontextem v rámci bezplatné verze. S dnešním oznámením se podpora rozšíří i na Qwen3‑235B a jeho plný 131K kontext, což umožní úroveň uvažování a generování kódu přímo v editoru, která dříve v reálném čase nebyla dosažitelná.

Saúd Rizwan, generální ředitel společnosti Cline, vysvětlil: „Díky inferenci Cerebras se vývojáři používající Cline dostávají do budoucnosti, protože Cline řeší problémy, čte kódové základny a píše kód téměř v reálném čase. Všechno se děje tak rychle, že vývojáři zůstávají v rytmu a iterují rychlostí myšlenky. Tento druh rychlé inference není jen příjemný – ukazuje nám, co je možné, když umělá inteligence skutečně drží krok s vývojáři.“

Otevřená alternativa k uzavřeným modelům

Výkon Qwen3‑235B se srovnává s některými z nejsofistikovanějších modelů umělé inteligence na dnešním trhu, včetně Claude 4 Sonnet, Gemini 2.5 Flash a DeepSeek R1, což potvrzují nezávislé benchmarky. Cerebras jej však dodává ve formátu s otevřeným přístupem, což nabízí transparentnost a přenositelnost, které uzavřeným modelům chybí.

Tento přístup otevřeného modelu umožňuje podnikům:

  • Přizpůsobení a doladění na základě proprietárních dat
  • Nasaďte umělou inteligenci na privátní infrastruktuře nebo v hybridních cloudových prostředích
  • Vyhněte se rizikům spojeným s vázáním na dodavatele a ochraně soukromí dat

V kombinaci se škálovatelnou cloudovou platformou Cerebras a volitelným nasazením systémů CS-3 přímo v podniku získávají organizace plnou kontrolu nad tím, jak se umělá inteligence používá pro kritické úkoly.

Co to znamená pro průmysl

Uvedení Qwen3‑235B na trh představuje zlomový bod. Cerebras nově definoval hranice možností rozsáhlých jazykových modelů tím, že kombinuje hraniční inteligenci s bezprecedentní rychlostí a nákladovou efektivitou.

Nyní je možné vytvářet nástroje umělé inteligence, které:

  • Odpovídejte na dotazy vývojářů v reálném čase
  • Důvod nad rámec úplné dokumentace nebo znalostních bází
  • Generování a ladění produkčního kódu přímo v IDE
  • Škálování pro podnikové případy použití bez rozsáhlých GPU nebo šestimístných měsíčních účtů za inferenci

S rostoucí poptávkou po infrastruktuře umělé inteligence Cerebras dokazuje, že není nutné dělat kompromisy mezi výkonem, cenou a otevřeností. Jeho společný návrh hardwaru a softwaru, od Wafer-Scale Engine až po Cerebras Inference Cloud, ukazuje na nový model nasazení umělé inteligence – takový, který je rychlejší, jednodušší a mnohem dostupnější.

Konečná myšlenka

Vydáním Qwen3‑235B s kontextem 131K, ultrarychlou inferencí a dostupnou cenou tokenů, Cerebras systémy se etablovala jako jeden z mála skutečných vyzyvatelů stávajících společností s grafickými procesory. Pro podniky, výzkumníky a vývojáře je toto uvedení na trh více než jen rychlejší model – je to inflexní bod, který přináší otevřenou umělou inteligenci v reálném čase, na produkční úrovni, na dosah ruky.

Antoine je vizionářský vůdce a zakládající partner Unite.AI, poháněný neochvějnou vášní pro utváření a prosazování budoucnosti umělé inteligence a robotiky. Je sériovým podnikatelem a věří, že umělá inteligence bude pro společnost stejně rušivá jako elektřina, a často je přistižen při blouznění o potenciálu převratných technologií a AGI.

Jako futurista, věnuje se zkoumání toho, jak tyto inovace utvářejí náš svět. Kromě toho je zakladatelem Cenné papíry.io, platforma zaměřená na investice do špičkových technologií, které nově definují budoucnost a přetvářejí celé sektory.