Rozhovory
Yubei Chen, spoluzakladatel Aizip Inc – Interview Series

Yubei Chen je spoluzakladatel společnosti Aizip inc., která vyvíjí nejmenší a nejefektivnější AI modely. Je také asistentem profesora na katedře ECE na University of California, Davis. Chenův výzkum se nachází na rozhraní počítačové neurovědy a hlubokého nesupervizovaného (sebe-supervizovaného) učení, což zlepšuje naše chápání výpočetních principů, které řídí nesupervizované učení reprezentací v mozku a strojích, a mění naše poznatky o statistice přírodních signálů.
Předtím, než se připojil k UC Davis, Chen dokončil postdoktorální studium s prof. Yannem LeCunem na NYU Center for Data Science (CDS) a Meta Fundamental AI Research (FAIR). Doktorát dokončil na Redwood Center for Theoretical Neuroscience a Berkeley AI Research (BAIR), UC Berkeley, pod vedením prof. Bruna Olshausena.
Aizip vyvíjí ultra-efektivní AI řešení optimalizovaná pro edge zařízení, nabízející kompaktní modely pro aplikace vidění, audio, časové řady, jazyk a senzorové fúze. Jeho produkty umožňují úkoly, jako je rozpoznávání obličejů a objektů, rozpoznávání klíčových slov, analýza ECG/EEG a chatboty na zařízení, všechny poháněné TinyML. Prostřednictvím své platformy AI nanofactory, Aizipline, společnost urychluje vývoj modelů pomocí základních a generativních modelů, aby dosáhla plné automatizace návrhu AI. Řada malých jazykových modelů Aizip (300M–2B parametrů) podporuje širokou škálu zařízení, přinášející inteligentní schopnosti na okraj.
Vy jste dělal postdoktorální studium s Yannem LeCunem na NYU a Meta FAIR. Jak vám práce s ním a váš výzkum na UC Berkeley ovlivnily váš přístup k budování reálných AI řešení?
Na Berkeley, moje práce byla hluboce zakořeněna ve vědeckém zkoumání a matematické přísnosti. Můj doktorský výzkum, který kombinoval elektrotechniku, počítačovou vědu a počítačovou neurovědu, se zaměřil na pochopení AI systémů z “bílé skříňky” perspektivy, nebo na vývoj metod, které odhalují základní struktury dat a učících se modelů. Pracoval jsem na budování interpretabilních, vysoce výkonných AI modelů a vizualizačních technik, které pomáhaly otevřít černé skříňky AI systémů.
Na Meta FAIR, se zaměřilo na inženýrství AI systémů, aby dosáhly špičkového výkonu ve velkém měřítku. S přístupem ke světovému počítačovému vybavení, prozkoumal jsem limity sebe-supervizovaného učení a přispěl k tomu, co nyní nazýváme “světovými modely” — AI systémy, které se učí z dat a představují možné prostředí. Tato dvojí zkušenost — vědecké pochopení na Berkeley a inženýrství poháněné škálováním na Meta — mi poskytla komplexní perspektivu na vývoj AI. To zdůraznilo důležitost teoretického vhledu a praktické implementace při vývoji AI řešení pro reálné aplikace.
Vaše práce kombinovala počítačovou neurovědu s AI. Jak vám inspirace z neurovědy ovlivňují způsob, jakým vyvíjíte AI modely?
V počítačové neurovědě studujeme, jak mozek zpracovává informace měřením jeho reakcí na různé stimuly, podobně jako když zkoumáme AI modely, abychom pochopili jejich vnitřní mechanismy. Brzy v mé kariéře, vyvinul jsem vizualizační techniky pro analýzu word embedding — rozložení slov, jako je “jablko”, do jejich základních sémantických prvků, jako je “ovoce” a “technologie”. Později se tento přístup rozšířil na složitější AI modely, jako transformátory a velké jazykové modely, které pomáhaly odhalit, jak zpracovávají a ukládají znalosti.
Tyto metody jsou vlastně paralelní s technikami v neurovědě, jako je použití elektrod nebo fMRI ke studiu mozkové aktivity. Zkoumání vnitřních reprezentací AI modelu umožňuje nám pochopit jeho strategie uvažování a detekovat vznikající vlastnosti, jako je konceptuální neurony, které se aktivují pro specifické myšlenky (jako je funkce Golden Gate Bridge, kterou Anthropic nalezl při mapování Claude). Tato linie výzkumu je nyní široce přijata v průmyslu, protože se prokázala jako prostředek k umožnění interpretability a praktických zásahů, odstranění偏见 z modelů. Takže neurověda-inspirované přístupy vlastně pomáhají nám učinit AI více vysvětlitelné, důvěryhodné a efektivní.
Co vás inspirovalo k založení Aizip? Můžete sdílet cestu od konceptu k spuštění společnosti?
Jako základní AI výzkumník, většina mé práce byla teoretická, ale chtěl jsem most mezi výzkumem a reálnými aplikacemi. Založil jsem Aizip, abych přinesl inovace AI do praktického použití, zejména v prostředích s omezenými zdroji. Místo budování velkých základních modelů, zaměřili jsme se na vývoj nejmenších a nejefektivnějších AI modelů, které by byly optimalizovány pro edge zařízení.
Cesta začala s klíčovým pozorováním: zatímco pokroky v AI rychle škálovaly, reálné aplikace často vyžadovaly lehké a vysoce efektivní modely. Viděli jsme příležitost k vyvinutí nového směru, který vyváží vědeckou přísnost s praktickou implementací. Díky využití poznatků ze sebe-supervizovaného učení a kompaktních architektur modelů, Aizip dokázal dodat AI řešení, která fungují efektivně na okraji a otevírají nové možnosti pro AI v vestavěných systémech, IoT a dalších.
Aizip se specializuje na malé AI modely pro edge zařízení. Jakou mezeru na trhu jste viděli, která vedla k tomuto zaměření?
Průmysl AI se většinou zaměřil na škálování modelů, ale reálné aplikace často vyžadují opak — vysokou efektivitu, nízkou spotřebu energie a minimální latenci. Mnoho AI modelů dnes je příliš výpočetně náročných pro nasazení na malá, vestavěná zařízení. Viděli jsme mezeru na trhu pro AI řešení, která by mohla dodat silný výkon, zatímco fungují v extrémních omezeních zdrojů.
Rozpoznali jsme, že není nutné, aby každé AI aplikace běžel na masivních modelech, a že by to nebylo ani škálovatelné, aby se spoléhaly na modely této velikosti pro vše. Místo toho se zaměřujeme na optimalizaci algoritmů, aby dosáhly maximální efektivity, zatímco udržují přesnost. Navrhováním AI modelů pro edge aplikace — ať už v inteligentních senzorech, nositelných zařízeních nebo průmyslové automatizaci — umožňujeme AI běhat na místech, kde by tradiční modely byly nepraktické. Náš přístup činí AI více přístupným, škálovatelným a energeticky efektivním, odemykajícím nové příležitosti pro AI-poháněnou inovaci za hranicemi cloudu.
Aizip je na předním místě ve vývoji Small Language Models (SLMs). Jak vidíte SLMs soutěžit nebo doplňovat větší modely, jako je GPT-4?
SLMs a větší modely, jako je GPT-4, nejsou nutně v přímé soutěži, protože slouží odlišným potřebám. Velké modely jsou silné v generalizaci a hlubokém uvažování, ale vyžadují podstatné výpočetní zdroje. SLMs jsou navrženy pro efektivitu a nasazení na edge zařízení s nízkou spotřebou energie. Doplňují velké modely tím, že umožňují AI schopnosti v reálných aplikacích, kde výpočetní zdroje, latence a náklady záleží — jako v IoT zařízeních, nositelných zařízeních a průmyslové automatizaci. Jak se AI přijetí zvyšuje, vidíme hybridní přístup, kdy velké, cloud-based modely zpracovávají komplexní dotazy, zatímco SLMs poskytují reálnou, lokalizovanou inteligenci na okraji.
Jaké jsou největší technické výzvy při vytváření AI modelů dostatečně efektivní pro low-power edge zařízení?
Jednou z fundamentálních výzev je absence úplného teoretického pochopení, jak AI modely fungují. Bez jasných teoretických základů, optimalizační úsilí jsou často empirická, omezující zisky efektivity. Kromě toho, lidské učení probíhá různými způsoby, které současné paradigmy strojového učení plně nezachycují, což činí obtížným navrhnout modely, které napodobují lidskou efektivitu.
Z inženýrského hlediska, tlačení AI, aby fungovaly v extrémních omezeních, vyžaduje inovativní řešení v kompresi modelů, kvantizaci a architektonickém designu. Další výzvou je vytvářet AI modely, které mohou přizpůsobit se různým zařízením a prostředím, zatímco zachovávají robustnost. Jak AI stále více interaguje s fyzickým světem prostřednictvím IoT a senzorů, potřeba přirozených a efektivní rozhraní — jako hlas, gesta a jiná netradiční vstupní metody — se stává kritickou. AI na okraji je o předefinování, jak uživatelé interagují s digitálním světem bezproblémově.
Můžete sdílet některé detaily o práci Aizip s společnostmi, jako je Softbank?
Nedávno jsme spolupracovali se SoftBank na projektu akvakultury, který získal cenu CES Innovation Award — jeden, na kterém jsme besonders pyšní. Vyvinuli jsme efektivní, edge-based AI model pro aplikaci počítání ryb, který může být použit akvakulturními operátory pro rybářské farmy. Toto řešení řeší kritickou výzvu v rybářství, která může nakonec vytvořit udržitelnost, potravinový odpad a problémy s ziskem. Průmysl byl pomalý v přijetí AI jako řešení, kvůli nespolehlivé energii a konektivitě na moři, což činí cloud-based AI řešení nepraktickými.
Abychom vyřešili tento problém, vyvinuli jsme řešení založené na zařízení. Kombinovali jsme počítačové grafické simulace SoftBank pro trénovací data s našimi kompaktními AI modely a vytvořili vysoce přesný systém, který běží na smartphoních. V podvodních polních testech dosáhl 95% rozpoznávací rychlosti, dramaticky zlepšující přesnost počítání ryb. To umožnilo farmářům optimalizovat skladovací podmínky, určit, zda by ryby měly být přepravovány živé nebo zmrazené, a detekovat potenciální nemoci nebo jiné zdravotní problémy u ryb.
Tento průlom zlepšuje efektivitu, snižuje náklady a snižuje závislost na manuální práci. Širší, ukazuje, jak AI může mít hmatatelný dopad na reálné problémy.
Aizip zavedl koncept “AI Nanofactory”. Můžete vysvětlit, co to znamená a jak automatizuje vývoj AI modelů?
AI Nanofactory je naše interní pipeline automatizace návrhu AI, inspirovaná Electronic Design Automation (EDA) ve výrobě polovodičů. Raný vývoj v jakékoli vznikající technologické oblasti zahrnuje mnoho manuálního úsilí, takže automatizace se stává klíčem k urychlení pokroku a škálování řešení, jak se oblast zrátí.
Místo toho, aby jsme prostě používali AI k urychlení jiných průmyslových odvětví, zeptali jsme se, zda AI může urychlit svůj vlastní vývoj? AI Nanofactory automatizuje každou fázi vývoje AI modelů, od zpracování dat po architektonický design, výběr modelu, trénink, kvantizaci, nasazení a ladění. Díky využití AI k optimalizaci sama sebe, jsme byli schopni snížit dobu vývoje nových modelů v průměru o faktor 10. V některých případech až o 1 000krát. To znamená, že model, který dříve trval více než rok, může být nyní vytvořen za několik hodin.
Další výhodou je, že tato automatizace také zajišťuje, že AI řešení jsou ekonomicky životaschopná pro širokou škálu aplikací, činí reálné nasazení AI více přístupným a škálovatelným.
Jak vidíte roli edge AI vyvíjet se v příštích pěti letech?
Edge AI slibuje transformovat, jak interagujeme s technologií, podobně jako jak smartphony revolucionalizovaly přístup k internetu. Většina AI aplikací dnes je cloud-based, ale toto se začíná měnit, jak AI se přesouvá blíže k senzorům a zařízením, které interagují s fyzickým světem. Tento posun zdůrazňuje kritickou potřebu efektivní, reálné zpracování na okraji.
V příštích pěti letech očekáváme, že edge AI umožní více přirozených interakcí mezi člověkem a počítačem, jako je rozpoznávání hlasu a gest, a dalších intuitivních rozhraní, která odstraní závislost na tradičních bariérách, jako jsou klávesnice a dotykové obrazovky. AI se také stane více zabudovaným do každodenních prostředí, jako jsou inteligentní domy nebo průmyslová automatizace, aby ermögnilo reálné rozhodování s minimální latencí.
Dalším klíčovým trendem bude rostoucí autonomie edge AI systémů. AI modely se stanou více sebesamozřejmějícími a adaptivními díky pokrokům v automatizaci stylu AI Nanofactory, takže sníží potřebu lidského zásahu při nasazení a údržbě. To otevře nové příležitosti v různých odvětvích, jako je zdravotnictví, automobilový průmysl a zemědělství.
Jaké jsou některé nadcházející AI-poháněné zařízení od Aizip, na kterých jste nejvíce nadšeni?
Pracujeme na rozšíření použití našich modelů v nových odvětvích a jedním z nich, na kterém jsme zvláště nadšeni, je AI Agent pro automobilový sektor. Existuje rostoucí momentum, zejména mezi čínskými automobilkami, na vývoj hlasových asistentů poháněných jazykovými modely, které cítí více jako ChatGPT uvnitř kabiny. Výzvou je, že většina současných asistentů stále závisí na cloudu, zejména pro přirozené, flexibilní dialogy. Pouze základní úkoly, jako je “zapnout klimatizaci” nebo “otevřít kufr”, obvykle běží místně na vozidle, a rigidita těchto příkazů může se stát rozptýlením pro řidiče, pokud je nemají完全 memorizovány.
Vyvinuli jsme řadu ultra-efektivních, SLM-poháněných AI agentů nazvaných Gizmo, které jsou aktuálně nasazeny v různých aplikacích pro různá odvětví, a pracujeme na jejich nasazení jako “spolujezdci” pro vozidla. Gizmo je trénován na pochopení záměru více nuancovaným způsobem a jako vozidlový AI Agent by mohl vykonávat příkazy prostřednictvím konverzačních, volných jazykových příkazů. Například, agent by mohl upravit teplotu kabiny, pokud by řidič prostě řekl, “Jsem zima”, nebo reagovat na prompt, “Jedu do Bostonu zítra, co bych měl nosit?” kontrolou počasí a nabídnutím návrhu.
Protože běží místně a nezávisí na cloudu, tito agenti pokračují v fungování v mrtvých zónách nebo oblastech s špatnou konektivitou, jako jsou tunely, hory nebo venkovské oblasti. Také zvyšují bezpečnost, poskytují řidičům kompletní hlasovou kontrolu bez odvrácení pozornosti od silnice. A na samostatné a lehčí poznámce, zmíním, že také aktuálně zavádíme AI-poháněný karaoke model pro vozidla a bluetooth reproduktory, který běží místně, podobně jako spolujezdec. Zjednodušeně, odstraňuje lidské hlasy z vstupního audia, což umožňuje vytvořit karaoke verzi jakéhokoli songu v reálném čase. Kromě toho, že pomáháme zákazníkům lépe a bezpečněji spravovat ovládání vozidla, hledáme způsoby, jak udělat zkušenost více zábavnou.
Tyto druhy řešení, které dělají skutečný rozdíl v každodenním životě lidí, jsou ty, na kterých jsme nejvíce pyšní.
Aizip vyvíjí ultra-efektivní AI řešení optimalizovaná pro edge zařízení, nabízející kompaktní modely pro aplikace vidění, audio, časové řady, jazyk a senzorové fúze. Jeho produkty umožňují úkoly, jako je rozpoznávání obličejů a objektů, rozpoznávání klíčových slov, analýza ECG/EEG a chatboty na zařízení, všechny poháněné TinyML. Prostřednictvím své platformy AI nanofactory, Aizipline, společnost urychluje vývoj modelů pomocí základních a generativních modelů, aby dosáhla plné automatizace návrhu AI. Řada malých jazykových modelů Aizip (300M–2B parametrů) podporuje širokou škálu zařízení, přinášejících inteligentní schopnosti na okraj.
Děkuji za skvělý rozhovor, čtenáři, kteří chtějí dozvědět se více, by měli navštívit Aizip.












