V průběhu let našlo vytváření realistických a expresivních animací portrétů ze statických obrázků a zvuku řadu aplikací včetně her, digitálních médií,...
Pokroky ve velkých jazykových modelech výrazně urychlily vývoj zpracování přirozeného jazyka neboli NLP. Zavedení rámce transformátoru se ukázalo jako...
Za posledních šest desetiletí se operační systémy progresivně vyvíjely, od základních systémů ke komplexním a interaktivním operačním systémům, které pohánějí dnešní zařízení. Zpočátku,...
Během několika posledních let prokázaly difúzní modely založené na ladění pozoruhodný pokrok v celé řadě úkolů přizpůsobení obrazu a přizpůsobení. Navzdory jejich potenciálu však...
Parametrově efektivní jemné ladění nebo metody PeFT se snaží přizpůsobit velké jazykové modely prostřednictvím aktualizací na malý počet vah. Většina existujících interpretovatelných funkcí však funguje...
Velké jazykové modely a generativní umělá inteligence prokázaly nebývalý úspěch v široké řadě úloh zpracování přirozeného jazyka. Po dobytí NLP pole následuje další...
Nástup modelů GPT spolu s dalšími autoregresivními nebo AR velkými jazykovými modely rozpoutal novou epochu v oblasti strojového učení a...
Obraz může sdělit mnoho, ale může být také poškozen různými problémy, jako je rozmazání pohybu, závoj, šum a nízký dynamický rozsah....
Nedávné pokroky v oblasti jazykových modelů pro velké vidění (LVLM) ukázaly, že škálování těchto rámců výrazně zvyšuje výkon v celé řadě navazujících úloh. LVLM, včetně MiniGPT,...
Vývoj velkých jazykových modelů (LLM) vytvořených z modelů transformátorů pouze pro dekodéry sehrál klíčovou roli při transformaci domény zpracování přirozeného jazyka (NLP), protože...
Počítačové vidění je dnes jednou z nejvíce vzrušujících a dobře prozkoumaných oblastí v rámci komunity AI a navzdory rychlému vylepšování modelů počítačového vidění,...
Během několika posledních let dosáhly difúzní modely obrovského úspěchu a uznání pro úlohy generování obrazu a videa. Modely šíření videa byly zejména...
Detekce objektů byla základní výzvou v průmyslu počítačového vidění s aplikacemi v robotice, porozumění obrazu, autonomních vozidlech a rozpoznávání obrazu. V posledních letech,...
Technologie generování obrazu poháněná umělou inteligencí zaznamenala v posledních několika letech pozoruhodný růst od doby, kdy velké modely šíření textu do obrazu, jako jsou DALL-E, GLIDE, Stable Diffusion,...
Nástup multimodálních velkých jazykových modelů (MLLM) zahájil novou éru agentů mobilních zařízení, schopných porozumět světu a komunikovat s ním...