Aastate jooksul on staatilistest piltidest ja helist realistlike ja ekspressiivsete portree-animatsioonide loomine leidnud mitmeid rakendusi, sealhulgas mängud, digitaalne meedia,...
Suurte keelemudelite edusammud on märkimisväärselt kiirendanud loomuliku keele töötlemise ehk NLP arengut. Trafo karkassi kasutuselevõtt osutus...
Viimase kuue aastakümne jooksul on operatsioonisüsteemid järk-järgult arenenud, liikudes põhisüsteemidest keerukate ja interaktiivsete operatsioonisüsteemideni, mis toidavad tänapäeva seadmeid. Esialgu,...
Viimastel aastatel on häälestuspõhised difusioonimudelid näidanud märkimisväärset edu paljudes piltide isikupärastamise ja kohandamise ülesannetes. Vaatamata nende potentsiaalile,...
Parameetritõhusad peenhäälestus- või PeFT-meetodid püüavad kohandada suuri keelemudeleid värskenduste kaudu väikesele arvule kaaludele. Suurem osa olemasolevast tõlgendatavusest töötab aga...
Suured keelemudelid ja generatiivne AI on näidanud enneolematut edu paljude loomuliku keele töötlemise ülesannete puhul. Pärast NLP-välja vallutamist on järgmine...
GPT mudelite tulek koos teiste autoregressiivsete või AR suurte keelemudelitega avas masinõppe valdkonnas uue ajajärgu ja...
Pilt võib palju edasi anda, kuid seda võivad rikkuda ka mitmesugused probleemid, nagu liikumise hägusus, udu, müra ja madal dünaamiline ulatus.
Hiljutised edusammud Large Vision Language Models (LVLM-ides) on näidanud, et nende raamistike skaleerimine suurendab oluliselt jõudlust mitmesugustes allavoolu ülesannetes. LVLM-id, sealhulgas MiniGPT,...
Ainult dekoodriga trafo mudelitest koostatud suurte keelemudelite (LLM) väljatöötamine on mänginud olulist rolli loomuliku keele töötlemise (NLP) domeeni muutmisel, kuna ...
Arvutinägemine on tänapäeval tehisintellekti kogukonnas üks põnevamaid ja läbiuuritumaid valdkondi ning vaatamata arvutinägemise mudelite kiirele täiustamisele...
Viimastel aastatel on difusioonimudelid saavutanud tohutut edu ja tunnustust piltide ja videote genereerimise ülesannete täitmisel. Eelkõige video difusioonimudelid on olnud...
Objektide tuvastamine on olnud põhiline väljakutse arvutinägemise tööstuses, kus on rakendusi robootika, kujutise mõistmise, autonoomsete sõidukite ja pildituvastuse valdkonnas. Viimastel aastatel,...
Tehisintellektil töötav kujutiste genereerimise tehnoloogia on viimastel aastatel märgatavalt kasvanud alates sellest ajast, kui suurte tekstide ja kujutiste hajutamise mudelid, nagu DALL-E, GLIDE, Stable Diffusion,...
Multimodaalsete suurte keelemudelite (MLLM) tulek on toonud sisse uue ajastu mobiilseadmete agentidest, mis on võimelised maailma mõistma ja sellega suhtlema...