stub

Kunal Kejriwal, Unite.AI autorius

Susisiekti su mumis

Kunal Kejriwal

„Iš profesijos inžinierius, iš širdies – rašytojas“. Kunal yra techninis rašytojas, giliai mylintis ir suprantantis dirbtinį intelektą ir ML, siekiantis supaprastinti sudėtingas sąvokas šiose srityse, pasitelkdamas patrauklią ir informatyvią dokumentaciją.

Dirbtinis intelektasprieš 4 dienas
„AniPortrait“: garsu pagrįsta fotorealistinio portreto animacijos sintezė
Bėgant metams tikroviškų ir išraiškingų portretų animacijų kūrimas iš statinių vaizdų ir garso buvo pritaikytas įvairioms programoms, įskaitant žaidimus, skaitmeninę laikmeną,...
Dirbtinis intelektasprieš 2 savaites
Mini-Gemini: Multimodalumo vizijos kalbos modelių potencialo išnaudojimas
Didžiųjų kalbų modelių pažanga žymiai paspartino natūralios kalbos apdorojimo arba NLP vystymąsi. Transformatoriaus karkaso įvedimas pasirodė esąs...
Dirbtinis intelektasprieš 2 savaites
AIOS: operacinė sistema LLM agentams
Per pastaruosius šešis dešimtmečius operacinės sistemos vystėsi laipsniškai, nuo pagrindinių sistemų pažengusios į sudėtingas ir interaktyvias operacines sistemas, kurios maitina šiuolaikinius įrenginius. Iš pradžių,...
Dirbtinis intelektasprieš 3 savaites
Momentinis stilius: stiliaus išsaugojimas kuriant tekstą į vaizdą
Per pastaruosius kelerius metus derinimu pagrįsti difuzijos modeliai parodė didelę pažangą atliekant įvairias vaizdo personalizavimo ir pritaikymo užduotis. Tačiau nepaisant jų potencialo,...
Dirbtinis intelektasprieš 3 savaites
LoReFT: Representation Finetuning for Language Models
Parametrų efektyvumo koregavimo arba PeFT metodais siekiama pritaikyti didelius kalbos modelius atnaujinant nedidelį skaičių svarmenų. Tačiau didžioji dalis esamų interpretacijų veikia...
Dirbtinis intelektasprieš 4 savaites
POKELLMON: Žmonių lygybės agentas pokemonų mūšiams su LLM
Dideli kalbų modeliai ir generuojantis AI pademonstravo precedento neturinčią sėkmę atliekant daugybę natūralios kalbos apdorojimo užduočių. Užkariavus NLP lauką, kitas...
Dirbtinis intelektasprieš 4 savaites
Vizualus autoregresyvus modeliavimas: keičiamo dydžio vaizdo generavimas naudojant kito mastelio numatymą
GPT modelių ir kitų autoregresyvių arba AR didelių kalbų modelių atsiradimas atskleidė naują epochą mašininio mokymosi srityje ir...
Dirbtinis intelektasprieš 1 mėnesį
InstructIR: aukštos kokybės vaizdo atkūrimas pagal žmogaus nurodymus
Vaizdas gali perteikti labai daug, tačiau jį taip pat gali pažeisti įvairios problemos, tokios kaip judesio susiliejimas, migla, triukšmas ir mažas dinaminis diapazonas....
Dirbtinis intelektasprieš 1 mėnesį
MoE-LLaVA: ekspertų mišinys dideliems vizijos ir kalbos modeliams
Naujausi Large Vision kalbos modelių (LVLM) pažanga parodė, kad šių sistemų mastelis žymiai padidina našumą atliekant įvairias paskesnes užduotis. LVLM, įskaitant MiniGPT,...
Dirbtinis intelektasprieš 1 mėnesį
BlackMamba: valstybės ir erdvės modelių ekspertų mišinys
Didžiųjų kalbų modelių (LLM), sukurtų iš tik dekoderio transformatorių modelių, kūrimas suvaidino lemiamą vaidmenį transformuojant natūralios kalbos apdorojimo (NLP) domeną, nes...
Dirbtinis intelektasprieš 1 mėnesį
„DynamiCrafter“: Atviro domeno vaizdų animavimas naudojant vaizdo sklaidos pirmenybę
Kompiuterinė vizija yra viena įdomiausių ir labiausiai ištirtų sričių AI bendruomenėje šiandien, ir nepaisant spartaus kompiuterinio matymo modelių tobulėjimo,...
Dirbtinis intelektasprieš 2 mėnesių
AnimateLCM: suasmenintų difuzijos modelių animacijos pagreitinimas
Per pastaruosius kelerius metus difuzijos modeliai sulaukė didžiulės sėkmės ir pripažinimo atliekant vaizdo ir vaizdo įrašų generavimo užduotis. Visų pirma, vaizdo sklaidos modeliai buvo...
Dirbtinis intelektasprieš 2 mėnesių
YOLO-World: atvirojo žodyno objektų aptikimas realiuoju laiku
Objektų aptikimas buvo pagrindinis iššūkis kompiuterinio matymo pramonėje, naudojant robotiką, vaizdo supratimą, autonomines transporto priemones ir vaizdo atpažinimą. Pastaraisiais metais,...
Dirbtinis intelektasprieš 2 mėnesių
InstantID: nulinės tapatybės išsaugojimo generavimas per kelias sekundes
Dirbtinio intelekto valdoma vaizdų generavimo technologija per pastaruosius kelerius metus pastebimai išaugo nuo tada, kai buvo naudojami dideli teksto į vaizdą sklaidos modeliai, tokie kaip DALL-E, GLIDE, Stable Diffusion,...
Dirbtinis intelektasprieš 2 mėnesių
Mobilieji agentai: autonominis daugiarūšis mobiliųjų įrenginių agentas su vizualiniu suvokimu
Multimodalinių didelių kalbų modelių (MLLM) atsiradimas pradėjo naują mobiliųjų įrenginių agentų, galinčių suprasti pasaulį ir bendrauti su juo, erą...

Daugiau pranešimų

Puslapis 1 iš 512 3 4 5