През годините създаването на реалистични и изразителни портретни анимации от статични изображения и аудио е намерило редица приложения, включително игри, цифрови медии,...
Напредъкът в големите езикови модели значително ускори развитието на обработката на естествен език или NLP. Въвеждането на трансформаторната рамка се оказа...
През последните шест десетилетия операционните системи се развиха прогресивно, преминавайки от основни системи към сложни и интерактивни операционни системи, които захранват днешните устройства. Първоначално...
През последните няколко години дифузионните модели, базирани на настройка, демонстрираха забележителен напредък в широк набор от задачи за персонализиране и персонализиране на изображения. Въпреки потенциала си обаче,...
Параметрно ефективната фина настройка или методите на PeFT се стремят да адаптират големи езикови модели чрез актуализации към малък брой тегла. Въпреки това, по-голямата част от съществуващата интерпретируемост работи...
Големите езикови модели и Generative AI демонстрираха безпрецедентен успех при широк набор от задачи за обработка на естествен език. След покоряването на НЛП сферата, следващата...
Появата на GPT модели, заедно с други авторегресивни или AR големи езикови модели, откри нова епоха в областта на машинното обучение и...
Едно изображение може да предаде много, но също така може да бъде помрачено от различни проблеми като замъгляване на движението, мъгла, шум и нисък динамичен диапазон....
Последните постижения в Large Vision Language Models (LVLM) показаха, че мащабирането на тези рамки значително повишава производителността при различни задачи надолу по веригата. LVLM, включително MiniGPT,...
Разработването на големи езикови модели (LLM), изградени от трансформаторни модели само за декодери, изигра решаваща роля в трансформирането на домейна за обработка на естествен език (NLP), тъй като...
Компютърното зрение е една от най-вълнуващите и добре проучени области в рамките на AI общността днес и въпреки бързото подобряване на моделите на компютърното зрение,...
През последните няколко години дифузионните модели постигнаха огромен успех и признание за задачи за генериране на изображения и видео. Моделите за видео дифузия, по-специално, са...
Откриването на обекти е основно предизвикателство в индустрията за компютърно зрение с приложения в роботиката, разбирането на изображения, автономните превозни средства и разпознаването на изображения. В последните години,...
Технологията за генериране на изображения, задвижвана от AI, отбеляза забележителен растеж през последните няколко години, откакто моделите за дифузия на голям текст към изображение като DALL-E, GLIDE, Stable Diffusion,...
Появата на мултимодални големи езикови модели (MLLM) постави началото на нова ера на агенти за мобилни устройства, способни да разбират и взаимодействат със света...