кочан

Kunal Kejriwal, автор в Unite.AI

Свържете се с нас

Кунал Кейривал

„Инженер по професия, писател по душа“. Kunal е технически писател с дълбока любов и разбиране на AI и ML, посветен на опростяването на сложни концепции в тези области чрез своята ангажираща и информативна документация.

Изкуствен интелектПреди 5 дни
AniPortrait: Аудио управляван синтез на фотореалистична портретна анимация
През годините създаването на реалистични и изразителни портретни анимации от статични изображения и аудио е намерило редица приложения, включително игри, цифрови медии,...
Изкуствен интелектПреди 2 седмици
Mini-Gemini: Извличане на потенциала на мултимодални визуални езикови модели
Напредъкът в големите езикови модели значително ускори развитието на обработката на естествен език или NLP. Въвеждането на трансформаторната рамка се оказа...
Изкуствен интелектПреди 2 седмици
AIOS: Операционна система за LLM агенти
През последните шест десетилетия операционните системи се развиха прогресивно, преминавайки от основни системи към сложни и интерактивни операционни системи, които захранват днешните устройства. Първоначално...
Изкуствен интелектПреди 3 седмици
Instant-Style: Запазване на стила при генериране на текст към изображение
През последните няколко години дифузионните модели, базирани на настройка, демонстрираха забележителен напредък в широк набор от задачи за персонализиране и персонализиране на изображения. Въпреки потенциала си обаче,...
Изкуствен интелектПреди 3 седмици
LoReFT: Фина настройка на представянето за езикови модели
Параметрно ефективната фина настройка или методите на PeFT се стремят да адаптират големи езикови модели чрез актуализации към малък брой тегла. Въпреки това, по-голямата част от съществуващата интерпретируемост работи...
Изкуствен интелектПреди 4 седмици
POKELLMON: Агент за човешки паритет за битки с покемони с LLM
Големите езикови модели и Generative AI демонстрираха безпрецедентен успех при широк набор от задачи за обработка на естествен език. След покоряването на НЛП сферата, следващата...
Изкуствен интелектПреди 4 седмици
Визуално авторегресивно моделиране: Генериране на мащабируемо изображение чрез прогнозиране в следващ мащаб
Появата на GPT модели, заедно с други авторегресивни или AR големи езикови модели, откри нова епоха в областта на машинното обучение и...
Изкуствен интелектПреди 1 месец
InstructIR: Възстановяване на висококачествено изображение след човешки инструкции
Едно изображение може да предаде много, но също така може да бъде помрачено от различни проблеми като замъгляване на движението, мъгла, шум и нисък динамичен диапазон....
Изкуствен интелектПреди 1 месец
MoE-LLaVA: Смес от експерти за големи визуално-езични модели
Последните постижения в Large Vision Language Models (LVLM) показаха, че мащабирането на тези рамки значително повишава производителността при различни задачи надолу по веригата. LVLM, включително MiniGPT,...
Изкуствен интелектПреди 1 месец
BlackMamba: Смес от експерти за модели на състояние-пространство
Разработването на големи езикови модели (LLM), изградени от трансформаторни модели само за декодери, изигра решаваща роля в трансформирането на домейна за обработка на естествен език (NLP), тъй като...
Изкуствен интелектПреди 1 месец
DynamiCrafter: Анимиране на изображения с отворен домейн с Video Diffusion Priors
Компютърното зрение е една от най-вълнуващите и добре проучени области в рамките на AI общността днес и въпреки бързото подобряване на моделите на компютърното зрение,...
Изкуствен интелектПреди 2 месеца
AnimateLCM: Ускоряване на анимацията на персонализирани дифузионни модели
През последните няколко години дифузионните модели постигнаха огромен успех и признание за задачи за генериране на изображения и видео. Моделите за видео дифузия, по-специално, са...
Изкуствен интелектПреди 2 месеца
YOLO-World: Откриване на обекти с отворен речник в реално време
Откриването на обекти е основно предизвикателство в индустрията за компютърно зрение с приложения в роботиката, разбирането на изображения, автономните превозни средства и разпознаването на изображения. В последните години,...
Изкуствен интелектПреди 2 месеца
InstantID: Безпроблемно генериране със запазване на самоличността за секунди
Технологията за генериране на изображения, задвижвана от AI, отбеляза забележителен растеж през последните няколко години, откакто моделите за дифузия на голям текст към изображение като DALL-E, GLIDE, Stable Diffusion,...
Изкуствен интелектПреди 2 месеца
Мобилни агенти: Автономен мултимодален агент за мобилни устройства с визуално възприятие
Появата на мултимодални големи езикови модели (MLLM) постави началото на нова ера на агенти за мобилни устройства, способни да разбират и взаимодействат със света...

още постове

Page 1 на 512 3 4 5