Conectează-te cu noi

Unite.AI

Kunal Kejriwal

„Un inginer de profesie, un scriitor pe de rost”. Kunal este un scriitor tehnic cu o dragoste și o înțelegere profundă a AI și ML, dedicat simplificării conceptelor complexe din aceste domenii prin documentația sa captivantă și informativă.

Inteligența artificială în urmă 11 luni

SHOW-O: Un singur transformator care unește înțelegerea și generarea multimodală

Progresele semnificative în modelele lingvistice mari (LLM) au inspirat dezvoltarea modelelor lingvistice mari multimodale (MLLM). Eforturile timpurii de MLLM, cum ar fi LLaVA, MiniGPT-4 și InstructBLIP,...
Inteligența artificială 1 ani în urmă

EAGLE: Explorarea spațiului de proiectare pentru modele de limbă mari multimodale cu un amestec de codificatoare

Capacitatea de a interpreta cu acuratețe informații vizuale complexe este un obiectiv crucial al modelelor de limbaj mari multimodale (MLLM). Lucrările recente arată că percepția vizuală îmbunătățită semnificativ...
Inteligența artificială 1 ani în urmă

Sapiens: Foundation for Human Vision Models

Succesul remarcabil al pregătirii preliminare la scară largă, urmat de reglarea fină specifică sarcinii pentru modelarea limbajului, a stabilit această abordare ca o practică standard. În mod similar, metodele de viziune computerizată sunt...
Inteligența artificială 1 ani în urmă

LongWriter: Dezlănțuirea a peste 10,000 de generații de cuvinte din LLM-uri cu context lung

Modelele de limbaj mari (LLM) actuale cu context lung pot procesa intrări de până la 100,000 de jetoane, dar se luptă să genereze rezultate care depășesc chiar și o lungime modestă de 2,000...
Inteligența artificială 1 ani în urmă

SGLang: Execuție eficientă a programelor model de limbaj structurat

Modelele de limbaj mari (LLM) sunt din ce în ce mai utilizate pentru sarcini complexe care necesită apeluri cu generații multiple, tehnici avansate de solicitare, flux de control și intrări/ieșiri structurate. Cu toate acestea, sisteme eficiente pentru...
Inteligența artificială 1 ani în urmă

MINT-1T: Scalare de 10 ori a datelor multimodale open-source

Formarea modelelor multimodale mari (LMM) de frontieră necesită seturi de date la scară mare cu secvențe intercalate de imagini și text în formă liberă. Deși LMM-urile open-source au evoluat rapid, există...
Inteligența artificială 1 ani în urmă

DIAMOND: Detaliile vizuale contează în Atari și Diffusion pentru World Modeling

A fost în 2018, când a fost introdusă pentru prima dată ideea de învățare prin consolidare în contextul unui model mondial de rețea neuronală și, în curând, acest fundamental...
Inteligența artificială 1 ani în urmă

In-Paint3D: Generare de imagini folosind modele Lightning Less Diffusion

Apariția modelelor AI generative profunde a accelerat semnificativ dezvoltarea AI cu capacități remarcabile în generarea limbajului natural, generarea 3D, generarea de imagini și...
Inteligența artificială 1 ani în urmă

MARKLLM: Un set de instrumente open-source pentru filigranarea LLM

Filigranul LLM, care integrează semnale imperceptibile, dar detectabile în ieșirile modelului pentru a identifica textul generat de LLM, este vital pentru prevenirea utilizării greșite a limbajului mare...
Inteligența artificială 1 ani în urmă

MoRA: Actualizare de rang înalt pentru o reglare fină eficientă în funcție de parametri

Datorită performanței sale robuste și aplicabilității largi în comparație cu alte metode, LoRA sau Low-Rank Adaption este una dintre cele mai populare PEFT sau Parameter...
Inteligența artificială 1 ani în urmă

LightAutoML: Soluție AutoML pentru un ecosistem mare de servicii financiare

Deși AutoML a crescut la popularitate în urmă cu câțiva ani, primele lucrări despre AutoML datează de la începutul anilor 90, când oamenii de știință au publicat primele lucrări...
Inteligența artificială 1 ani în urmă

LLaVA-UHD: un LMM care percepe orice raport de aspect și imagini de înaltă rezoluție

Progresul și progresul recent al modelelor de limbaj mari au înregistrat o creștere semnificativă a capacităților de raționament, înțelegere și interacțiune viziune-limbaj. Cadrele moderne realizează acest lucru prin...
Inteligența artificială 1 ani în urmă

Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of Experts

Progresele recente în arhitectura și performanța modelelor de limbaj mari multimodale sau MLLM-urilor au evidențiat importanța datelor și modelelor scalabile pentru a îmbunătăți...
Inteligența artificială 1 ani în urmă

MambaOut: Avem cu adevărat nevoie de Mamba pentru Vision?

În cadrele moderne de învățare automată și inteligență artificială, transformatoarele sunt una dintre cele mai utilizate componente în diferite domenii, inclusiv seria GPT și BERT în...
Inteligența artificială 1 ani în urmă

CameraCtrl: Activarea controlului camerei pentru generarea text-to-video

Cadrele recente care încearcă să genereze text în video sau T2V folosesc modele de difuzare pentru a adăuga stabilitate procesului lor de antrenament, iar modelul de difuzare video, unul...

Mai multe posturi

Pagina 1 din 612 3 4 5 6