Олон жилийн туршид хөдөлгөөнгүй дүрс, аудио зэргээс бодит бөгөөд илэрхийлэлтэй хөрөг зургийн хөдөлгөөнт дүрсийг бүтээх нь тоглоом, дижитал медиа,...
Хэлний том загваруудын дэвшил нь байгалийн хэл боловсруулах буюу NLP-ийн хөгжлийг ихээхэн хурдасгасан. Трансформаторын хүрээг нэвтрүүлэх нь батлагдсан ...
Сүүлийн 60 жилийн хугацаанд үйлдлийн системүүд аажмаар хөгжиж, үндсэн системээс өнөөгийн төхөөрөмжүүдийг тэжээдэг цогц, интерактив үйлдлийн системд шилжсэн. Эхэндээ,...
Сүүлийн хэдэн жилийн хугацаанд тааруулахад суурилсан тархалтын загварууд нь дүрсийг тохируулах, тохируулах олон төрлийн ажлуудад гайхалтай ахиц дэвшлийг харуулсан. Гэсэн хэдий ч тэдний боломжоос үл хамааран ...
Параметрийн үр ашигтай нарийн тааруулах буюу PeFT аргууд нь цөөн тооны жинд шинэчлэлт хийх замаар том хэлний загваруудыг тохируулахыг эрэлхийлдэг. Гэсэн хэдий ч одоо байгаа орчуулгын ихэнх нь ...
Томоохон хэлний загварууд болон хиймэл хиймэл оюун ухаан нь байгалийн хэл боловсруулах өргөн хүрээний ажлуудад урьд өмнө хэзээ ч байгаагүй амжилтыг харуулсан. NLP талбарыг байлдан дагуулсны дараа дараагийн...
GPT загварууд болон бусад авторегресс буюу AR том хэлний загварууд гарч ирснээр машин сургалтын салбарт шинэ эрин үеийг эхлүүлсэн бөгөөд...
Зураг нь маш их зүйлийг илэрхийлж чаддаг ч хөдөлгөөнийг бүдгэрүүлэх, мананцар, чимээ шуугиан, динамик хүрээ багатай гэх мэт янз бүрийн асуудлуудаар бүдгэрч болно....
Large Vision Language Models (LVLMs)-ийн сүүлийн үеийн дэвшилтүүд нь эдгээр хүрээг өргөтгөх нь янз бүрийн даалгавруудын гүйцэтгэлийг ихээхэн нэмэгдүүлдэг болохыг харуулж байна. LVLMs, үүнд MiniGPT,...
Зөвхөн декодчилогчтой трансформаторын загваруудаас бүтээгдсэн Том хэлний загваруудыг (LLMs) хөгжүүлэх нь Байгалийн хэлний боловсруулалтын (NLP) домэйнийг өөрчлөхөд чухал үүрэг гүйцэтгэсэн.
Компьютерийн хараа нь өнөөдөр хиймэл оюун ухааны нийгэмлэгийн хамгийн сэтгэл хөдөлгөм, сайн судлагдсан салбаруудын нэг бөгөөд компьютерийн харааны загварууд хурдацтай сайжирч байгаа хэдий ч...
Сүүлийн хэдэн жилийн хугацаанд тархалтын загварууд зураг, видео үүсгэх ажилд асар их амжилтанд хүрч, хүлээн зөвшөөрөгдсөн. Видео тархалтын загварууд, ялангуяа...
Обьект илрүүлэх нь робот техник, дүрсийг ойлгох, бие даасан тээврийн хэрэгсэл, дүрс таних зэрэгт хэрэглэгдэхүүн бүхий компьютерийн харааны салбарын үндсэн сорилт байсаар ирсэн. Сүүлийн жилүүдэд,...
DALL-E, GLIDE, Stable Diffusion,...
Multimodal Large Language Models (MLLM) гарч ирснээр дэлхий ертөнцтэй ойлголцож, харилцах чадвартай хөдөлгөөнт төхөөрөмжийн агентуудын шинэ эрин үеийг эхлүүллээ...