Al llarg dels anys, la creació d'animacions de retrats realistes i expressius a partir d'imatges estàtiques i àudio ha trobat una varietat d'aplicacions, com ara jocs, mitjans digitals,...
Els avenços en els grans models de llenguatge han accelerat significativament el desenvolupament del processament del llenguatge natural, o PNL. La introducció del marc del transformador va resultar ser...
Durant les últimes sis dècades, els sistemes operatius han evolucionat progressivament, passant dels sistemes bàsics als sistemes operatius complexos i interactius que alimenten els dispositius actuals. Inicialment,...
Durant els últims anys, els models de difusió basats en l'ajustament han demostrat un progrés notable en una àmplia gamma de tasques de personalització i personalització d'imatges. No obstant això, malgrat el seu potencial,...
Els mètodes d'afinació o PeFT eficients en paràmetres busquen adaptar grans models de llenguatge mitjançant actualitzacions a un nombre reduït de pesos. Tanmateix, la majoria del treball d'interpretabilitat existent...
Els grans models de llenguatge i la IA generativa han demostrat un èxit sense precedents en una àmplia gamma de tasques de processament del llenguatge natural. Després de conquerir el camp de la PNL, el següent...
L'arribada dels models GPT, juntament amb altres models autoregressius o de grans llenguatges de RA, van desplegar una nova època en el camp de l'aprenentatge automàtic i...
Una imatge pot transmetre molt, però també es pot veure afectada per diversos problemes com ara el desenfocament del moviment, la boira, el soroll i el baix rang dinàmic...
Els avenços recents en els models de llenguatge de gran visió (LVLM) han demostrat que l'escalada d'aquests marcs augmenta significativament el rendiment en una varietat de tasques posteriors. LVLM, inclòs MiniGPT,...
El desenvolupament de grans models de llenguatge (LLM) construïts a partir de models de transformadors només de descodificador ha tingut un paper crucial en la transformació del domini del processament del llenguatge natural (NLP), ja que...
La visió per ordinador és un dels camps més interessants i més investigats dins de la comunitat d'IA actual, i malgrat la ràpida millora dels models de visió per ordinador,...
Durant els últims anys, els models de difusió han aconseguit un èxit i un reconeixement massius per a les tasques de generació d'imatges i vídeos. Els models de difusió de vídeo, en particular, han estat...
La detecció d'objectes ha estat un repte fonamental en la indústria de la visió per computador, amb aplicacions en robòtica, comprensió d'imatges, vehicles autònoms i reconeixement d'imatges. En els últims anys,...
La tecnologia de generació d'imatges impulsada per IA ha experimentat un creixement notable en els darrers anys, des de models de difusió de text a imatge gran com DALL-E, GLIDE, Stable Diffusion,...
L'adveniment dels models multimodals de grans llenguatges (MLLM) ha donat lloc a una nova era d'agents de dispositius mòbils, capaços d'entendre i interactuar amb el món...