Inteligență artificială
DeepMind Introduce Algoritmul JEST: Facilitând Antrenarea Modelului AI Mai Rapid, Mai Ieftin, Mai Ecologic

Inteligența artificială generativă face pași incredibili, transformând domenii precum medicina, educația, finanțele, arta, sportul etc. Acest progres provine în principal din capacitatea îmbunătățită a IA de a învăța din seturi de date mai mari și de a construi modele mai complexe cu miliarde de parametri. Deși aceste progrese au condus la descoperiri științifice semnificative, au creat noi oportunități de afaceri și au condus la creștere industrială, ele vin la un cost ridicat, în special în ceea ce privește impactul financiar și de mediu al antrenării acestor modele la scară largă. Algoritmii de învățare necesită o putere computațională semnificativă pentru a antrena modelele de IA generativă cu seturi de date mari, ceea ce duce la un consum ridicat de energie și la o amprentă carbonică notabilă.
În timp ce eforturile anterioare de a face IA generativă durabilă s-au concentrat pe îmbunătățirea eficienței hardware-ului pentru antrenarea IA și pe dezvoltarea unor modele mai mici cu mai puțini parametri, Google DeepMind a adoptat o abordare inovatoare, urmărind să îmbunătățească eficiența algoritmului de antrenare a IA generativă. Ei au inițiat un nou algoritm, JEST (Selectare Comună a Exemplului), care funcționează de 13 ori mai rapid și este de 10 ori mai eficient din punct de vedere energetic decât tehnicile actuale.
În acest articol, explorăm provocările antrenării IA și modul în care JEST abordează aceste probleme. De asemenea, considerăm implicațiile mai largi și direcțiile viitoare de cercetare pentru algoritmul JEST, imaginând impactul său potențial dincolo de îmbunătățirea vitezei, a eficienței costurilor și a sustenabilității de mediu în antrenarea IA.
Provocările Antrenării IA: Costuri Ridicate și Impact de Mediu
Antrenarea modelului de IA generativ prezintă provocări semnificative datorită costurilor ridicate și impactului substanțial de mediu.
- Costuri Financiare: Antrenarea modelului de IA generativ este o întreprindere costisitoare. Estimările recente indică faptul că antrenarea unui singur model mare, cum ar fi OpenAI’s GPT-3 cu 175 de miliarde de parametri, poate costa în jur de 4,6 milioane de dolari. Antrenarea ChatGPT-4 este estimată să fi costat OpenAI aproximativ 100 de milioane de dolari. Aceste cheltuieli sunt atribuite în mare măsură resurselor computaționale masive, prelucrării extinse a datelor și timpilor prelungiți de antrenare necesari.
- Consum de Energie: Procesele de antrenare a IA generativă sunt extrem de consumatoare de energie. Antrenarea acestor modele implică mii de GPU și consumă multiple gigawatt-ore de energie, făcând procesul extrem de intensiv din punct de vedere energetic. Centrele de date, care găzduiesc infrastructura de calcul pentru antrenarea IA, consumă aproximativ 200 de terawatt-ore (TWh) de electricitate anual, aproximativ 1% din cererea globală de electricitate. Un raport McKinsey prezice că consumul de energie al centrelor de date din SUA ar putea crește de la 17 gigawatti (GW) în 2017 la 35 GW până în 2030, necesitând o producție echivalentă cu nouă baraje Hoover pentru a satisface această cerere suplimentară.
- Amprentă Carbonică: Consumul ridicat de energie al antrenării modelului de IA generativ contribuie semnificativ la emisiile de gaze cu efect de seră, exacerbând schimbările climatice. Un studiu al Universității din Massachusetts Amherst a constatat că antrenarea unui model de IA mare poate emite atâtea gaze cu efect de seră cât cinci mașini pe durata vieții lor. În mod specific, antrenarea unui singur model de IA poate emite mai mult de 626.000 de kilograme de CO2, echivalent cu amprenta carbonică a 315 zboruri trans-Americane.
Aceste provocări provin în principal din două surse principale: dependența de hardware-ul consumator de energie și ineficiența algoritmilor de antrenare actuale. În timp ce comunitatea IA a făcut progrese în dezvoltarea de hardware eficient din punct de vedere energetic, trebuie să se pună mai mult accent pe crearea unor algoritmi mai inteligenți care să poată optimiza utilizarea datelor și să reducă timpul de antrenare. Algoritmul JEST recent introdus de Google este o cercetare inovatoare care vizează îmbunătățirea eficienței algoritmului de antrenare a IA generativă. Prin selectarea inteligentă a datelor care contează, JEST îmbunătățește semnificativ eficiența antrenării IA, deschizând calea pentru o antrenare mai durabilă și mai eficientă din punct de vedere al costurilor a modelului de IA generativ.
Înțelegerea Algoritmului JEST
JEST este un algoritm de învățare proiectat pentru a antrena modele de IA generativă multimodale mai eficient. Pentru a înțelege cum funcționează JEST, gândiți-vă la antrenarea IA ca la rezolvarea unei puzzle complexe, unde fiecare piesă (punct de date) ajută la construirea imaginii complete (model de IA). JEST acționează ca un puzzle solver experimentat, făcând procesul mai eficient. La fel cum un puzzle solver selectează piesele cele mai importante și distinctive, JEST identifică și selectează cele mai valoroase loturi de date din setul de date, asigurându-se că fiecare lot joacă un rol crucial în dezvoltarea IA.
JEST utilizează un model de IA mai mic pentru a evalua calitatea loturilor de date. Aceste loturi sunt apoi clasificate în funcție de eficacitatea lor în antrenarea modelului. Cu aceste loturi atent selectate, JEST asamblează strategic pentru a antrena modelul. La fel cum un puzzle solver aranjează piesele puzzle-ului pentru a maximiza eficiența și coerența, JEST accelerează semnificativ procesul de antrenare prin prioritizarea și selectarea loturilor cele mai informative.
O parte cheie a abordării JEST este învățarea contrastivă multimodală. Această tehnică se concentrează pe învățarea corespondenței dintre diferite tipuri de date, cum ar fi text și imagini. JEST utilizează o metodă bazată pe învățarea contrastivă multimodală pentru a evalua eficacitatea unui exemplu de date multimodale în antrenarea modelului. Pe lângă eficacitatea individuală a exemplarelor de date, JEST evaluează și învățarea colectivă a exemplarelor de date pentru a selecta un lot mic de date dintr-un “super lot” mai mare. Acest proces ajută JEST să selecteze și să prioritizeze loturile care oferă provocări și oportunități de învățare bogate.
Privind Înainte: JEST Dincolo de Antrenarea IA Mai Rapidă, Mai Ieftină, Mai Ecologică
Pe măsură ce explorăm implicațiile viitoare ale JEST (Selectare Comună a Exemplului), este evident că contribuțiile sale merg dincolo de simpla accelerare a antrenării IA, reducerea costurilor și promovarea sustenabilității de mediu. Aici, ne vom concentra asupra modului în care JEST poate continua să îmbunătățească și să transforme domeniul IA generativă:
- Îmbunătățirea Performanței și Preciziei Modelului: Abordarea inovatoare a JEST pentru selectarea și prioritizarea datelor conduce la timpuri de antrenare mai rapide și la o performanță îmbunătățită a modelului. Prin concentrarea asupra loturilor de date cele mai informative, JEST asigură că modelele de IA sunt antrenate pe intrări de înaltă calitate, îmbunătățindu-le precizia și robustețea. Acest avantaj este crucial în aplicații în care precizia și fiabilitatea sunt parametri importanți, cum ar fi diagnostice medicale, previziuni financiare și sisteme autonome.
- Identificarea și Mitigarea Prejudecăților în Date: IA este predispusă la seturi de date cu prejudecăți, unde anumite grupuri sau perspective sunt subreprezentate sau reprezentate incorect. Abordarea JEST pentru selectarea datelor implică evaluarea calității și a caracterului informativ al loturilor de date. Prin prioritizarea mostrelor de date diverse și reprezentative, JEST poate ajuta sistemele de IA să învețe dintr-un set de date mai echilibrat, reducând astfel prejudecățile din datele de antrenare. De exemplu, în aplicațiile de IA din domeniul sănătății, JEST poate selecta loturi de date care cuprind diverse factori demografici, asigurându-se că modelele de diagnostic medical sunt antrenate pe populații de pacienți diverse. Această selecție reduce riscul prejudecăților care ar putea afecta în mod disproporționat anumite grupuri pe baza rasei, sexului sau statutului socio-economic.
- Facilitarea Inovării și Cercetării: Prin reducerea semnificativă a resurselor computaționale și a timpului necesar pentru antrenarea modelului de IA, JEST reduce barierele de intrare pentru cercetători și inovatori. Această accesibilitate favorizează un ecosistem mai vibrant de dezvoltare a IA, unde echipele și organizațiile mai mici pot experimenta și implementa soluții de IA avansate. Mai mult, câștigurile de eficiență oferite de JEST eliberează resurse care pot fi redirecționate către explorarea de noi frontiere în IA, cum ar fi arhitecturi noi, algoritmi avansați și cadre etice pentru IA.
- Promovarea Dezvoltării IA Inclusive: Dezvoltarea IA ar trebui să implice perspective și intrări diverse pentru a aborda eficient prejudecățile și preocupările etice. Capacitatea JEST de a selecta date în funcție de valoarea lor informativă și reprezentativitate încurajează practicile incluzive în curarea setului de date. Dezvoltatorii de IA pot asigura că JEST abordează eficient prejudecățile și considerațiile etice prin implicarea unor echipe multidisciplinare în definirea criteriilor de selecție a datelor, incluzând experți în etică, științe sociale și domenii specifice. Această abordare colaborativă favorizează o dezvoltare mai incluzivă și responsabilă a tehnologiilor IA.
Concluzia
Introducerea algoritmului JEST de către DeepMind reprezintă un salt semnificativ înainte în antrenarea IA generativă. Prin accelerarea semnificativă a proceselor de antrenare și reducerea consumului de energie, JEST oferă economii de costuri substanțiale și abordează problemele de mediu legate de dezvoltarea IA. Dincolo de aceste avantaje, JEST are potențialul de a îmbunătăți precizia modelului, de a reduce prejudecățile din date, de a facilita inovarea și de a promova dezvoltarea IA incluzivă. Refinarea și aplicarea continuă a JEST sunt poziționate pentru a redefini viitorul IA, mergând către soluții de IA mai eficiente, mai durabile și mai etice.












