stub AI mokosi iš AI: socialinio mokymosi atsiradimas tarp didelių kalbų modelių – Unite.AI
Susisiekti su mumis

Dirbtinis intelektas

AI mokosi iš AI: socialinio mokymosi atsiradimas tarp didelių kalbų modelių

mm
Atnaujinta on

Nuo OpenAI pristatymo ChatGPT3.5 2022 m. pabaigoje – pagrindinio vaidmens didelių kalbų modeliai (LLM) tampa vis ryškesnis dirbtinio intelekto (AI) srityje, ypač natūralus kalbos apdorojimas (NLP). Šios LLM, skirtos apdoroti ir generuoti į žmogų panašų tekstą, mokosi iš daugybės tekstų internete, pradedant knygomis ir baigiant svetainėmis. Šis mokymosi procesas leidžia jiems suvokti žmonių kalbos esmę, todėl LLM atrodo kaip bendrosios paskirties problemų sprendėjai.

Nors LLM kūrimas atvėrė naujas duris, šių modelių pritaikymo konkrečioms reikmėms metodas, žinomas kaip tikslus derinimas– kelia savo iššūkių. Norint tiksliai sureguliuoti modelį, reikia papildomų mokymų, susijusių su tikslesniais duomenų rinkiniais, todėl gali kilti sunkumų, pvz., reikalavimas pateikti pažymėtus duomenis, modelio dreifas ir perteklinisir didelių išteklių poreikį.

Spręsdami šiuos iššūkius, „Google“ mokslininkai neseniai priėmė idėją „ssocialinis mokymasis“, kad padėtų AI mokytis iš AI. Pagrindinė idėja yra ta, kad kai LLM paverčiami pokalbių robotais, jie gali bendrauti ir mokytis vieni iš kitų panašiai kaip žmogaus socialinis mokymasis. Ši sąveika leidžia jiems mokytis vieniems iš kitų ir taip pagerinti savo efektyvumą.

Kas yra socialinis mokymasis?

Socialinis mokymasis nėra nauja idėja. Jis pagrįstas 1970-ųjų teorija Albertas bandura, o tai rodo, kad žmonės mokosi stebėdami kitus. Ši AI taikoma koncepcija reiškia, kad dirbtinio intelekto sistemos gali tobulėti sąveikaudamos viena su kita, mokydamosi ne tik iš tiesioginės patirties, bet ir iš bendraamžių veiksmų. Šis metodas žada greitesnį įgūdžių įgijimą ir netgi gali leisti AI sistemoms plėtoti savo „kultūrą“ dalijantis žiniomis.

Skirtingai nuo kitų AI mokymosi metodų, pvz., bandymų ir klaidų stiprinimas or imitacinis mokymasis iš tiesioginių pavyzdžių socialinis mokymasis akcentuoja mokymąsi per sąveiką. Tai yra praktiškesnis ir bendruomeniškesnis būdas AI įgyti naujų įgūdžių.

Socialinis mokymasis LLM

Svarbus socialinio mokymosi aspektas yra keistis žiniomis nesidalijant originalia ir jautria informacija. Kaip tokia, Mokslininkai naudojo mokytojo ir mokinio dinamiką, kai mokytojų modeliai palengvina studentų modelių mokymosi procesą, neatskleidžiant jokių konfidencialios informacijos. Siekiant šio tikslo, mokytojų modeliai sukuria sintetinius pavyzdžius arba kryptis, iš kurių studentų modeliai gali mokytis nesidalydami faktiniais duomenimis. Pavyzdžiui, apsvarstykite mokytojo modelį, išmokytą atskirti šlamšto ir ne šlamšto tekstinius pranešimus, naudojant vartotojų pažymėtus duomenis. Jei norime, kad kitas modelis atliktų šią užduotį neliečiant originalių, privačių duomenų, įsijungia socialinis mokymasis. Mokytojo modelis sukurtų sintetinius pavyzdžius arba pateiktų įžvalgas, pagrįstas savo žiniomis, kad studento modelis galėtų tiksliai identifikuoti nepageidaujamo el. pašto pranešimus be tiesioginio jautrių duomenų poveikio. Ši strategija ne tik padidina mokymosi efektyvumą, bet ir parodo LLM potencialą mokytis dinamiškais, prisitaikančiais būdais, potencialiai kuriant kolektyvinę žinių kultūrą. Svarbus šio požiūrio bruožas yra jo pasikliovimas sintetiniais pavyzdžiais ir parengtomis instrukcijomis. Kurdami naujus, informatyvius pavyzdžius, kurie skiriasi nuo pradinio duomenų rinkinio, mokytojų modeliai gali išsaugoti privatumą ir nukreipti mokinių modelius į efektyvų mokymąsi. Šis metodas buvo veiksmingas, o rezultatai buvo lygiaverčiai tiems, kurie buvo gauti naudojant faktinius duomenis.

Kaip socialinis mokymasis sprendžia koregavimo iššūkius?

Socialinis mokymasis siūlo naują būdą tobulinti LLM konkrečioms užduotims atlikti. Tai padeda susidoroti su tikslaus derinimo iššūkiais šiais būdais:

  1. Mažiau reikia žymėtų duomenų: Mokydamiesi iš sintetinių pavyzdžių, kuriais dalijasi modeliai, socialinis mokymasis sumažina priklausomybę nuo sunkiai gaunamų paženklintų duomenų.
  2. Vengti per didelės specializacijos: Tai užtikrina, kad modeliai būtų universalūs, nes juose pateikiama daugiau pavyzdžių nei mažuose, specifiniuose duomenų rinkiniuose.
  3. Perdozavimo mažinimas: Socialinis mokymasis praplečia mokymosi patirtį, padeda modeliams geriau apibendrinti ir išvengti pernelyg didelio pritaikymo.
  4. Išteklių taupymas: Šis metodas leidžia efektyviau naudoti išteklius, nes modeliai mokosi vieni iš kitų patirties ir jiems nereikia tiesioginės prieigos prie didelių duomenų rinkinių.

Būsimos kryptys

Socialinio mokymosi potencialas LLM siūlo įvairius įdomius ir prasmingus būdus būsimiems AI tyrimams:

  1. Hibridinės AI kultūros: Kadangi LLM dalyvauja socialiniame mokymesi, jie gali pradėti formuoti bendras metodikas. Galima būtų atlikti tyrimus, siekiant ištirti šių besiformuojančių AI „kultūrų“ poveikį, tiriant jų įtaką žmonių sąveikai ir susijusioms etinėms problemoms.
  2. Kryžminis mokymasis: Išplėtus socialinį mokymąsi ne tik į tekstą, bet ir įtraukiant vaizdus, ​​garsus ir dar daugiau, dirbtinio intelekto sistemos gali geriau suprasti pasaulį, panašiai kaip žmonės mokosi per kelis pojūčius.
  3. Decentralizuotas mokymasis: Idėja, kad dirbtinio intelekto modeliai mokosi vieni iš kitų decentralizuotame tinkle, yra naujas būdas išplėsti dalijimąsi žiniomis. Tam reikėtų spręsti didelius koordinavimo, privatumo ir saugumo iššūkius.
  4. Žmogaus ir AI sąveika: Yra galimybių ištirti, kaip žmonės ir dirbtinis intelektas gali gauti abipusės naudos iš socialinio mokymosi, ypač švietimo ir bendradarbiavimo aplinkoje. Tai galėtų iš naujo apibrėžti, kaip vyksta žinių perdavimas ir naujovės.
  5. Etiškas AI vystymas: AI mokymas spręsti etines dilemas per socialinį mokymąsi galėtų būti žingsnis atsakingesnio AI link. Pagrindinis dėmesys būtų skiriamas dirbtinio intelekto sistemų, galinčių mąstyti etiškai ir derintis su visuomenės vertybėmis, kūrimui.
  6. Save tobulėjančios sistemos: ekosistema, kurioje dirbtinio intelekto modeliai nuolat mokosi ir tobulėja vieni iš kitų patirties, galėtų paspartinti dirbtinio intelekto naujoves. Tai rodo ateitį, kurioje AI gali savarankiškiau prisitaikyti prie naujų iššūkių.
  7. Privatumas mokantis: Kai dirbtinio intelekto modeliai dalijasi žiniomis, labai svarbu užtikrinti pagrindinių duomenų privatumą. Ateities pastangos gali ieškoti sudėtingesnių metodų, leidžiančių perduoti žinias nepažeidžiant duomenų saugumo.

Bottom Line

„Google“ mokslininkai sukūrė naujovišką metodą, vadinamą socialiniu mokymusi tarp didelių kalbų modelių (LLM), įkvėpto žmogaus gebėjimo mokytis stebint kitus. Ši sistema leidžia LLM dalytis žiniomis ir tobulinti galimybes nepasiekiant ar neatskleidžiant jautrių duomenų. Kurdami sintetinius pavyzdžius ir instrukcijas, LLM gali efektyviai mokytis, spręsdami pagrindinius DI kūrimo iššūkius, tokius kaip pažymėtų duomenų poreikis, per didelė specializacija, perteklinis pritaikymas ir išteklių naudojimas. Socialinis mokymasis ne tik padidina dirbtinio intelekto efektyvumą ir gebėjimą prisitaikyti, bet ir atveria AI galimybes plėtoti bendras „kultūras“, įsitraukti į įvairiarūšį mokymąsi, dalyvauti decentralizuotuose tinkluose, bendrauti su žmonėmis naujais būdais, spręsti etines dilemas ir užtikrinti privatumą. Tai žymi reikšmingą posūkį link labiau bendradarbiaujančių, universalesnių ir etiškesnių AI sistemų, žadančių iš naujo apibrėžti dirbtinio intelekto tyrimų ir taikymo sritį.

Dr. Tehseen Zia yra Islamabado COMSATS universiteto docentas, Vienos technologijos universitete, Austrijoje, turintis dirbtinio intelekto mokslų daktaro laipsnį. Specializuojasi dirbtinio intelekto, mašininio mokymosi, duomenų mokslo ir kompiuterinės vizijos srityse, jis daug prisidėjo publikuodamas patikimuose mokslo žurnaluose. Dr. Tehseen taip pat vadovavo įvairiems pramonės projektams kaip pagrindinis tyrėjas ir dirbo dirbtinio intelekto konsultantu.