stub Suured tegevusmudelid (LAM): tehisintellektipõhise interaktsiooni järgmine piir – Unite.AI
Ühenda meile

Tehisintellekt

Suured tegevusmudelid (LAM): AI-põhise interaktsiooni järgmine piir

mm
Ajakohastatud on

Peaaegu aasta tagasi tegi DeepMindi kaasasutaja Mustafa Suleyman ennustada et ajastu generatiivne AI annaks peagi teed millelegi interaktiivsemale: süsteemidele, mis suudavad ülesandeid täita tarkvararakenduste ja inimressurssidega suheldes. Täna hakkame nägema, et see visioon kujuneb koos arenemisega Jänese AIuus AI-toega operatsioonisüsteem, R1. See süsteem on näidanud muljetavaldavat võimet jälgida ja jäljendada inimeste suhtlemist rakendustega. R1 keskmes on Suur tegevusmudel (LAM), täiustatud tehisintellekti assistent, kes mõistab kasutaja kavatsusi ja täidab nende nimel ülesandeid. Kuigi varem tuntud teiste terminite, näiteks Interaktiivne AI ja Suur agent mudel, on LAM-ide kontseptsioon AI-põhise interaktsiooni pöördelise uuendusena kogumas hoogu. See artikkel uurib LAM-ide üksikasju, kuidas need erinevad traditsioonilisest l-starge keelemudelid (LLM-id), tutvustab Rabbit AI R1 süsteemi ja vaatleb, kuidas Apple liigub LAM-i sarnase lähenemisviisi poole. Samuti arutatakse LAMide võimalikke kasutusviise ja nendega seotud väljakutseid.

Suurte tegevus- või agentuurimudelite (LAM) mõistmine

LAM on täiustatud AI agent, mis on loodud inimeste kavatsuste mõistmiseks ja konkreetsete eesmärkide elluviimiseks. Need mudelid on suurepärased inimeste vajaduste mõistmisel, keerukate ülesannete kavandamisel ja erinevate mudelite, rakenduste või inimestega suhtlemisel, et oma plaane ellu viia. LAM-id lähevad kaugemale lihtsatest tehisintellekti ülesannetest, nagu vastuste või piltide genereerimine; need on täisväärtuslikud süsteemid, mis on loodud tegelema keeruliste tegevustega, nagu reiside planeerimine, kohtumiste planeerimine ja e-kirjade haldamine. Näiteks reiside planeerimisel koordineerib LAM ilmaennustuste jaoks ilmarakendusega, suhtleb sobivate lendude leidmiseks lendude broneerimisteenustega ja suhtleb majutuse kindlustamiseks hotellide broneerimissüsteemidega. Erinevalt paljudest traditsioonilistest AI mudelitest, mis sõltuvad ainult närvivõrgud, LAM-id kasutavad hübriidset lähenemisviisi neuro-sümboolne programmeerimine. See integratsioon sümboolne programmeerimine aitab loogilisel mõtlemisel ja planeerimisel, samas kui närvivõrgud aitavad ära tunda keerulisi sensoorseid mustreid. See segu võimaldab LAM-idel käsitleda laia valikut ülesandeid, märkides neid tehisintellektil põhinevate interaktsioonide nüansirikka arenguna.

LAMide võrdlemine LLM-idega

Erinevalt LAM-idest on LLM-id AI-agendid, mis paistavad silma kasutajate viipade tõlgendamisel ja tekstipõhiste vastuste genereerimisel, abistades peamiselt keeletöötlust hõlmavate ülesannete puhul. Nende ulatus piirdub aga üldjuhul tekstiga seotud tegevustega. Teisest küljest laiendavad LAM-id AI võimalusi väljaspool keelt, võimaldades neil konkreetsete eesmärkide saavutamiseks teha keerulisi toiminguid. Näiteks kui LLM võib tõhusalt koostada e-kirja kasutaja juhiste põhjal, läheb LAM kaugemale, mitte ainult koostades, vaid ka mõista konteksti, otsustades sobiva vastuse ja haldades meili kohaletoimetamist.

Lisaks on LLM-id tavaliselt ette nähtud tekstijada järgmise märgi ennustamiseks ja kirjalike juhiste täitmiseks. Seevastu LAM-id pole varustatud mitte ainult keele mõistmisega, vaid ka võimega suhelda erinevate rakenduste ja reaalsete süsteemidega, näiteks asjade Interneti-seadmetega. Nad saavad teha füüsilisi toiminguid, juhtida seadmeid ja hallata ülesandeid, mis nõuavad suhtlemist väliskeskkonnaga, nagu kohtumiste broneerimine või broneeringute tegemine. See keeleoskuse integreerimine praktilise teostusega võimaldab LAM-idel töötada mitmekesisemate stsenaariumide puhul kui LLM-id.

LAM-id tegevuses: Jänes R1

. Jänes R1 on praktilises kasutuses LAM-ide peamine näide. See AI-toega seade suudab hallata mitut rakendust ühe kasutajasõbraliku liidese kaudu. 2.88-tollise puuteekraani, pöörleva kaamera ja kerimisrattaga varustatud R1 paikneb klanitud ümaras šassiis, mis on valminud koostöös ettevõttega Teenage Engineering. See töötab 2.3 GHz MediaTeki protsessoriga, mida toetab 4 GB mälu ja 128 GB salvestusruumi.

R1 keskmes on selle LAM, mis jälgib nutikalt rakenduste funktsioone ja lihtsustab keerulisi ülesandeid, nagu muusika juhtimine, transpordi broneerimine, toidukaupade tellimine ja sõnumite saatmine – kõike seda ühest suhtluspunktist. Nii välistab R1 nende ülesannete täitmiseks mitme rakenduse või mitme sisselogimise vahel lülitumise.

R1 LAM-i koolitati algselt, jälgides inimeste suhtlemist populaarsete rakendustega, nagu Spotify ja Uber. See koolitus on võimaldanud LAM-il kasutajaliidestes navigeerida, ikoone ära tunda ja tehinguid töödelda. See ulatuslik koolitus võimaldab R1-l kohaneda sujuvalt peaaegu iga rakendusega. Lisaks võimaldab spetsiaalne treeningrežiim kasutajatel uusi ülesandeid tutvustada ja automatiseerida, laiendades pidevalt R1 võimaluste valikut ja muutes selle dünaamiliseks tööriistaks tehisintellektil põhinevate interaktsioonide valdkonnas.

Apple'i edusammud Siri LAM-inspireeritud võimaluste suunas

Apple'i tehisintellekti uurimisrühm on hiljuti jaganud teadmisi oma jõupingutustest Siri võimete edendamiseks uue algatuse kaudu, mis sarnaneb LAM-ide omadega. Algatus, mis on välja toodud uurimistöös teemal Viide eraldusvõime kui keele modelleerimine (ReALM) eesmärk on parandada Siri võimet mõista vestluskonteksti, töödelda ekraanil kuvatavat visuaalset sisu ja tuvastada ümbritsevaid tegevusi. ReALM-i lähenemisviis kasutajaliidese (UI) sisendite käsitlemisel tõmbab paralleele Rabbit AI R1-s täheldatud funktsioonidega, näidates Apple'i kavatsust parandada Siri arusaamist kasutaja interaktsioonidest.

See areng näitab et Apple kaalub LAM-tehnoloogiate kasutuselevõttu, et täpsustada, kuidas kasutajad oma seadmetega suhtlevad. Kuigi ReALM-i kasutuselevõtu kohta pole selgesõnalisi teateid, viitab potentsiaal Siri ja rakendustega suhtlemise märkimisväärselt täiustamisele paljutõotavatele edusammudele assistendi intuitiivsemaks ja reageerimisvõimelisemaks muutmisel.

LAM-ide võimalikud rakendused

LAM-idel on potentsiaal laiendada oma mõju palju kaugemale kui kasutajate ja seadmete vahelise suhtluse tõhustamine; need võivad pakkuda märkimisväärset kasu mitmes tööstusharus.   

  • Klienditeenindus: LAM-id võivad parandada klienditeenindust, käsitledes iseseisvalt päringuid ja kaebusi erinevates kanalites. Need mudelid saavad töödelda päringuid loomulikus keeles, automatiseerida lahendusi ja hallata ajakava, pakkudes kliendi ajalool põhinevat isikupärastatud teenust, et parandada rahulolu.
  • Tervishoid: Tervishoius saavad LAM-id aidata patsiendihooldust hallata, korraldades kohtumisi, haldades retsepte ja hõlbustades teenustevahelist suhtlust. Need on kasulikud ka kaugseireks, meditsiiniliste andmete tõlgendamiseks ja personali hoiatamiseks hädaolukordades, eriti kasulikud krooniliste ja eakate hoolduse korral.
  • Rahandus: LAM-id võivad pakkuda isikupärastatud finantsnõustamist ja hallata selliseid ülesandeid nagu portfelli tasakaalustamine ja investeerimissoovitused. Samuti saavad nad jälgida tehinguid, et tuvastada ja ära hoida pettusi, integreerudes sujuvalt pangasüsteemidega, et kahtlaste tegevustega kiiresti toime tulla.

LAM-ide väljakutsed

Vaatamata oma märkimisväärsele potentsiaalile seisavad LAM-id silmitsi mitmete väljakutsetega, mis vajavad lahendamist.

  • Andmete privaatsus ja turvalisus: Arvestades laialdast juurdepääsu isiklikule ja tundlikule teabele, mida LAM-id peavad toimima, on andmete privaatsuse ja turvalisuse tagamine suur väljakutse. LAM-id suhtlevad isikuandmetega mitmel rakendusel ja platvormil, tekitades muret selle teabe turvalise käsitlemise, salvestamise ja töötlemise pärast.
  • Eetilised ja regulatiivsed probleemid: Kuna LAM-id võtavad otsuste tegemisel ja inimkeskkonnaga suhtlemisel autonoomsemaid rolle, muutuvad eetilised kaalutlused üha olulisemaks. Kriitilised on küsimused vastutuse, läbipaistvuse ja masinatele delegeeritud otsuste tegemise ulatuse kohta. Lisaks võib selliste arenenud tehisintellektisüsteemide juurutamisel erinevates tööstusharudes esineda regulatiivseid probleeme.
  • Integreerimise keerukus: LAM-id nõuavad ülesannete tõhusaks täitmiseks integreerimist mitmesuguste tarkvara- ja riistvarasüsteemidega. See integreerimine on keeruline ja selle haldamine võib olla keeruline, eriti kui koordineerida tegevusi erinevatel platvormidel ja teenustes, nagu lendude, majutuste ja muude logistiliste üksikasjade broneerimine reaalajas.
  • Skaleeritavus ja kohandatavus: Kuigi LAM-id on loodud kohanema paljude stsenaariumide ja rakendustega, on nende lahenduste skaleerimine mitmekesiste reaalkeskkondade järjepidevaks ja tõhusaks käsitlemiseks endiselt väljakutse. Nende pikaajalise edu jaoks on ülioluline tagada, et LAM-id suudavad kohaneda muutuvate tingimustega ja säilitada jõudlust erinevate ülesannete ja kasutajate vajaduste puhul.

Loosung

Suured tegevusmudelid (LAM) on AI-s kujunemas olulise uuendusena, mis ei mõjuta mitte ainult seadmete koostoimeid, vaid ka laiemaid tööstusrakendusi. LAM-id, mida demonstreerib Rabbit AI R1 ja mida on uuritud Apple'i edusammudes Siri abil, loovad aluse interaktiivsematele ja intuitiivsematele AI-süsteemidele. Need mudelid on valmis suurendama tõhusust ja isikupärastamist sellistes sektorites nagu klienditeenindus, tervishoid ja rahandus.

LAM-ide kasutuselevõtuga kaasnevad aga väljakutsed, sealhulgas andmekaitseprobleemid, eetilised probleemid, integreerimise keerukus ja mastaapsus. Nende probleemidega tegelemine on oluline, kui liigume LAM-tehnoloogiate laialdasema kasutuselevõtu suunas, eesmärgiga kasutada nende võimeid vastutustundlikult ja tõhusalt. Kuna LAM-id arenevad edasi, on nende potentsiaal digitaalse suhtluse muutmisel endiselt märkimisväärne, rõhutades nende tähtsust tulevasel tehisintellekti maastikul.

Dr Tehseen Zia on Islamabadi COMSATSi ülikooli dotsent, kellel on doktorikraad tehisintellektis Viini Tehnikaülikoolis Austrias. Spetsialiseerudes tehisintellektile, masinõppele, andmeteadusele ja arvutinägemisele, on ta andnud märkimisväärse panuse mainekates teadusajakirjades avaldatud publikatsioonidega. Dr Tehseen on juhtinud ka erinevaid tööstusprojekte juhtivteadlasena ja töötanud tehisintellekti konsultandina.