Connect with us

Revoluționarea IA cu ReALM de la Apple: Viitorul asistenților inteligenți

Inteligență artificială

Revoluționarea IA cu ReALM de la Apple: Viitorul asistenților inteligenți

mm
Apple’s New ReALM AI Model

În peisajul în continuă evoluție al inteligenței artificiale, Apple a fost în mod discret o pionieră a unei abordări revoluționare care ar putea redesena modul în care interacționăm cu iPhone-urile noastre. ReALM, sau Rezolvarea Referințelor ca Modelare a Limbajului, este un model de IA care promite să aducă un nou nivel de conștientizare contextuală și asistență fără întrerupere.

Pe măsură ce lumea tehnologiei vibrează de entuziasm cu privire la OpenAI’s GPT-4 și la alte modele de limbaj mari (LLM), ReALM de la Apple reprezintă o schimbare de gândire – o mișcare de la a se baza în întregime pe IA bazată pe cloud la o abordare mai personalizată, pe dispozitiv.

La inima lui ReALM se află capacitatea de a rezolva referințe – acele pronume ambigue precum “el“, “ei” sau “aceea” pe care oamenii le navighează cu ușurință datorită semnalelor contextuale.

Imaginați-vă o scenariu în care îi cereți lui Siri să “găsească o rețetă sănătoasă pe baza a ceea ce este în frigider, dar să omoare ciupercile – le urăsc.” Cu ReALM, iPhone-ul dvs. nu numai că ar înțelege referințele la informațiile de pe ecran (conținutul frigiderului), dar ar și aminti preferințele dvs. personale (urăște ciupercile) și contextul mai larg al găsirii unei rețete adaptate la aceste parametri.

Acest nivel de conștientizare contextuală este un salt cuantic față de abordarea de potrivire a cuvintelor cheie a asistenților de IA actuali.

Domeniul Conversațional: Amintindu-ți Ce A Fost Înainte

IA conversațională, ReALM abordează o provocare de lungă durată: menținerea coerenței și a memoriei de-a lungul mai multor runde de dialog.

Imaginați-vă cerând lui Siri să “vă amintească să rezervați bilete pentru vacanța mea când primesc salariul vineri.” Cu ReALM, Siri nu numai că ar înțelege contextul planurilor dvs. de vacanță (posibil extras dintr-o conversație anterioară sau informații de pe ecran), dar ar și avea conștientizarea de a conecta “primirea salariului” la rutina dvs. obișnuită de plată a salariului.

Domeniul De Pe Ecran: Dându-i Asistentului Dvs. Ochii

Poate cel mai revoluționar aspect al lui ReALM se află în capacitatea sa de a rezolva referințe la entități de pe ecran – un pas crucial către crearea unei experiențe de utilizator cu voce, fără mâini, în întregime.

Articolul de cercetare al Apple discută o tehnică inovatoare pentru codificarea informațiilor vizuale de pe ecranul dispozitivului dvs. într-un format pe care modelele de limbaj mari (LLM) îl pot procesa.

Considerați un scenariu în care sunteți în fața unei liste de restaurante și îi cereți lui Siri “să-mi dea indicații către cel de pe strada Main.” Cu ReALM, iPhone-ul dvs. nu numai că ar înțelege referința la o locație specifică, dar ar și lega-o de entitatea relevantă de pe ecran – lista restaurantului care corespunde descrierii.

Domeniul Din Fundal

Depășind contextele conversaționale și de pe ecran, ReALM explorează, de asemenea, capacitatea de a rezolva referințe la entități din fundal – acele evenimente periferice și procese care adesea rămân neobservate de asistenții noștri de IA actuali.

Imaginați-vă o scenariu în care îi cereți lui Siri “să redea acea melodie care se auzea la supermarket mai devreme.” Cu ReALM, iPhone-ul dvs. ar putea captura și identifica fragmente de audio ambient, permițând lui Siri să redea fără întrerupere piesa pe care ați avut-o în minte.

Promisiunea IA Pe Dispozitiv: Confidențialitate și Personalizare

În timp ce capacitățile lui ReALM sunt, fără îndoială, impresionante, poate cea mai semnificativă avantajoasă a sa se află în angajamentul de lungă durată al Apple față de IA pe dispozitiv și confidențialitatea utilizatorului.

Spre deosebire de modelele de IA bazate pe cloud care se bazează pe trimiterea datelor utilizatorului către servere remote pentru procesare, ReALM este proiectat să funcționeze în întregime pe iPhone-ul sau pe alt dispozitiv Apple.

Acest lucru nu numai că abordează îngrijorările cu privire la confidențialitatea datelor, dar deschide și noi posibilități pentru asistența IA care să înțeleagă și să se adapteze cu adevărat la dvs. ca individ.

  1. Codificarea Entităților De Pe Ecran: Articolul explorează mai multe strategii pentru a codifica elementele de pe ecran într-un format textual care poate fi procesat de un model de limbaj mare (LLM).

Abordarea finală adoptată de cercetători este de a parsa ecranul în ordine de sus în jos, stânga-dreapta, reprezentând layout-ul într-un format textual.

Considerațiile Etice

Desigur, o astfel de personalizare și conștientizare contextuală vine la pachet cu o serie de considerații etice cu privire la confidențialitate, transparență și potențialul ca sistemele de IA să influențeze sau chiar să manipuleze comportamentul utilizatorului.

Cercetătorii Apple sunt conștienți de această tensiune, recunoscând în articolul lor nevoia de a găsi un echilibru atent între furnizarea unei experiențe de IA personalizate și respectarea confidențialității și agenției utilizatorului.

Spre O Experiență De IA Mai Inteligentă și Mai Naturală

Pe măsură ce Apple continuă să împingă limitele IA pe dispozitiv cu modele precum ReALM, promisiunea unui asistent digital cu adevărat inteligent și conștient de context pare mai aproape ca niciodată.

Imaginați-vă o lume în care Siri (sau oricum ar putea fi numit acest asistent de IA în viitor) pare mai puțin o voce detașată din cloud și mai mult o extensie a propriilor procese de gândire – un partener care nu numai că înțelege cuvintele dvs., dar și tapiseria bogată a vieții dvs. digitale, a rutinelor zilnice și a preferințelor și contextelor unice.

Am petrecut ultimii cinci ani scufundându-mă în lumea fascinantă a Învățării Automate și a Învățării Profunde. Pasiunea și expertiza mea m-au condus să contribui la peste 50 de proiecte diverse de inginerie software, cu un accent deosebit pe AI/ML. Curiozitatea mea continuă m-a atras și spre Procesarea Limbajului Natural, un domeniu pe care sunt dornic să-l explorez mai departe.