Connect with us

OpenAI’s $200 ChatGPT Pro: AI-ul care gândește mai greu (Dar aveți nevoie de el?)

Inteligență artificială

OpenAI’s $200 ChatGPT Pro: AI-ul care gândește mai greu (Dar aveți nevoie de el?)

mm

OpenAI a lansat ceea ce ei numesc “cel mai deștept model din lume.” Acesta vine cu o etichetă de preț lunară de 200 de dolari și promite să gândească mai greu, să lucreze mai mult și să rezolve probleme mai complexe decât orice am văzut până acum. Dar, într-o lume în care anunțurile despre inteligența artificială par să apară în fiecare săptămână, acesta merită o examinare mai atentă.

Noul ChatGPT Pro, alimentat de modelul o1, nu este doar o actualizare obișnuită. În timp ce ChatGPT regulat a devenit un instrument multifuncțional al instrumentelor AI, această ofertă nouă este mai degrabă un echipament chirurgical specializat – incredibil de puternic, dar nu pentru toată lumea.

Ce aduce cu adevărat o1 pe masă

Să trecem peste hype și să vedem ce face o1 diferit. Modelul arată niște numere impresionante, dar ce contează este unde aceste îmbunătățiri fac cu adevărat o diferență.

În testele din lumea reală, o1 arată îmbunătățiri în trei domenii cheie:

  1. Rezolvarea problemelor tehnice profunde: Modelul atinge o acuratețe de 50% la problemele de matematică ale concursului AIME 2024 – în creștere de la 37% în versiunile anterioare. Dar mai important, menține această performanță în mod constant. Când a fost testat pentru fiabilitate (obținerea răspunsului corect 4 din 4 ori), modul pro o1 depășește semnificativ predecesorii săi.
  2. Raționament științific: La întrebări de nivel PhD în știință, o1 demonstrează o rată de succes de 74%, cu câștiguri și mai impresionante în ceea ce privește coerența. Ce este interesant este modul în care acest lucru se traduce în aplicații de cercetare reale – vedem cercetători care îl folosesc pentru a proiecta experimente biologice sofisticate.
  3. Programare și analiză tehnică: Poate cel mai convingător, o1 atinge o rată de trecere de 62% la provocări avansate de programare, arătând o forță deosebită în rezolvarea problemelor complexe, cu mai multe etape. Cu toate acestea – și acesta este un aspect crucial – se luptă cu sarcinile mai simple, iterative, care necesită conversații cu întrebări și răspunsuri.

Imagine: OpenAI

Inovația reală de aici nu este doar performanța brută – este fiabilitatea. Când modelul trebuie să gândească mai greu la o problemă, el o face, luând mai mult timp pentru a procesa și valida răspunsurile sale.

Dar există o problemă: toată această “gândire” suplimentară vine cu compromisuri. Modelul este semnificativ mai lent, necesitând uneori mult mai mult timp pentru a genera răspunsuri. Și pentru multe sarcini de zi cu zi, această putere suplimentară nu este doar inutilă – ar putea fi chiar contraproductivă.

Ce se întâmplă cu atâta putere de calcul?

Să vorbim despre ce se întâmplă de fapt atunci când încărcați un AI cu mai multă putere de calcul. Uitați-vă de vorbirea de vânzare – ceea ce vedem cu o1 este fascinant, deoarece schimbă complet modul în care gândim asistența AI.

Gândiți-vă la asta ca la diferența dintre o conversație rapidă cu un coleg și o ședință profundă de strategie. Modelele standard de AI sunt excelente pentru acele conversații rapide – sunt rapide, utile și fac treaba. Dar o1? Este ca și cum ați avea un expert senior care își ia timp, gândește lucrurile și uneori vine cu insight-uri pe care nu le-ați luat în considerare.

Ce este cu adevărat revoluționar despre această abordare?

  1. Gândire mai profundă: Când oferiți unui model de AI mai mult timp pentru a “gândi”, el nu gândește doar mai mult timp – gândește diferit. Explorează multiple unghiuri și ia în considerare cazuri marginale. De aceea, cercetătorii îl găsesc deosebit de valoros pentru proiectarea experimentelor și generarea de ipoteze.
  2. Fiabilitate: Iată ceva despre care nimeni nu vorbește: consistența ar putea fi adevărata superputere a lui o1. În timp ce alte modele ar putea rezolva o problemă complexă o dată și eșua de trei ori, o1 arată o remarcabilă coerență în raționamentul de nivel înalt. Pentru profesioniștii care lucrează la probleme critice, acest factor de fiabilitate este o mare afacere.

Ghidul cumpărătorului inteligent pentru uneltele puternice AI

Ar trebui să avem o conversație onestă despre acea etichetă de preț de 200 de dolari. Merită cu adevărat? Ei bine, depinde complet de modul în care gândiți asistența AI în fluxul de lucru.

Interesant, persoanele care ar putea beneficia cel mai mult de la o1 nu sunt neapărat cele care lucrează la cele mai complexe probleme – ci cele care lucrează la probleme unde a greși este extrem de costisitor. Cu excepția cazului în care sunteți în situații specifice, cum ar fi aceasta, puterea suplimentară ar putea încetini doar lucrurile.

Utilizarea eficientă a lui o1 necesită o schimbare fundamentală în modul în care abordați interacțiunea cu AI:

  1. Adâncime peste viteză
  • În loc de schimburi rapide de întrebări și răspunsuri, gândiți-vă la aceasta ca la crearea de întrebări de cercetare bine gândite
  • Planificați timpul de răspuns mai lung, dar așteptați-vă la o analiză mai cuprinzătoare
  1. Calitate peste cantitate
  • Concentrați-vă pe probleme complexe, de înaltă valoare
  • Utilizați modelele standard pentru sarcinile de rutină
  1. Desfășurare strategică
  • Combinați o1 cu alte unelte AI pentru un flux de lucru optimizat
  • Economisiți puterea computațională puternică pentru locurile unde contează cel mai mult

o1 nu încearcă să fie totul pentru toată lumea. În schimb, ne împinge să gândim mai strategic despre modul în care utilizăm uneltele AI. Poate că inovația reală de aici nu este doar tehnologia, ci modul în care ne face să reevaluăm abordarea noastră asupra asistenței AI.

Gândiți-vă la setul dvs. de unelte AI ca la o bucătărie profesională. Da, ați putea folosi echipamentul industrial pentru tot, dar bucătarii pricepuți știu exact când să folosească mașina de gătit sofisticată și când o simplă tigaie face treaba mai bine.

Înainte de a sări în acea abonament de 200 de dolari, încercați asta: Țineți un jurnal al interacțiunilor dvs. cu AI timp de o săptămână. Marchează care dintre ele au necesitat cu adevărat o gândire mai profundă în comparație cu răspunsurile rapide. Acesta vă va spune mai mult despre nevoia dvs. de o1 decât orice benchmark ar putea face vreodată.

Ce mă entuziasmează cel mai mult despre o1 nu este ceea ce poate face astăzi, ci ceea ce ne spune despre mâine. Asistăm la evoluția inteligenței artificiale, trecând de la un instrument care încearcă să facă totul la unul care știe exact la ce este mai bun.

Indiferent dacă vă alăturați valului o1 sau nu, un lucru este sigur: modul în care gândim și utilizăm AI evoluează, și acesta este ceva ce merită atenție.

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.