Mesterséges intelligencia
Az OpenAI 200 dolláros ChatGPT Pro: A keményebben gondolkodó AI (de szükséged van rá?)

Az OpenAI most dobta piacra azt, amit „a világ legokosabb modelljének” neveznek. 200 dolláros havi árcédulával érkezik, és azt ígéri, hogy jobban gondolkodik, tovább dolgozik, és bonyolultabb problémákat old meg, mint bármi, amit korábban láttunk. De egy olyan világban, ahol a mesterséges intelligencia bejelentései hetente csökkennek, ez megérdemel egy közelebbi pillantást.
Az új ChatGPT Pro, amelyet a o1 modell, nem csak egy újabb rendszeres frissítés. Míg a hagyományos ChatGPT a svájci hadsereg mesterséges intelligencia-eszközök kése lett, ez az új ajánlat inkább speciális sebészeti berendezésekhez hasonlít – hihetetlenül erős, de nem mindenkinek.
Mit hoz az o1 igazán az asztalra
Vágjunk át a hype-on, és nézzük meg, mitől más az o1. A modell lenyűgöző számokat mutat, de az számít, hogy ezek a fejlesztések valójában hol jelentenek változást.
A valós tesztelés során az o1 három kulcsfontosságú területen mutat fejlődést:
- Mély technikai problémamegoldás: A modell 50%-os pontosságot ér el az AIME 2024 matematikai versenyfeladataiban – a korábbi verziók 37%-ához képest. De még ennél is fontosabb, hogy ezt a teljesítményt folyamatosan fenntartja. A megbízhatóság tesztelése során (4-ből 4-szer kapja meg a helyes választ) az o1 pro mód jelentősen felülmúlja elődeit.
- Tudományos érvelés: A PhD szintű tudományos kérdésekben az o1 74%-os sikerességi arányt mutat, és még lenyűgözőbb konzisztencia növekedést mutat. Az érdekes az, hogy ez hogyan vált valós kutatási alkalmazásokhoz – azt látjuk, hogy a kutatók használják kifinomult biológiai kísérletek tervezésére.
- Programozás és műszaki elemzés: Talán a legbeszédesebb, hogy az o1 62%-os sikerességi arányt ér el a fejlett programozási kihívásokon, ami különösen erős az összetett, többlépcsős problémamegoldásban. Azonban – és ez döntő fontosságú – valójában egyszerűbb, ismétlődő feladatokkal küzd, amelyek oda-vissza beszélgetést igényelnek.

Kép: OpenAI
Az igazi innováció itt nem csak a nyers teljesítmény, hanem a megbízhatóság. Amikor a modellnek jobban át kell gondolnia egy problémát, akkor valóban megteszi, így több időbe telik a válaszok feldolgozása és érvényesítése.
De van egy rúgó: ez az extra „gondolkodás” kompromisszumokkal jár. A modell jelentősen lassabb, és néha lényegesen több időt igényel a válaszok generálása. És sok napi feladathoz ez a plusz lóerő nemcsak szükségtelen, hanem akár kontraproduktív is lehet.
Mi történik ekkora számítási teljesítménnyel?
Beszéljünk arról, mi történik valójában, ha egy mesterséges intelligenciát nagyobb számítási teljesítménnyel töltünk fel. Felejtsd el a marketinges beszédet – amit az o1-nél látunk, az lenyűgöző, mert teljesen megváltoztatja azt, ahogyan az AI-segítségről gondolkodunk.
Képzeld el úgy, mint a különbséget egy kollégával folytatott gyors csevegés és egy mélyreható stratégiai munka között. A szabványos mesterséges intelligencia modellek nagyszerűek a gyors csevegésekhez – lendületesek, segítőkészek, és elvégzik a munkát. De o1? Olyan ez, mint egy vezető szakértő, aki időt szakít, átgondolja a dolgokat, és néha olyan meglátásokkal tér vissza, amelyekre nem is gondolt.
Mi a forradalmi ebben a megközelítésben?
- Mélyebb „gondolkodás”: Ha több időt ad egy AI-modellnek a „gondolkodásra”, akkor nem csak tovább gondolkodik, hanem másként is gondolkodik. Több szöget vizsgál, és figyelembe veszi az éles eseteket. Ez az oka annak, hogy a kutatók különösen értékesnek tartják a kísérleti tervezés és a hipotézisek létrehozása szempontjából.
- Megbízhatóság: Itt van valami, amiről senki sem beszél: a következetesség lehet az o1 igazi szuperereje. Míg más modellek egy összetett problémát egyszer szögezhetnek le, a következő háromszor pedig kudarcot vallanak, az o1 figyelemre méltó következetességet mutat magas szintű érvelésében. A kritikus problémákkal foglalkozó szakemberek számára ez a megbízhatósági tényező nagy dolog.
Intelligens vásárlói útmutató az AI elektromos szerszámokhoz
Őszinte beszélgetést kellene folytatnunk arról a 200 dolláros árcéduláról. Tényleg megéri? Nos, ez teljes mértékben attól függ, hogyan gondolkodik az AI-segélyről a munkafolyamatban.
Érdekes módon azok az emberek, akik a legtöbbet profitálhatnak az o1-ből, nem feltétlenül azok, akik a legösszetettebb problémákon dolgoznak – ők azok, akik olyan problémákon dolgoznak, ahol a tévedés rendkívül költséges. Hacsak nincs ilyen konkrét helyzetekben, ez a többleterő valójában csak lelassíthatja.
Az o1 hatékony használata alapvető váltást igényel az AI interakció megközelítésében:
- Mélység a sebesség felett
- A gyors oda-vissza eszmecserék helyett gondoljon rá úgy, mint egy jól átgondolt kutatási lekérdezésekre
- Tervezzen hosszabb válaszidőt, de várjon átfogóbb elemzést
- Minőség a mennyiség felett
- Összpontosítson az összetett, nagy értékű problémákra
- Használjon szabványos modelleket a rutinfeladatokhoz
- Stratégiai telepítés
- Az optimalizált munkafolyamat érdekében kombinálja az o1-et más AI-eszközökkel
- Takarítsa meg a nagy számítási teljesítményt ott, ahol a legfontosabb
Az o1 nem próbál mindenki számára minden lenni. Ehelyett arra késztet bennünket, hogy stratégiailag gondolkodjunk arról, hogyan használjuk az AI-eszközöket. Talán az igazi innováció itt nem csak a technológia, hanem az, ahogyan ez arra késztet bennünket, hogy újragondoljuk a mesterséges intelligencia támogatásával kapcsolatos megközelítésünket.
Gondoljon mesterséges intelligencia eszköztárára úgy, mint egy professzionális konyhára. Igen, mindenhez használhatja az ipari minőségű berendezéseket, de a mesterszakácsok pontosan tudják, mikor kell használni a díszes sous vide gépet, és mikor teszi jobban a dolgát egy egyszerű serpenyő.
Mielőtt belevágna a 200 dolláros előfizetésbe, próbálja ki ezt: Vezessen naplót a mesterséges intelligencia interakcióiról egy hétig. Jelölje meg, melyikre van szüksége mélyebb gondolkodásra a gyors válaszokkal szemben. Ez többet fog megtudni arról, hogy szüksége van-e az o1-re, mint bármely benchmark.
Az o1-ben nem az izgat a legjobban, hogy mit tud ma csinálni, hanem az, amit holnapról árul el. Figyeljük a mesterséges intelligencia fejlődését, egy olyan eszközről, amely mindent megpróbál, egy olyan eszköz felé haladunk, amely pontosan tudja, miben a legjobb.
Függetlenül attól, hogy az o1 útjára lép, egy dolog biztos: az AI-ról alkotott gondolkodásunk és használatunk folyamatosan fejlődik, és erre érdemes odafigyelni.