Connect with us

OpenAI’s $200 ChatGPT Pro: AI ที่คิดหนักกว่า (แต่คุณต้องการมันหรือไม่?)

ปัญญาประดิษฐ์

OpenAI’s $200 ChatGPT Pro: AI ที่คิดหนักกว่า (แต่คุณต้องการมันหรือไม่?)

mm

OpenAI เพิ่งเปิดตัวสิ่งที่พวกเขาเรียกว่า “โมเดลที่ฉลาดที่สุดในโลก” มันมาพร้อมกับป้ายกำกับราคา $200 ต่อเดือน และสัญญาว่าจะคิดหนักกว่า ทำงานยาวนานกว่า และแก้ปัญหาที่ซับซ้อนมากกว่าที่เราเคยเห็นมาก่อน แต่ในโลกที่ประกาศเกี่ยวกับ AI ดูเหมือนจะหลุดออกมาเกือบทุกสัปดาห์ การประกาศครั้งนี้สมควรได้รับการพิจารณาอย่างใกล้ชิด

ChatGPT Pro ใหม่ ที่ได้รับการสนับสนุนจาก o1 model ไม่ใช่เพียงการอัปเกรดปกติ ในขณะที่ ChatGPT ปกติกลายเป็นเครื่องมือ AI ที่มีหลายฟังก์ชัน เช่นเดียวกับมีดพกของสวิส แต่การเสนอขายใหม่นี้มีความคล้ายคลึงกับอุปกรณ์ศัลยกรรมที่มีพลังมาก แต่ไม่เหมาะสำหรับทุกคน

สิ่งที่ o1 นำมาสู่โต๊ะจริงๆ

มาทำความเข้าใจเกี่ยวกับสิ่งที่ทำให้ o1 แตกต่าง กัน吧 โมเดลนี้แสดงตัวเลขที่น่าประทับใจ แต่สิ่งที่สำคัญคือที่ไหนที่การปรับปรุงเหล่านี้สร้างความแตกต่างจริงๆ

ในการทดสอบในโลกแห่งความเป็นจริง o1 แสดงให้เห็นถึงการปรับปรุงในสามด้านหลัก:

  1. การแก้ปัญหาเชิงเทคนิคที่ลึกซึ้ง: โมเดลนี้บรรลุความแม่นยำ 50% ในการแข่งขันคณิตศาสตร์ AIME 2024 – เพิ่มขึ้นจาก 37% ในรุ่นก่อนหน้า แต่ที่สำคัญกว่านั้น คือการรักษาความสามารถนี้อย่างต่อเนื่อง เมื่อทดสอบความน่าเชื่อถือ (ได้คำตอบที่ถูกต้อง 4 ใน 4 ครั้ง) โหมด Pro ของ o1 มีประสิทธิภาพเหนือกว่าบรรพบุรุษของมันอย่างมีนัยสำคัญ
  2. การให้เหตุผลทางวิทยาศาสตร์: ในคำถามระดับ PhD ในด้านวิทยาศาสตร์ o1 แสดงให้เห็นถึงอัตราความสำเร็จ 74% โดยมีการปรับปรุงที่น่าประทับใจยิ่งขึ้นในด้านความสม่ำเสมอ สิ่งที่น่าสนใจคือวิธีการที่สิ่งนี้แปลเป็นการใช้งานจริงในการวิจัย – เราได้เห็นนักวิจัยใช้มันในการออกแบบการทดลองทางชีววิทยาที่ซับซ้อน
  3. การเขียนโปรแกรมและการวิเคราะห์ทางเทคนิค: อาจจะน่าประทับใจที่สุด o1 บรรลุอัตราการผ่าน 62% ในความท้าทายในการเขียนโปรแกรมขั้นสูง โดยแสดงให้เห็นถึงความแข็งแกร่งในการแก้ปัญหาที่ซับซ้อนหลายขั้นตอน อย่างไรก็ตาม – และสิ่งนี้มีความสำคัญ – มันแทบจะไม่สามารถทำได้ดีในงานที่เรียบง่ายซึ่งต้องมีการสนทนาที่ต่อเนื่องกัน

Image: OpenAI

นวัตกรรมที่แท้จริงที่นี่ไม่ใช่แค่ประสิทธิภาพโดยรวม – แต่เป็นความน่าเชื่อถือ เมื่อโมเดลต้องคิดหนักเกี่ยวกับปัญหา มันจะทำจริงๆ โดยใช้เวลามากขึ้นในการประมวลผลและตรวจสอบคำตอบของมัน

แต่มีเรื่องหนึ่งที่ต้องระวัง: การคิด “หนัก” เพิ่มเติมนี้มาพร้อมกับการแลกเปลี่ยน โมเดลนี้ช้ากว่าอย่างเห็นได้ชัด และบางครั้งต้องใช้เวลามากขึ้นในการสร้างคำตอบ และสำหรับงานประจำวันส่วนใหญ่ พลังการประมวลผลเพิ่มเติมนี้ไม่เพียงแต่ไม่จำเป็น – แต่อาจเป็นอุปสรรคได้

สิ่งที่เกิดขึ้นกับพลังการประมวลผลมากขนาดนี้?

มาทำความเข้าใจกันว่าเมื่อใดที่คุณเพิ่มพลังการประมวลผลให้กับ AI มากขึ้น ลืมคำพูดโฆษณาไปก่อน – สิ่งที่เรากำลังเห็นกับ o1 นั้นน่าสนใจเพราะมันเปลี่ยนแปลงวิธีที่เราคิดเกี่ยวกับการช่วยเหลือของ AI ทั้งหมด

นึกถึงความแตกต่างระหว่างการพูดคุยอย่างรวดเร็วกับเพื่อนร่วมงานและการประชุมเชิงกลยุทธ์แบบลึกๆ โมเดล AI มาตรฐานนั้นยอดเยี่ยมสำหรับการพูดคุยอย่างรวดเร็ว – มันรวดเร็ว มีประโยชน์ และเสร็จสิ้นงาน แต่ o1? มันเหมือนกับมีหัวหน้าผู้เชี่ยวชาญที่ใช้เวลามากขึ้นในการคิดและบางครั้งกลับมาพร้อมกับข้อสรุปที่คุณไม่เคยพิจารณามาก่อน

อะไรที่แท้จริงแล้วเป็นนวัตกรรมเกี่ยวกับแนวทางนี้?

  1. การคิด “ลึกๆ”: เมื่อคุณให้โมเดล AI มีเวลามากขึ้นในการ “คิด” มันไม่เพียงแต่คิดนานขึ้น – มันคิดแตกต่างออกไป มันสำรวจมุมมองที่หลากหลายและพิจารณากรณีเชิงขอบ ม这是เหตุผลที่นักวิจัยพบว่ามันมีคุณค่าอย่างยิ่งสำหรับการออกแบบการทดลองและการสร้างสมมติฐาน
  2. ความน่าเชื่อถือ: นี่คือสิ่งที่ไม่มีใครพูดถึง: ความสม่ำเสมออาจเป็นพลังงานพิเศษที่แท้จริงของ o1 ในขณะที่โมเดลอื่นๆ อาจตอบปัญหาเชิงซับซ้อนได้ครั้งหนึ่งและล้มเหลวสามครั้งถัดไป o1 แสดงให้เห็นถึงความสม่ำเสมอที่น่าประทับใจในเหตุผลระดับสูง สำหรับมืออาชีพที่ทำงานในประเด็นสำคัญ ปัจจัยความน่าเชื่อถือนี้มีความสำคัญมาก

คู่มือผู้ซื้อ AI ที่ชาญฉลาด

เราควรจะมีการสนทนาที่ซื่อสัตย์เกี่ยวกับป้ายกำกับราคา $200 จริงๆ มันคุ้มค่าหรือไม่? นั่นขึ้นอยู่กับว่าคุณคิดเกี่ยวกับการช่วยเหลือ AI ในการทำงานของคุณอย่างไร

สิ่งที่น่าสนใจคือ ผู้ที่อาจได้รับประโยชน์มากที่สุดจาก o1 ไม่จำเป็นต้องเป็นคนที่ทำงานในประเด็นที่ซับซ้อนมากที่สุด – แต่เป็นคนที่ทำงานในประเด็นที่การผิดพลาดมีค่าใช้จ่ายสูงมาก เว้นแต่คุณจะอยู่ในสถานการณ์เฉพาะเหล่านี้ พลังการประมวลผลเพิ่มเติมอาจทำให้คุณช้าลงได้

การใช้ o1 อย่างมีประสิทธิภาพต้องมีการเปลี่ยนแปลงพื้นฐานในแนวทางที่คุณเข้าถึงการโต้ตอบ AI:

  1. ความลึกมากกว่าความเร็ว
  • แทนการแลกเปลี่ยนอย่างรวดเร็ว คิดถึงการสร้างคำถามการวิจัยที่คิดมาอย่างดี
  • วางแผนสำหรับเวลาตอบสนองที่ยาวขึ้น แต่คาดหวังการวิเคราะห์ที่ครอบคลุมมากขึ้น
  1. คุณภาพมากกว่าปริมาณ
  • มุ่งเน้นไปที่ปัญหาที่ซับซ้อนและมีคุณค่าสูง
  • ใช้โมเดลมาตรฐานสำหรับงานประจำวัน
  1. การวางกลยุทธ์
  • รวม o1 กับเครื่องมือ AI อื่นๆ สำหรับการทำงานที่ได้รับการปรับให้เหมาะสม
  • เก็บพลังการประมวลผลที่หนักหน่วงสำหรับสิ่งที่สำคัญที่สุด

o1 ไม่ได้พยายามที่จะเป็นทุกสิ่งสำหรับทุกคน แต่มันกำลังผลักดันให้เราคิดอย่างมีกลยุทธ์มากขึ้นเกี่ยวกับวิธีการใช้เครื่องมือ AI ของเรา อาจเป็นไปได้ว่านวัตกรรมที่แท้จริงไม่ใช่แค่เทคโนโลยี แต่เป็นวิธีที่มันทำให้เราต้องคิดใหม่เกี่ยวกับวิธีการที่เราจะได้รับการช่วยเหลือจาก AI

นึกถึงชุดเครื่องมือ AI ของคุณเหมือนกับห้องครัวมืออาชีพ ใช่ คุณสามารถใช้อุปกรณ์ระดับอุตสาหกรรมสำหรับทุกสิ่ง แต่เชฟมืออาชีพรู้ว่าเมื่อใดที่จะใช้เครื่อง sous vide ที่หรูหราและเมื่อใดที่จะใช้กระทะธรรมดาเพื่อทำงานได้ดีกว่า

ก่อนที่คุณจะกระโดดเข้าสู่การสมัครสมาชิก $200 ลองทำสิ่งนี้: 保存บันทึกการโต้ตอบ AI ของคุณเป็นเวลาหนึ่งสัปดาห์ ทำเครื่องหมายว่า哪่ๆ ที่ต้องการการคิดที่ลึกกว่าและคำตอบที่รวดเร็ว สิ่งนี้จะบอกคุณมากกว่าเกี่ยวกับว่าคุณต้องการ o1 มากกว่าผลทดสอบใดๆ ที่จะมา

สิ่งที่ทำให้ฉันประทับใจมากที่สุดเกี่ยวกับ o1 ไม่ใช่สิ่งที่มันสามารถทำได้ในปัจจุบัน แต่เป็นสิ่งที่บอกเราถึงอนาคต เรากำลังเห็น AI วิวัฒนาการ จากเครื่องมือที่พยายามทำทุกสิ่งไปสู่เครื่องมือที่รู้ว่ามันทำอะไรได้ดีที่สุด

ไม่ว่าคุณจะเข้าร่วมการเดินทางของ o1 หรือไม่ สิ่งหนึ่งที่แน่นอนคือวิธีที่เราคิดและใช้ AI กำลังเปลี่ยนแปลงไป และสิ่งนี้มีค่าควรให้ความสนใจ

Alex McFarland เป็นนักข่าวและนักเขียน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมงานกับสตาร์ทอัพ AI และสื่อสิ่งพิมพ์ต่างๆ ทั่วโลก