ปัญญาประดิษฐ์
OpenAI’s $200 ChatGPT Pro: AI ที่คิดหนักกว่า (แต่คุณต้องการมันหรือไม่?)
OpenAI เพิ่งเปิดตัวสิ่งที่พวกเขาเรียกว่า “โมเดลที่ฉลาดที่สุดในโลก” มันมาพร้อมกับป้ายกำกับราคา $200 ต่อเดือน และสัญญาว่าจะคิดหนักกว่า ทำงานยาวนานกว่า และแก้ปัญหาที่ซับซ้อนมากกว่าที่เราเคยเห็นมาก่อน แต่ในโลกที่ประกาศเกี่ยวกับ AI ดูเหมือนจะหลุดออกมาเกือบทุกสัปดาห์ การประกาศครั้งนี้สมควรได้รับการพิจารณาอย่างใกล้ชิด
ChatGPT Pro ใหม่ ที่ได้รับการสนับสนุนจาก o1 model ไม่ใช่เพียงการอัปเกรดปกติ ในขณะที่ ChatGPT ปกติกลายเป็นเครื่องมือ AI ที่มีหลายฟังก์ชัน เช่นเดียวกับมีดพกของสวิส แต่การเสนอขายใหม่นี้มีความคล้ายคลึงกับอุปกรณ์ศัลยกรรมที่มีพลังมาก แต่ไม่เหมาะสำหรับทุกคน
สิ่งที่ o1 นำมาสู่โต๊ะจริงๆ
มาทำความเข้าใจเกี่ยวกับสิ่งที่ทำให้ o1 แตกต่าง กัน吧 โมเดลนี้แสดงตัวเลขที่น่าประทับใจ แต่สิ่งที่สำคัญคือที่ไหนที่การปรับปรุงเหล่านี้สร้างความแตกต่างจริงๆ
ในการทดสอบในโลกแห่งความเป็นจริง o1 แสดงให้เห็นถึงการปรับปรุงในสามด้านหลัก:
- การแก้ปัญหาเชิงเทคนิคที่ลึกซึ้ง: โมเดลนี้บรรลุความแม่นยำ 50% ในการแข่งขันคณิตศาสตร์ AIME 2024 – เพิ่มขึ้นจาก 37% ในรุ่นก่อนหน้า แต่ที่สำคัญกว่านั้น คือการรักษาความสามารถนี้อย่างต่อเนื่อง เมื่อทดสอบความน่าเชื่อถือ (ได้คำตอบที่ถูกต้อง 4 ใน 4 ครั้ง) โหมด Pro ของ o1 มีประสิทธิภาพเหนือกว่าบรรพบุรุษของมันอย่างมีนัยสำคัญ
- การให้เหตุผลทางวิทยาศาสตร์: ในคำถามระดับ PhD ในด้านวิทยาศาสตร์ o1 แสดงให้เห็นถึงอัตราความสำเร็จ 74% โดยมีการปรับปรุงที่น่าประทับใจยิ่งขึ้นในด้านความสม่ำเสมอ สิ่งที่น่าสนใจคือวิธีการที่สิ่งนี้แปลเป็นการใช้งานจริงในการวิจัย – เราได้เห็นนักวิจัยใช้มันในการออกแบบการทดลองทางชีววิทยาที่ซับซ้อน
- การเขียนโปรแกรมและการวิเคราะห์ทางเทคนิค: อาจจะน่าประทับใจที่สุด o1 บรรลุอัตราการผ่าน 62% ในความท้าทายในการเขียนโปรแกรมขั้นสูง โดยแสดงให้เห็นถึงความแข็งแกร่งในการแก้ปัญหาที่ซับซ้อนหลายขั้นตอน อย่างไรก็ตาม – และสิ่งนี้มีความสำคัญ – มันแทบจะไม่สามารถทำได้ดีในงานที่เรียบง่ายซึ่งต้องมีการสนทนาที่ต่อเนื่องกัน

Image: OpenAI
นวัตกรรมที่แท้จริงที่นี่ไม่ใช่แค่ประสิทธิภาพโดยรวม – แต่เป็นความน่าเชื่อถือ เมื่อโมเดลต้องคิดหนักเกี่ยวกับปัญหา มันจะทำจริงๆ โดยใช้เวลามากขึ้นในการประมวลผลและตรวจสอบคำตอบของมัน
แต่มีเรื่องหนึ่งที่ต้องระวัง: การคิด “หนัก” เพิ่มเติมนี้มาพร้อมกับการแลกเปลี่ยน โมเดลนี้ช้ากว่าอย่างเห็นได้ชัด และบางครั้งต้องใช้เวลามากขึ้นในการสร้างคำตอบ และสำหรับงานประจำวันส่วนใหญ่ พลังการประมวลผลเพิ่มเติมนี้ไม่เพียงแต่ไม่จำเป็น – แต่อาจเป็นอุปสรรคได้
สิ่งที่เกิดขึ้นกับพลังการประมวลผลมากขนาดนี้?
มาทำความเข้าใจกันว่าเมื่อใดที่คุณเพิ่มพลังการประมวลผลให้กับ AI มากขึ้น ลืมคำพูดโฆษณาไปก่อน – สิ่งที่เรากำลังเห็นกับ o1 นั้นน่าสนใจเพราะมันเปลี่ยนแปลงวิธีที่เราคิดเกี่ยวกับการช่วยเหลือของ AI ทั้งหมด
นึกถึงความแตกต่างระหว่างการพูดคุยอย่างรวดเร็วกับเพื่อนร่วมงานและการประชุมเชิงกลยุทธ์แบบลึกๆ โมเดล AI มาตรฐานนั้นยอดเยี่ยมสำหรับการพูดคุยอย่างรวดเร็ว – มันรวดเร็ว มีประโยชน์ และเสร็จสิ้นงาน แต่ o1? มันเหมือนกับมีหัวหน้าผู้เชี่ยวชาญที่ใช้เวลามากขึ้นในการคิดและบางครั้งกลับมาพร้อมกับข้อสรุปที่คุณไม่เคยพิจารณามาก่อน
อะไรที่แท้จริงแล้วเป็นนวัตกรรมเกี่ยวกับแนวทางนี้?
- การคิด “ลึกๆ”: เมื่อคุณให้โมเดล AI มีเวลามากขึ้นในการ “คิด” มันไม่เพียงแต่คิดนานขึ้น – มันคิดแตกต่างออกไป มันสำรวจมุมมองที่หลากหลายและพิจารณากรณีเชิงขอบ ม这是เหตุผลที่นักวิจัยพบว่ามันมีคุณค่าอย่างยิ่งสำหรับการออกแบบการทดลองและการสร้างสมมติฐาน
- ความน่าเชื่อถือ: นี่คือสิ่งที่ไม่มีใครพูดถึง: ความสม่ำเสมออาจเป็นพลังงานพิเศษที่แท้จริงของ o1 ในขณะที่โมเดลอื่นๆ อาจตอบปัญหาเชิงซับซ้อนได้ครั้งหนึ่งและล้มเหลวสามครั้งถัดไป o1 แสดงให้เห็นถึงความสม่ำเสมอที่น่าประทับใจในเหตุผลระดับสูง สำหรับมืออาชีพที่ทำงานในประเด็นสำคัญ ปัจจัยความน่าเชื่อถือนี้มีความสำคัญมาก
คู่มือผู้ซื้อ AI ที่ชาญฉลาด
เราควรจะมีการสนทนาที่ซื่อสัตย์เกี่ยวกับป้ายกำกับราคา $200 จริงๆ มันคุ้มค่าหรือไม่? นั่นขึ้นอยู่กับว่าคุณคิดเกี่ยวกับการช่วยเหลือ AI ในการทำงานของคุณอย่างไร
สิ่งที่น่าสนใจคือ ผู้ที่อาจได้รับประโยชน์มากที่สุดจาก o1 ไม่จำเป็นต้องเป็นคนที่ทำงานในประเด็นที่ซับซ้อนมากที่สุด – แต่เป็นคนที่ทำงานในประเด็นที่การผิดพลาดมีค่าใช้จ่ายสูงมาก เว้นแต่คุณจะอยู่ในสถานการณ์เฉพาะเหล่านี้ พลังการประมวลผลเพิ่มเติมอาจทำให้คุณช้าลงได้
การใช้ o1 อย่างมีประสิทธิภาพต้องมีการเปลี่ยนแปลงพื้นฐานในแนวทางที่คุณเข้าถึงการโต้ตอบ AI:
- ความลึกมากกว่าความเร็ว
- แทนการแลกเปลี่ยนอย่างรวดเร็ว คิดถึงการสร้างคำถามการวิจัยที่คิดมาอย่างดี
- วางแผนสำหรับเวลาตอบสนองที่ยาวขึ้น แต่คาดหวังการวิเคราะห์ที่ครอบคลุมมากขึ้น
- คุณภาพมากกว่าปริมาณ
- มุ่งเน้นไปที่ปัญหาที่ซับซ้อนและมีคุณค่าสูง
- ใช้โมเดลมาตรฐานสำหรับงานประจำวัน
- การวางกลยุทธ์
- รวม o1 กับเครื่องมือ AI อื่นๆ สำหรับการทำงานที่ได้รับการปรับให้เหมาะสม
- เก็บพลังการประมวลผลที่หนักหน่วงสำหรับสิ่งที่สำคัญที่สุด
o1 ไม่ได้พยายามที่จะเป็นทุกสิ่งสำหรับทุกคน แต่มันกำลังผลักดันให้เราคิดอย่างมีกลยุทธ์มากขึ้นเกี่ยวกับวิธีการใช้เครื่องมือ AI ของเรา อาจเป็นไปได้ว่านวัตกรรมที่แท้จริงไม่ใช่แค่เทคโนโลยี แต่เป็นวิธีที่มันทำให้เราต้องคิดใหม่เกี่ยวกับวิธีการที่เราจะได้รับการช่วยเหลือจาก AI
นึกถึงชุดเครื่องมือ AI ของคุณเหมือนกับห้องครัวมืออาชีพ ใช่ คุณสามารถใช้อุปกรณ์ระดับอุตสาหกรรมสำหรับทุกสิ่ง แต่เชฟมืออาชีพรู้ว่าเมื่อใดที่จะใช้เครื่อง sous vide ที่หรูหราและเมื่อใดที่จะใช้กระทะธรรมดาเพื่อทำงานได้ดีกว่า
ก่อนที่คุณจะกระโดดเข้าสู่การสมัครสมาชิก $200 ลองทำสิ่งนี้: 保存บันทึกการโต้ตอบ AI ของคุณเป็นเวลาหนึ่งสัปดาห์ ทำเครื่องหมายว่า哪่ๆ ที่ต้องการการคิดที่ลึกกว่าและคำตอบที่รวดเร็ว สิ่งนี้จะบอกคุณมากกว่าเกี่ยวกับว่าคุณต้องการ o1 มากกว่าผลทดสอบใดๆ ที่จะมา
สิ่งที่ทำให้ฉันประทับใจมากที่สุดเกี่ยวกับ o1 ไม่ใช่สิ่งที่มันสามารถทำได้ในปัจจุบัน แต่เป็นสิ่งที่บอกเราถึงอนาคต เรากำลังเห็น AI วิวัฒนาการ จากเครื่องมือที่พยายามทำทุกสิ่งไปสู่เครื่องมือที่รู้ว่ามันทำอะไรได้ดีที่สุด
ไม่ว่าคุณจะเข้าร่วมการเดินทางของ o1 หรือไม่ สิ่งหนึ่งที่แน่นอนคือวิธีที่เราคิดและใช้ AI กำลังเปลี่ยนแปลงไป และสิ่งนี้มีค่าควรให้ความสนใจ












