Connect with us

ทำไมการควบคุมต้นทุน AI จึงกลายเป็นความท้าทายในการขยายขนาดขององค์กรในอนาคต

ผู้นำทางความคิด

ทำไมการควบคุมต้นทุน AI จึงกลายเป็นความท้าทายในการขยายขนาดขององค์กรในอนาคต

mm
A high-tech data center landscape featuring glowing blue fiber-optic data streams converging into a complex network, passing through a massive, reinforced industrial gate that represents a

1. ค่าใช้จ่ายที่ซ่อนอยู่หลังการนำ AI ไปใช้

ในขั้นตอนแรกของการนำ AI ไปใช้ ระบบ AI ดูเหมือนจะมีประสิทธิภาพทางเศรษฐกิจบนพื้นผิว Traffic volumes ต่ำ ใช้กรณีศึกษาอย่างแคบ และทีมงานติดตามพฤติกรรมใน môi trườngที่ควบคุมได้ ภายใต้เงื่อนไขเหล่านี้ ค่าใช้จ่ายมักจะถูกประเมินที่ระดับการเรียกใช้แบบจำลองหรือ 워크โฟลว์ที่จำกัด ซึ่งทำให้ได้ความประทับใจว่าการขยายขนาดจะง่ายดาย อย่างน้อยที่สุด นั่นคือสิ่งที่ทีมงานส่วนใหญ่คิด

ความประทับใจนั้นได้รับการย้ำเตือนจากการที่การใช้จ่าย AI ไม่มีสัญญาณของการชะลอตัว หนึ่ง รายงานล่าสุด 估计การใช้จ่ายขององค์กรสำหรับการใช้งาน AI ทั่วไปถึงหลายสิบพันล้านดอลลาร์ในปี 2025 เพิ่มขึ้นมากกว่าสามเท่าเมื่อเทียบกับปีก่อนหน้า

แต่ความเป็นจริงเปลี่ยนแปลงไปเมื่อเอเจนต์ถูกส่งออกไปให้ผู้ใช้จริงและความซับซ้อนในการดำเนินการ

สภาพแวดล้อมการผลิตนำพาไปสู่รูปแบบการโต้ตอบที่ไม่คาดคิด การสนทนาที่ยาวขึ้น ประสบการณ์เบื้องหลัง และเส้นทางการเพิ่มประสิทธิภาพให้กับแบบจำลองที่มีประสิทธิภาพสูงขึ้น การร้องขอหนึ่งครั้งสามารถกระตุ้นการดำเนินการหลายอย่างที่ไม่เห็นได้ชัดเจนระหว่างการทดสอบ องค์กรต้องเผชิญกับความท้าทายที่หลายทีมอธิบายว่าเป็น “การแปลกใจของใบเรียกเก็บเงิน” ซึ่งเป็นการเพิ่มขึ้นของการใช้จ่ายอย่างไม่คาดคิดโดยไม่มีความเข้าใจที่ชัดเจนว่าพฤติกรรมหรือ 워크โฟลว์ใดที่สร้างมันขึ้นมา

ในขั้นตอนนี้ ความท้าทายไม่ใช่แค่การปรับให้เหมาะสมของแบบจำลอง แต่เป็นการได้รับการมองเห็นในการดำเนินการที่แท้จริงที่ขับเคลื่อนค่าใช้จ่าย AI

2. ทำไมการทำงานของ AI ถูกทำลายโดยโมเดลค่าใช้จ่ายแบบดั้งเดิมบนคลาวด์

ก่อนหน้านี้ การจัดการค่าใช้จ่ายแบบดั้งเดิมบนคลาวด์เกิดขึ้นรอบการทำงานที่ค่อนข้างคาดการณ์ได้ การใช้ทรัพยากรสามารถวัดได้ในหน่วยที่มั่นคง เช่น ชั่วโมงการประมวลผล การจัดเก็บ หรือปริมาณการร้องขอ และแม้แต่การปรับให้เหมาะสมผ่านกลยุทธ์การจัดเตรียมหรือการควบคุมการใช้งาน สิ่งสำคัญที่ต้องทราบคือเส้นทางการดำเนินการโดยทั่วไปเป็นแบบกำหนดไว้ล่วงหน้า ซึ่งทำให้สามารถคาดการณ์การใช้จ่ายได้ด้วยความแม่นยำที่สมเหตุสมผลและค่าใช้จ่ายสามารถจัดสรรให้กับบริการหรือทีมงานเฉพาะได้

การทำงานของ AI นำเสนอโมเดลค่าใช้จ่ายที่แตกต่าง การใช้จ่ายส่วนใหญ่เชื่อมโยงกับการใช้โทเค็น ขนาดบริบท การเชื่อมโยงแบบจำลอง และการตัดสินใจแบบไดนามิกใน 워크โฟลว์ที่แตกต่างกันไปในแต่ละการโต้ตอบ

การร้องขอของ用户เดียวกันอาจตามเส้นทางการดำเนินการที่แตกต่างกันไปขึ้นอยู่กับเกณฑ์ความมั่นใจ การตอบสนองของเครื่องมือ หรือตรรกะการหลบเลี่ยง ซึ่งเหตุผลที่ค่าใช้จ่ายไม่ใช่เชิงเส้นหรือคาดการณ์ได้ง่ายๆ เช่นเดิม โมเดล FinOps แบบดั้งเดิมให้ความสามารถในการมองเห็นในการใช้ทรัพยากร แต่ปัญหาจริงๆ คือการมองเห็นพฤติกรรมในการดำเนินการที่แท้จริง ไม่ใช่แค่การมอบทรัพยากรเท่านั้น องค์กรไม่สามารถกำหนดเศรษฐศาสตร์ของระบบ AI ได้โดยวิธีการแบบดั้งเดิม

3. พื้นผิวค่าใช้จ่ายที่ขยายตัวของระบบ Agentic

เมื่อองค์กรเปลี่ยนจากการอนุมานแบบ一步ไปสู่สถาปัตยกรรม Agentic ค่าใช้จ่ายของระบบ AI กลายเป็นเรื่องที่ซับซ้อนมากขึ้น การวิเคราะห์ทางอุตสาหกรรมล่าสุดแม้แต่ คาดการณ์ ว่ามากกว่า 40% ของโครงการ AI Agentic จะถูกยกเลิกก่อนที่จะถึงการผลิตในปี 2027 ซึ่งได้รับแรงผลักดันจากต้นทุนและความซับซ้อนที่แท้จริงของการนำ 워크โฟลว์ของเอเจนต์แบบหลายขั้นตอนไปใช้

การร้องขอของ用户ไม่ได้รับการแก้ไขผ่านการเรียกใช้แบบจำลองเพียงครั้งเดียว แต่ผ่าน 워크โฟลว์ที่ประสานกันซึ่งอาจเกี่ยวข้องกับการวางแผนขั้นตอน เช่น การค้นหา การดำเนินการเครื่องมือ และการโต้ตอบระหว่างเอเจนต์หลายตัว

ไม่ต้องพูดถึงว่า 워크โฟลว์ที่กล่าวถึงข้างต้นเพิ่มความสามารถ เช่น การสร้างแบบจำลองที่เพิ่มการค้นหา (RAG) หรือการทำงานร่วมกันระหว่างเอเจนต์หลายตัว ซึ่งนำไปสู่การดำเนินการเพิ่มเติมที่ต้องจ่ายเงินซึ่งสะสมขึ้นเมื่อเวลาผ่านไป

การโต้ตอบหนึ่งครั้งสามารถกระตุ้นการเรียกใช้แบบจำลองที่ฝังตัว การค้นหาในฐานข้อมูลเวกเตอร์ ลูปการให้เหตุผลแบบเชิงต่อเนื่อง และการเพิ่มประสิทธิภาพให้กับแบบจำลองที่มีประสิทธิภาพสูงขึ้นเมื่อความมั่นใจลดลง แม้ว่าการดำเนินการแต่ละครั้งอาจดูไม่สำคัญในแง่ของต้นทุน แต่ผลกระทบรวมกันของมันจะกำหนดเศรษฐศาสตร์ของระบบ

4. ทำไมการปรับให้เหมาะสมของ Prompt เพียงอย่างเดียวไม่สามารถแก้ไขปัญหาการใช้จ่ายในขณะทำงาน

การปรับให้เหมาะสมของ Prompt เป็นหนึ่งในวิธีการที่ทีมงานใช้เมื่อพยายามควบคุมค่าใช้จ่าย AI การลดการใช้โทเค็น การปรับปรุงคำสั่ง หรือการปรับปรุงโครงสร้างคำตอบสามารถให้ผลการปรับปรุงประสิทธิภาพที่มีความหมายที่ระดับการเรียกใช้แบบจำลองแต่ละครั้ง การปรับให้เหมาะสมมุ่งเน้นไปที่ส่วนเล็กๆ ของภาพเศรษฐกิจที่กว้างขึ้น ในสภาพแวดล้อมการผลิต ส่วนใหญ่ของความผันผวนของค่าใช้จ่ายถูกขับเคลื่อนโดยรูปแบบพฤติกรรมใน 워크โฟลว์ ไม่ใช่แค่ความยาวของ Prompt

ความไม่มีประสิทธิภาพบ่อยครั้งเกิดขึ้นจากการที่ไม่จำเป็นต้องทำซ้ำ การค้นหาที่ลึกเกินไป การเพิ่มประสิทธิภาพให้กับแบบจำลองที่มีค่าใช้จ่ายสูงขึ้น หรือเอเจนต์ที่ทำงานโดยไม่มีผลกระทบต่อผลลัพธ์ หากไม่มีการมองเห็นในการติดตามการดำเนินการและผลกระทบทางธุรกิจ การปรับให้เหมาะสมของ Prompt สามารถย้ายค่าใช้จ่ายจากส่วนหนึ่งของระบบไปสู่อีกส่วนหนึ่งได้

เมื่อระบบ AI กลายเป็นระบบอัตโนมัติและเชื่อมโยงกันมากขึ้น การจัดการค่าใช้จ่ายต้องใช้การควบคุมระบบที่กำหนดว่าเอเจนต์ทำงานอย่างไรในเวลาจริง ไม่ใช่แค่การปรับให้เหมาะสมในท้องถิ่นในการร้องขอแต่ละครั้ง

การสำรวจ AI FinOps ล่าสุด ที่ครอบคลุมหลายสิบพันล้านดอลลาร์ในค่าใช้จ่ายบนคลาวด์กล่าวถึงการเปลี่ยนแปลงไปสู่การมองเห็นค่าใช้จ่าย AI ในเวลาจริง งบประมาณต่อทีม และการแจ้งเตือนงบประมาณอัตโนมัติ ความคิดคือการรักษาค่าใช้จ่ายให้เป็น SLO การดำเนินการที่ไม่ใช่แค่มาตรการทางการเงิน

5. วิธีการทางสถาปัตยกรรมที่เกิดขึ้นใหม่สำหรับการควบคุมค่าใช้จ่าย AI

เพื่อตอบสนองต่อความผันผวนของค่าใช้จ่ายที่เพิ่มขึ้น องค์กรกำลังคิดใหม่ว่าควรนำการควบคุมทางเศรษฐกิจไปใช้ภายในระบบ AI ที่ไหนและอย่างไร แทนที่จะรักษาการปรับให้เหมาะสมของค่าใช้จ่ายเป็นการออกกำลังกายทางการเงินหลังการดำเนินการ ทีมงานกำลังแนะนำกลไกทางสถาปัตยกรรมที่มีอิทธิพลต่อค่าใช้จ่ายในขณะทำงาน

รูปแบบที่เริ่มเห็นคือการใช้เลเยอร์การ định tuyếnและการจัดลำดับที่เลือกแบบจำลองหรือ 워크โฟลว์แบบไดนามิกตามความซับซ้อนของงาน เป้าหมายความล่าช้า หรือการจำกัดงบประมาณ ซึ่งช่วยให้องค์กรมีความสมดุลระหว่างคุณภาพและประสิทธิภาพโดยไม่ต้องอาศัยตัวเลือกการกำหนดค่าที่คงที่

เส้นทางอื่นๆ ที่ทีมงานใช้ bao gồmการควบคุมการดำเนินการตามนโยบาย กลยุทธ์การทำซ้ำที่ตระหนักถึงค่าใช้จ่าย และการตรวจสอบจากศูนย์ที่มอบค่าใช้จ่ายให้กับ 워크โฟลว์เฉพาะ

การประเมินมักใช้เป็นเครื่องมือในการกำกับดูแล โดยทีมงานส่งเสริมการกำหนดค่าที่ตรงตามเกณฑ์ค่าใช้จ่ายและประสิทธิภาพที่กำหนดไว้ล่วงหน้า

6. ค่าใช้จ่ายเป็นประตูความน่าเชื่อถือถัดไปสำหรับ AI ขององค์กร

เมื่อระบบ AI ถูกฝังอยู่ใน 워์กโฟลว์ทางธุรกิจหลัก องค์กรเริ่มรักษาค่าใช้จ่ายให้เป็นข้อจำกัดในการใช้งานร่วมกับคุณภาพ ความปลอดภัย และความน่าเชื่อถือ เช่นเดียวกับวัตถุประสงค์ระดับบริการที่กำหนดขอบเขตการทำงานที่ยอมรับได้ ขอบเขตเศรษฐศาสตร์หน่วยเป็นข้อกำหนดเบื้องต้นสำหรับการขยายการทำงานอัตโนมัติอย่างปลอดภัย ระบบที่ไม่สามารถตอบสนองโปรไฟล์ค่าใช้จ่ายที่คาดการณ์ได้นั้นยากที่จะให้เหตุผลในการดำเนินการ ไม่ว่าจะมีความสามารถทางเทคนิคอย่างไร

การเปลี่ยนแปลงนี้กระตุ้นทีมงานให้นำ “ประตูค่าใช้จ่าย” มาใช้ก่อนที่จะมีการใช้งานที่กว้างขึ้น โดยได้รับการสนับสนุนจากการตรวจสอบอย่างต่อเนื่องเมื่อระบบอยู่ในขณะทำงาน เมื่อเวลาผ่านไป การจัดการค่าใช้จ่ายมีแนวโน้มที่จะพัฒนาไปสู่วิชาการทางวิศวกรรมที่ดำเนินอยู่ตลอดเวลา ไม่ใช่แค่ความพยายามในการปรับให้เหมาะสมเพียงครั้งเดียว องค์กรที่ขยาย AI ได้สำเร็จที่สุดจะเป็นองค์กรที่ออกแบบสำหรับการควบคุมทางเศรษฐกิจตั้งแต่เริ่มต้น โดยทำให้แน่ใจว่าการปรับปรุงความสามารถใดๆ จะถูกจับคู่กับโมเดลการดำเนินการที่ยั่งยืน

ในระยะถัดไปของการนำ AI ไปใช้ในองค์กร เราอาจเห็นการควบคุมทางเศรษฐกิจกลายเป็นเรื่องพื้นฐานในการออกแบบระบบไม่แพ้กับความน่าเชื่อถือและความปลอดภัย

Sohrab Hosseini, Co-Founder of orq.ai, เป็นผู้นำด้านเทคโนโลยีและนักธุรกิจที่มีประสบการณ์อย่างลึกซึ้งในการพัฒนา SaaS ระบบขนาดใหญ่ และ AI ที่ใช้จริง โดยตั้งอยู่ในพื้นที่อัมสเตอร์ดัม ตั้งแต่การก่อตั้ง orq.ai ในปี 2022 เขาได้มุ่งเน้นไปที่การสร้างโครงสร้างพื้นฐานที่ใช้ได้จริงเพื่อช่วยให้ทีมงานสามารถนำโมเดลภาษาขนาดใหญ่จากการทดลองไปสู่การใช้งานที่เชื่อถือได้ ประวัติของเขาประกอบด้วยบทบาทผู้นำระดับสูงในตำแหน่ง COO และ CTO ที่ Neocles, CTO ของ Future Technology ที่ Transdev ซึ่งเขาทำงานเกี่ยวกับการกำหนดเส้นทางอัตโนมัติและการจัดการฝูงรถ และ COO ที่ TradeYourTrip ในขณะเดียวกัน เขายังทำงานเป็นที่ปรึกษาและนักลงทุนเท่านั้น โดยให้การสนับสนุนบริษัท AI ในระยะเริ่มต้นด้วยทิศทางผลิตภัณฑ์ การตัดสินใจทางเทคนิค และกลยุทธ์การดำเนินการ