สัมภาษณ์
Neetu Pathak, ผู้ร่วมก่อตั้งและซีอีโอของ Skymel – สัมภาษณ์ซีรีส์

Neetu Pathak, ผู้ร่วมก่อตั้งและซีอีโอของ Skymel, นำบริษัทในการปฏิวัติ AI inference ด้วยเทคโนโลยี NeuroSplit™ ที่เป็นนวัตกรรมใหม่ ร่วมกับ CTO Sushant Tripathy เธอขับเคลื่อนภารกิจของ Skymel ในการปรับปรุงประสิทธิภาพของ AI application ในขณะเดียวกันก็ลดค่าใช้จ่ายในการคำนวณ
NeuroSplit™ เป็นเทคโนโลยีการอนุมานแบบปรับเปลี่ยนได้ซึ่งกระจายการทำงานของ AI ระหว่างอุปกรณ์ของผู้ใช้และเซิร์ฟเวอร์คลาวด์อย่างไดนามิก วิธีการนี้ใช้ทรัพยากรการคำนวณที่ไม่ได้ใช้งานบนอุปกรณ์ของผู้ใช้ ลดค่าใช้จ่ายโครงสร้างพื้นฐานคลาวด์ถึง 60% เร่งความเร็วในการอนุมาน รับประกันความเป็นส่วนตัวของข้อมูล และทำให้สามารถปรับขนาดได้อย่างราบรื่น
โดยการเพิ่มประสิทธิภาพพลังการคำนวณท้องถิ่น NeuroSplit™ ช่วยให้ AI application สามารถทำงานได้อย่างมีประสิทธิภาพแม้บน GPU ที่เก่ากว่า ลดค่าใช้จ่ายอย่างมากในขณะเดียวกันก็ปรับปรุงประสบการณ์ของผู้ใช้
สิ่งใดที่สร้างแรงบันดาลใจให้คุณร่วมก่อตั้ง Skymel และสิ่งใดคือความท้าทายหลักในโครงสร้างพื้นฐาน AI ที่คุณพยายามแก้ไขด้วย NeuroSplit?
แรงบันดาลใจในการก่อตั้ง Skymel มาจากการมาบรรจบกันของประสบการณ์ที่เสริมซึ่งกันและกันของเรา ในระหว่างที่เขาทำงานที่ Google ผู้ร่วมก่อตั้งของฉัน Sushant Tripathy ได้ติดตั้งโมเดล AI ที่ใช้เสียงบนอุปกรณ์ Android หลายพันล้านเครื่อง เขาพบว่ามีทรัพยากรการคำนวณที่ไม่ได้ใช้งานจำนวนมากบนอุปกรณ์ของผู้ใช้ แต่บริษัทส่วนใหญ่ไม่สามารถใช้ทรัพยากรเหล่านี้ได้อย่างมีประสิทธิภาพเนื่องจากความท้าทายด้านวิศวกรรมที่ซับซ้อนในการเข้าถึงทรัพยากรเหล่านี้โดยไม่กระทบต่อประสบการณ์ของผู้ใช้
ในขณะเดียวกัน ประสบการณ์ของฉันในการทำงานกับองค์กรและสตาร์ทอัพที่ Redis ทำให้ฉันเข้าใจถึงความสำคัญของความล่าช้าในการดำเนินธุรกิจ เมื่อ AI application กลายเป็นที่นิยมมากขึ้น ก็ชัดเจนว่าเราต้องย้ายการประมวลผลไปที่ใกล้กับจุดที่ข้อมูลถูกสร้างขึ้น มากกว่าที่จะส่งต่อข้อมูลไปมาระหว่างศูนย์ข้อมูล
นั่นคือเมื่อ Sushant และฉันตระหนักว่าอนาคตไม่ได้เกี่ยวกับการเลือกระหว่างการประมวลผลท้องถิ่นหรือการประมวลผลบนคลาวด์ แต่เกี่ยวกับการสร้างเทคโนโลยีที่ฉลาดที่สามารถปรับเปลี่ยนได้อย่างราบรื่นระหว่างการประมวลผลท้องถิ่น คลาวด์ หรือไฮบริดตามคำขออนุมานเฉพาะ นี้นำเราไปสู่การก่อตั้ง Skymel และพัฒนา NeuroSplit โดยพ้นจากข้อจำกัดโครงสร้างพื้นฐานแบบดั้งเดิมที่ขัดขวางนวัตกรรม AI
คุณสามารถอธิบายได้อย่างไรว่า NeuroSplit ปรับเปลี่ยนทรัพยากรการคำนวณได้อย่างไรในขณะเดียวกันก็รักษาความเป็นส่วนตัวและประสิทธิภาพของผู้ใช้?
หนึ่งในข้อเสียหลักของการอนุมาน AI ท้องถิ่นคือความต้องการการคำนวณแบบคงที่ – การทำงาน AI แบบดั้งเดิมต้องการทรัพยากรการคำนวณเท่าเดิมโดยไม่คำนึงถึงสภาพของอุปกรณ์หรือพฤติกรรมของผู้ใช้ วิธีการแบบหนึ่งขนาดที่เหมาะกับทุกคนนี้เพิกเฉยต่อความเป็นจริงที่ว่าอุปกรณ์มีความสามารถฮาร์ดแวร์ที่แตกต่างกัน ตั้งแต่ชิปต่างๆ (GPU, NPU, CPU, XPU) ไปจนถึงแบนด์วิธเครือข่ายที่แตกต่างกัน และผู้ใช้มีพฤติกรรมที่แตกต่างกันในแง่ของการใช้งานแอปพลิเคชันและรูปแบบการชาร์จ
NeuroSplit ติดตามตัววัดอุปกรณ์ต่างๆ ตั้งแต่ความสามารถฮาร์ดแวร์ไปจนถึงการใช้ทรัพยากรปัจจุบัน สถานะแบตเตอรี่ และสภาพเครือข่าย เรายังคำนึงถึงรูปแบบพฤติกรรมของผู้ใช้ เช่น จำนวนแอปพลิเคชันอื่นๆ ที่กำลังทำงานและรูปแบบการใช้อุปกรณ์ทั่วไป การติดตามที่ครอบคลุมนี้ช่วยให้ NeuroSplit สามารถกำหนดได้อย่างไร้ว่าสามารถประมวลผลอนุมานได้มากเพียงใดบนอุปกรณ์ของผู้ใช้โดยการเพิ่มประสิทธิภาพสำหรับ KPI ของนักพัฒนา
เมื่อความเป็นส่วนตัวของข้อมูลมีความสำคัญสูงสุด NeuroSplit รับประกันว่าข้อมูลดิบจะไม่ออกจากอุปกรณ์ โดยประมวลผลข้อมูลที่ละเอียดอ่อนท้องถิ่นในขณะเดียวกันก็รักษาความเร็วในการประมวลผลที่เหมาะสม ความสามารถของเราในการแบ่งแยกแบบฉลาด การตัดทอนหรือการแยกโมเดล AI ช่วยให้เราสามารถใส่โมเดล AI สตับ 50-100 โมเดลในพื้นที่หน่วยความจำของโมเดลที่ปรับขนาดเพียงหนึ่งอันบนอุปกรณ์ของผู้ใช้ ในแง่ปฏิบัติ นี่หมายความว่าผู้ใช้สามารถทำงาน AI ที่ขับเคลื่อนได้หลายแอปพลิเคชันพร้อมๆ กัน โดยประมวลผลข้อมูลที่ละเอียดอ่อนท้องถิ่น เมื่อเทียบกับวิธีการคำนวณแบบคงที่แบบดั้งเดิม
ผลประโยชน์หลักๆ ของการอนุมานแบบปรับเปลี่ยนได้ของ NeuroSplit สำหรับบริษัท AI โดยเฉพาะอย่างยิ่งสำหรับบริษัทที่ทำงานกับเทคโนโลยี GPU ที่เก่ากว่าคืออะไร?
NeuroSplit มอบผลประโยชน์เชิงปฏิวัติสามประการสำหรับบริษัท AI ประการแรก มันลดค่าใช้จ่ายโครงสร้างพื้นฐานผ่านกลไกสองประการ: บริษัทสามารถใช้ GPU ที่ถูกกว่าและเก่ากว่าได้อย่างมีประสิทธิภาพ และความสามารถเฉพาะตัวของเราในการใส่โมเดลทั้งแบบเต็มและแบบสตับบน GPU คลาวด์ทำให้สามารถใช้ GPU ได้สูงขึ้นอย่างมีนัยสำคัญ ตัวอย่างเช่น แอปพลิเคชันที่ต้องการ NVIDIA A100 หลายตัวที่ 2.74 ดอลลาร์ต่อชั่วโมงสามารถทำงานบน A100 เพียงตัวเดียวหรือ V100 หลายตัวที่เพียง 0.83 ดอลลาร์ต่อชั่วโมง
ประการสอง มันปรับปรุงประสิทธิภาพอย่างมากโดยการประมวลผลข้อมูลดิบเบื้องต้นโดยตรงบนอุปกรณ์ของผู้ใช้ ซึ่งหมายความว่าข้อมูลที่เดินทางไปยังคลาวด์ในที่สุดมีขนาดเล็กกว่ามาก ลดความล่าช้าเครือข่ายอย่างมากในขณะเดียวกันก็รักษาความแม่นยำไว้ วิธีการแบบไฮบริดนี้ทำให้บริษัทได้รับสิ่งที่ดีที่สุดของทั้งสองโลก – ความเร็วของการประมวลผลท้องถิ่นและพลังของการประมวลผลบนคลาวด์
ประการที่สาม โดยการประมวลผลข้อมูลเบื้องต้นอย่างละเอียดอ่อนบนอุปกรณ์ของผู้ใช้ เราช่วยให้บริษัทสามารถรักษาความเป็นส่วนตัวของผู้ใช้ได้โดยไม่กระทบต่อประสิทธิภาพ ซึ่งจำเป็นมากขึ้นเมื่อข้อบังคับด้านความเป็นส่วนตัวมีความเข้มงวดและผู้ใช้ให้ความสำคัญกับความเป็นส่วนตัวมากขึ้น
Skymel วางแผนจะลดค่าใช้จ่ายสำหรับการอนุมาน AI โดยไม่กระทบต่อความซับซ้อนหรือความแม่นยำของโมเดลได้อย่างไร?
ประการแรก โดยการแบ่งโมเดล AI แต่ละตัว เรากระจายการคำนวณระหว่างอุปกรณ์ของผู้ใช้และคลาวด์ ส่วนแรกทำงานบนอุปกรณ์ของผู้ใช้ จัดการ 5% ถึง 100% ของการคำนวณทั้งหมดขึ้นอยู่กับทรัพยากรอุปกรณ์ที่มีอยู่ ส่วนการคำนวณที่เหลือต้องประมวลผลบน GPU คลาวด์
การแบ่งนี้หมายความว่า GPU คลาวด์จัดการภาระการคำนวณที่ลดลง – หากโมเดลต้องการ GPU A100 เต็มหนึ่งตัว การแบ่งโมเดลจะทำให้การทำงานนั้นต้องการเพียง 30-40% ของความสามารถของ GPU
ประการที่สอง NeuroSplit เพิ่มประสิทธิภาพการใช้ GPU ในคลาวด์ โดยการจัดเรียงโมเดลทั้งแบบเต็มและแบบสตับ (ส่วนที่เหลือของโมเดลที่แบ่ง) บน GPU คลาวด์เดียวกัน เราบรรลุอัตราการใช้ GPU ที่สูงกว่าเมื่อเทียบกับวิธีการแบบดั้งเดิม ซึ่งหมายความว่าสามารถทำงานโมเดลได้มากขึ้นพร้อมๆ กันบน GPU คลาวด์เดียวกัน ลดค่าใช้จ่ายต่อการอนุมาน
สิ่งใดที่ทำให้ Skymel แตกต่างจากโซลูชันโครงสร้างพื้นฐาน AI อื่นๆ ในตลาด?
ภูมิทัศน์ AI อยู่ที่จุดเปลี่ยนเชิงกลยุทธ์ ในขณะที่ Apple, Samsung และ Qualcomm กำลังแสดงพลังของ AI แบบไฮบริดผ่านคุณสมบัติของระบบนิเวศของตน แต่สิ่งเหล่านี้ยังคงเป็นสวนรั้วที่ปิด
NeuroSplit มีเอกลักษณ์เฉพาะตัวในด้านอุปกรณ์ คลาวด์ และโครงสร้างพื้นฐานของโมเดล AI นี่หมายความว่านักพัฒนาสามารถส่งมอบประสบการณ์ AI ที่สอดคล้องกันโดยไม่คำนึงถึงว่าผู้ใช้ของพวกเขากำลังใช้อุปกรณ์ iPhone, Android, หรือแล็ปท็อป – หรือว่าพวกเขากำลังใช้ AWS, Azure หรือ Google Cloud
ลองนึกภาพสิ่งนี้สำหรับนักพัฒนา พวกเขาสามารถสร้างแอปพลิเคชัน AI หนึ่งครั้งและรู้ว่ามันจะปรับเปลี่ยนได้อย่างชาญฉลาดบนอุปกรณ์ใดๆ คลาวด์ใดๆ และโครงสร้างพื้นฐานของโมเดล AI ใดๆ ไม่ต้องสร้างหลายเวอร์ชันสำหรับแพลตฟอร์มต่างๆ หรือประนีประนอมคุณสมบัติตามความสามารถของอุปกรณ์
เรากำลังนำความสามารถ AI แบบไฮบริดระดับองค์กรออกจากสวนรั้วและทำให้สามารถเข้าถึงได้ทั่วๆ ไป เมื่อ AI กลายเป็นศูนย์กลางของทุกแอปพลิเคชัน ความยืดหยุ่นและความสอดคล้องนี้ไม่เพียงแต่เป็นข้อได้เปรียบเท่านั้น แต่ยังจำเป็นต่อการสร้างนวัตกรรม
เอเจนต์ Orchestrator มีบทบาทอย่างไรในการเสริม NeuroSplit และมีบทบาทอย่างไรในการเปลี่ยนแปลงกลยุทธ์การใช้งาน AI?
เอเจนต์ Orchestrator (OA) และ NeuroSplit ทำงานร่วมกันเพื่อสร้างระบบการปรับเปลี่ยน AI ที่ปรับเปลี่ยนได้ด้วยตนเอง:
1. นักพัฒนากำหนดขอบเขต:
- ข้อจำกัด: โมเดลที่อนุญาต เวอร์ชัน ผู้ให้บริการคลาวด์ โซน กฎการปฏิบัติตาม
- เป้าหมาย: ความล่าช้าที่ต้องการ ขีดจำกัดต้นทุน คุณสมบัติประสิทธิภาพ ความต้องการด้านความเป็นส่วนตัว
2. OA ทำงานภายในข้อจำกัดเหล่านี้เพื่อบรรลุเป้าหมาย:
- ตัดสินใจว่าจะใช้โมเดลหรือ API ใดสำหรับการร้องขอแต่ละครั้ง
- ปรับกลยุทธ์การใช้งานตามประสิทธิภาพในโลกแห่งความเป็นจริง
- ทำการตัดสินใจโดยการแลกเปลี่ยนเพื่อเพิ่มประสิทธิภาพสำหรับเป้าหมายที่ระบุ
- สามารถกำหนดค่าใหม่ได้ทันทีเมื่อความต้องการเปลี่ยนแปลง
3. NeuroSplit ใช้การตัดสินใจของ OA:
- ใช้ข้อมูลทelemetry ของอุปกรณ์แบบเรียลไทม์เพื่อเพิ่มประสิทธิภาพการทำงาน
- แบ่งการประมวลผลระหว่างอุปกรณ์และคลาวด์เมื่อมีประโยชน์
- รับประกันว่าการอนุมานแต่ละครั้งทำงานได้อย่างเหมาะสมที่สุดตามสถานการณ์ปัจจุบัน
มันเหมือนกับการมีระบบ AI ที่ปรับเปลี่ยนได้ด้วยตนเองภายในกฎและเป้าหมายที่คุณกำหนดไว้ แทนที่จะต้องปรับให้เหมาะสมด้วยตนเองสำหรับทุกๆ สzenario
ในความคิดของคุณ เอเจนต์ Orchestrator จะเปลี่ยนแปลงวิธีการใช้งาน AI ในอุตสาหกรรมต่างๆ อย่างไร?
มันแก้ไขความท้าทายที่สำคัญสามประการที่ขัดขวางการนำ AI ไปใช้และนวัตกรรม
ประการแรก มันช่วยให้บริษัทต่างๆ ตามกระแสความก้าวหน้าล่าสุดของ AI ได้อย่างง่ายดาย ด้วยเอเจนต์ Orchestrator คุณสามารถใช้โมเดลและเทคนิคใหม่ๆ ได้ทันทีโดยไม่ต้องเปลี่ยนแปลงโครงสร้างพื้นฐาน นี่คือความได้เปรียบทางการแข่งขันที่สำคัญในโลกที่นวัตกรรม AI กำลังเคลื่อนไหวอย่างรวดเร็ว
ประการที่สอง มันทำให้สามารถเลือกโมเดล AI ได้อย่างมีประสิทธิภาพสำหรับการร้องขอแต่ละครั้ง เอเจนต์ Orchestrator สามารถผสมผสานโมเดลจากระบบนิเวศที่กว้างขวางเพื่อให้ผลลัพธ์ที่ดีที่สุดสำหรับการโต้ตอบของผู้ใช้แต่ละครั้ง ตัวอย่างเช่น AI สำหรับการบริการลูกค้าสามารถใช้โมเดลที่มีความเชี่ยวชาญสำหรับคำถามทางเทคนิคและอีกโมเดลหนึ่งสำหรับคำถามเกี่ยวกับการเรียกเก็บเงิน โดยส่งมอบผลลัพธ์ที่ดีกว่าสำหรับแต่ละประเภทของการโต้ตอบ
ประการที่สาม มันเพิ่มประสิทธิภาพการทำงานสูงสุดในขณะเดียวกันก็ลดค่าใช้จ่ายให้เหลือน้อยที่สุด เอเจนต์จะปรับสมดุลโดยอัตโนมัติระหว่างการทำงาน AI บนอุปกรณ์ของผู้ใช้หรือบนคลาวด์ตามสิ่งที่เหมาะสมที่สุดในขณะนั้น เมื่อความเป็นส่วนตัวมีความสำคัญ มันประมวลผลข้อมูลท้องถิ่น เมื่อต้องการพลังการคำนวณเพิ่มเติม มันใช้คลาวด์ ทั้งหมดนี้เกิดขึ้นเบื้องหลังเพื่อสร้างประสบการณ์ที่ราบรื่นสำหรับผู้ใช้ ในขณะเดียวกันก็เพิ่มประสิทธิภาพทรัพยากรสำหรับธุรกิจ
แต่สิ่งที่ทำให้เอเจนต์ Orchestrator แตกต่างออกไปคือความสามารถในการช่วยให้ธุรกิจสร้างประสบการณ์ที่ปรับเปลี่ยนให้เหมาะสมส่วนบุคคลสำหรับผู้ใช้ของตน ตัวอย่างเช่น แพลตฟอร์มการเรียนรู้ออนไลน์ – ด้วยเทคโนโลยีของเรา พวกเขาสามารถสร้างระบบที่ปรับเปลี่ยนแนวทางสอนตามระดับการเข้าใจของนักเรียนแต่ละคน เมื่อผู้ใช้ค้นหา “การเรียนรู้ของเครื่อง” แพลตฟอร์มไม่เพียงแสดงผลลัพธ์ทั่วไปเท่านั้น แต่ยังประเมินความเข้าใจปัจจุบันของพวกเขาและปรับคำอธิบายโดยใช้แนวคิดที่พวกเขารู้จักแล้ว
สุดท้าย เอเจนต์ Orchestrator แสดงถึงอนาคตของการปรับใช้ AI – การเปลี่ยนแปลงจากโครงสร้างพื้นฐาน AI แบบคงที่ไปสู่การกำกับดูแล AI แบบปรับเปลี่ยนได้และปรับเปลี่ยนได้ด้วยตนเอง มันไม่เพียงแต่ทำให้การปรับใช้ AI ง่ายขึ้นเท่านั้น แต่ยังช่วยให้สามารถสร้างแอปพลิเคชัน AI ใหม่ๆ ได้อีกด้วย
คุณได้รับคำติชมอย่างไรจากบริษัทที่เข้าร่วมในการทดสอบเบต้าแบบส่วนตัวของเอเจนต์ Orchestrator?
คำติชมจากผู้เข้าร่วมการทดสอบเบต้าแบบส่วนตัวนั้นยอดเยี่ยม! บริษัทต่างๆ ตื่นเต้นที่จะพบว่าพวกเขาสามารถหลีกหนีจากโครงสร้างพื้นฐานที่มีการล็อกอินได้ ไม่ว่าจะเป็นโมเดลที่เป็นกรรมสิทธิ์หรือบริการโฮสติ้ง ความสามารถในการป้องกันการเปลี่ยนแปลงใดๆ ในการตัดสินใจในการใช้งานได้ถือเป็นการเปลี่ยนแปลงเกม โดยกำจัดงานที่น่ากลัวหลายเดือนเมื่อเปลี่ยนแนวทาง
ผลลัพธ์ประสิทธิภาพของ NeuroSplit นั้นน่าประทับใจมาก – เรารอไม่ไหวที่จะแบ่งปันข้อมูลเหล่านี้ต่อสาธารณะเร็วๆ นี้ สิ่งที่น่าตื่นเต้นเป็นพิเศษคือวิธีการที่แนวคิดเรื่องการปรับใช้ AI แบบปรับเปลี่ยนได้ได้ครอบงำจินตนาการ โดยเฉพาะอย่างยิ่งเมื่อ AI นั้นกำลังปรับใช้ตัวเอง มันฟังดูเหมือนอนาคตและไม่ใช่สิ่งที่พวกเขาคาดหวังในขณะนี้ ดังนั้นเพียงแค่ความก้าวหน้าทางเทคโนโลยีก็ทำให้ผู้คนตื่นเต้นกับโอกาสและตลาดใหม่ที่อาจเกิดขึ้นในอนาคต
ด้วยความก้าวหน้าอย่างรวดเร็วในด้าน AI ที่สร้างสรรค์ คุณเห็นว่าความท้าทายหลักๆ สำหรับโครงสร้างพื้นฐาน AI คืออะไร และ Skymel วางแผนจะแก้ไขสิ่งเหล่านี้ได้อย่างไร?
เรากำลังจะเข้าสู่อนาคตที่ส่วนใหญ่ยังไม่เข้าใจ: จะไม่มีโมเดล AI ที่โดดเด่นเพียงตัวเดียว แต่มีหลายพันล้านโมเดล แม้ว่าเราจะสร้างโมเดล AI ทั่วไปที่ทรงพลังที่สุดที่สามารถจินตนาการได้ เราก็ยังคงต้องการรุ่นที่ปรับเปลี่ยนให้เหมาะสมสำหรับบุคคลทุกคนบนโลกนี้ แต่ละคนปรับให้เหมาะสมตามบริบทที่ไม่เหมือนใคร ความชอบ และความต้องการ นั่นคืออย่างน้อย 8,000 ล้านโมเดล ตามจำนวนประชากรของโลก
สิ่งนี้แสดงถึงการเปลี่ยนแปลงที่สำคัญจากแนวทางแบบหนึ่งขนาดที่เหมาะกับทุกคนในปัจจุบัน อนาคตต้องการโครงสร้างพื้นฐานที่ฉลาดที่สามารถจัดการโมเดลหลายพันล้านโมเดลได้ ที่ Skymel โครงสร้างพื้นฐานทางเทคโนโลยีของเรากำลังสร้างรากฐานสำหรับสิ่งที่จะเกิดขึ้นต่อไป
คุณเห็นโครงสร้างพื้นฐาน AI วิวัฒนาการอย่างไรในอีกห้าปี และ Skymel จะมีบทบาทอย่างไรในการเปลี่ยนแปลงนี้?
ภูมิทัศน์ของโครงสร้างพื้นฐาน AI กำลังจะเปลี่ยนแปลงไปอย่างมาก ในขณะที่การมุ่งเน้นในปัจจุบันคือการขยายโมเดลภาษาขนาดใหญ่บนคลาวด์ ห้าปีหน้าจะเห็น AI ที่กลายเป็นส่วนตัวและตระหนักถึงบริบทมากขึ้น สิ่งนี้ไม่เพียงแต่เกี่ยวกับการปรับแต่งเท่านั้น แต่ยังเกี่ยวกับ AI ที่ปรับให้เหมาะสมกับผู้ใช้เฉพาะ อุปกรณ์ และสถานการณ์ในเวลาจริง
การเปลี่ยนแปลงนี้สร้างความท้าทายโครงสร้างพื้นฐานสองประการ ประการแรก วิธีการแบบดั้งเดิมในการทำงานทุกอย่างในศูนย์ข้อมูลกลางจะไม่ยั่งยืน ทั้งในด้านเทคนิคและเศรษฐกิจ ประการที่สอง ความซับซ้อนของ AI application ที่เพิ่มขึ้นหมายความว่าเราต้องการโครงสร้างพื้นฐานที่สามารถปรับเปลี่ยนได้อย่างมีประสิทธิภาพระหว่างหลายโมเดล อุปกรณ์ และสถานที่คำนวณ
ที่ Skymel เรากำลังสร้างโครงสร้างพื้นฐานที่จัดการกับความท้าทายเหล่านี้โดยเฉพาะ เทคโนโลยีของเราสามารถทำงาน AI ได้ทุกที่ที่มีเหตุผล – ไม่ว่าจะเป็นบนอุปกรณ์ที่ข้อมูลถูกสร้างขึ้น ในคลาวด์ที่มีพลังการคำนวณมากขึ้น หรือการแบ่งส่วนอย่างชาญฉลาดระหว่างทั้งสองส่วน สิ่งสำคัญคือโครงสร้างพื้นฐานนี้ปรับเปลี่ยนการตัดสินใจเหล่านี้ในเวลาจริงตามสภาพและข้อกำหนดที่เปลี่ยนแปลง
เมื่อมองไปข้างหน้า แอปพลิเคชัน AI ที่ประสบความสำเร็จจะไม่ได้ถูกกำหนดโดยขนาดของโมเดลหรือปริมาณการคำนวณที่สามารถเข้าถึงได้ แต่จะถูกกำหนดโดยความสามารถในการส่งมอบประสบการณ์ที่ปรับเปลี่ยนให้เหมาะสมส่วนบุคคลในขณะเดียวกันก็จัดการทรัพยากรอย่างมีประสิทธิภาพ เป้าหมายของเราคือการทำให้การเพิ่มประสิทธิภาพที่ชาญฉลาดนี้สามารถเข้าถึงได้สำหรับแอปพลิเคชัน AI ทุกประเภท โดยไม่คำนึงถึงขนาดหรือความซับซ้อน
ขอขอบคุณสำหรับการสัมภาษณ์ที่ยอดเยี่ยม ผู้อ่านสามารถเยี่ยมชม Skymel เพื่อเรียนรู้เพิ่มเติม.












