الذكاء الاصطناعي

كشف “Tokenmaxxing” عن تحديات التكلفة للذكاء الاصطناعي

mm
Closeup of stacks of gold tokens.

لقد توسعت استخدامات الذكاء الاصطناعي التوليدي مع اندماج المنظمات للذكاء الاصطناعي في عمليات الأعمال. ومع نمو استخداماته، يزداد الحجم من القوة الحاسوبية المطلوبة لدعمه، مما يضع انتباها أكبر على الرموز التي يستهلكها النماذج لمعالجة وتوليد المعلومات. كل استجابة وطلب وعمليات العمل الآلية تعتمد عليها، مما يجعل استهلاك الرمز حاسما في تحديد تكلفة نشر الذكاء الاصطناعي.

هذا ساهم في ظهور “Tokenmaxxing”، ممارسة تعظيم القيمة المستخرجة من نماذج الذكاء الاصطناعي من خلال طلبات أكبر وأحاديث أطول. بينما تظهر هذه التطبيق زيادة القدرات والفائدة لنظم الذكاء الاصطناعي الحديثة، كما يسلط الضوء على التكاليف المتزايدة المرتبطة بمستويات أعلى من استهلاك الرموز.

ما هو Tokenmaxxing؟

ي涉ل “Tokenmaxxing” استخدام طلبات أكبر وتحديد مهام معقدة لنظم الذكاء الاصطناعي. بدلا من تقييد الذكاء الاصطناعي بالأسئلة البسيطة أو الطلبات القصيرة، يقدم المستخدمون سياقات واسعة ويعتمدون على النماذج لإتمام عمليات متعددة في التفاعل الواحد. وقد اكتسب هذا الاتجاه زخما مع تقديم مزودي الذكاء الاصطناعي نوافذ سياق أكبر تسمح للنماذج بمعالجة المزيد من المعلومات في وقت واحد.

كما وسعت النماذج الأكثر قدرة نطاق المهام التي يمكن للذكاء الاصطناعي أداؤها. يشجع هذا المستخدمين والمنظمات على توحيد أنشطة البحث والتحليل ودعم اتخاذ القرارات في طلبات أقل ولكن أكثر تعقيدا. ونتيجة لذلك، أصبح “Tokenmaxxing” استجابة طبيعية للقدرات المتزايدة لنظم الذكاء الاصطناعي الحديثة.

كيف تعمل رموز الذكاء الاصطناعي

رموز الذكاء الاصطناعي هي الوحدات الأساسية للنص التي تستخدم نماذج اللغة لمعالجة وتوليد المعلومات. بدلا من قراءة النص ككلمات كاملة، تنقسم نماذج الذكاء الاصطناعي المحتوى إلى قطع صغيرة قد تشمل كلمات كاملة أو أجزاء من الكلمات أو حروف فردية. وتتضمن التفاعلات مع الذكاء الاصطناعي نوعين رئيسيين من الرموز: الرموز المدخلة والرموز المخرجة. تتكون الرموز المدخلة من الطلبات والسياق الداعم، بينما تمثل الرموز المخرجة النص الذي يتم توليده استجابة.

يستخدم معظم مزودي الذكاء الاصطناعي تسعيرًا قائمًا على الرموز، مما يعني أن الزبائن يتحملون تكاليف حسب عدد الرموز المدخلة والمخرجة المستهلكة. تزداد التكاليف مع طول الطلبات أو تفاصيل الاستجابات أو معالجة التطبيقات لأحجام أكبر من الطلبات. يؤثر استهلاك الرموز على العديد من تطبيقات الذكاء الاصطناعي، بما في ذلك بوتات الدعم الفني وادوات البحث المدعومة بالذكاء الاصطناعي، مما يجعل استخدام الرموز مهمًا لتكلفة النشر.

لماذا يصبح ارتفاع تكاليف الرموز مشكلة

مع توسع استخدام الذكاء الاصطناعي التوليدي، يزداد استهلاك الرموز بشكل أسرع من المتوقع. ما يبدأ كتكلفة تشغيل قابلة للإدارة يمكن أن يصبح تحديًا كبيرًا للتكلفة بسرعة مع توسع حمولات الذكاء الاصطناعي عبر الفرق والعمليات التجارية.

الطلب المتزايد على قوة معالجة الذكاء الاصطناعي

يؤدي توسع استخدام الذكاء الاصطناعي إلى زيادة حادة في تكاليف الاستدلال مع الاعتماد المتزايد للأفراد والمنظمات على أدوات مدعومة بالذكاء الاصطناعي طوال اليوم. في الواقع، 26% من الأمريكيين يبلغون عن التفاعل معهم عدة مرات يوميًا، سواء من خلال المساعدين الافتراضيين أو محركات التوصية. ومع نمو الاستخدام، يجب على مزودي الذكاء الاصطناعي معالجة المزيد من الطلبات، مما يؤدي إلى زيادة الطلبات الحاسوبية واستهلاك الرموز.

في الوقت نفسه، تزيد نوافذ السياق الأكبر وقدرات الوسائط المتعددة من كمية المعلومات التي يجب على النماذج معالجتها خلال كل تفاعل. يمكن للمستخدمين الآن تحميل مستندات طويلة وصور مع توقع استجابات مفصلة وواعية للسياق.

تزيد وكلاء الذكاء الاصطناعي من هذه التكاليف من خلال إجراء مكالمات متعددة للنماذج، واسترجاع المعلومات، وأداء عمليات التفكير المتعددة في الخلفية. ما يبدو وكأنه طلب مستخدم واحد يمكن أن يشمل في الواقع تفاعلات متعددة مع الذكاء الاصطناعي، مما يزيد من استهلاك الرموز وتكاليف التشغيل.

التحديات التجارية الناجمة عن التسعير القائم على الرموز

يظل التنبؤ بنفقات الذكاء الاصطناعي تحديًا بسبب تقلبات استهلاك الرموز مع تغيير أنماط الاستخدام. يمكن لمشروع يبدو كفء من حيث التكلفة خلال الاختبار أن يولد نفقات أعلى بشكل كبير بمجرد نشره عبر المنظمة. يمكن للطلب الموسمي وزيادة حمولات الذكاء الاصطناعي أن يجعل من الصعب توقع الإنفاق الشهري.

كما يواجه العديد من الشركات مفارقة أن النشرات الناجحة للذكاء الاصطناعي تؤدي إلى زيادة في التكاليف التشغيلية. مع تحول الشركات إلى وكلاء الذكاء الاصطناعي لتعزيز الإنتاجية وتحسين المزيد من المهام، يمكن أن ترتفع التكاليف الإجمالية بشكل حاد حتى لو انخفضت تكلفة كل رمز. يقوم وكلاء الذكاء الاصطناعي بأفعال متعددة في الخلفية، مما يؤدي إلى زيادة استهلاك الرموز بسرعة مع نمو الاستخدام.

أثارت هذه الاتجاهات مخاوف بشأن الربحية وحوكمة الشركات للذكاء الاصطناعي. يجب على الشركات تحديد كيفية توزيع التكاليف عبر الإدارات وضمان أن استثمارات الذكاء الاصطناعي تؤدي قيمة قابلة للقياس. وفي الوقت نفسه، تواجه تحديًا مستمرًا في موازنة أداء النموذج مع الكفاءة التكلفة، حيث تأتي النماذج الأكثر قدرة مع أعلى التكاليف التشغيلية.

كيف تقلل الشركات من نفقات رموز الذكاء الاصطناعي

أدى ارتفاع تكاليف الرموز إلى حث الشركات على البحث عن طرق لتعظيم قيمة استثماراتها في الذكاء الاصطناعي دون التضحية بالأداء. مع توسع استخدام الذكاء الاصطناعي، تنفذ استراتيجيات متنوعة للسيطرة على استهلاك الرموز والحفاظ على تكاليف تشغيل متوقعة.

استراتيجيات التحسين لمستخدمي الذكاء الاصطناعي

تقلل الشركات من استهلاك الرموز من خلال تقنيات هندسة الطلب التي تقوم بإزالة النص غير الضروري وتحسين الكفاءة. يمكن أن توليد طلبات واضحة ومحددة ونمطيات معيارية نتائج أفضل باستخدام رموز أقل. كما تستخدم العديد من الشركات توجيه النموذج، حيث تتعامل النماذج الأصغر والأقل تكلفة مع المهام الروتينية وتحفظ النماذج المتقدمة للمهام المعقدة التي تتطلب قدرات تفكير أعلى.

تعتبر التوليد المعزز بالاسترجاع استراتيجية شائعة أخرى لأنها تسترجع فقط المعلومات الأكثر صلة بدلا من إرسال كميات أكبر من السياق مع كل طلب. يقلل هذا النهج من استهلاك الرموز مع الحفاظ على الدقة. لتحديد التكاليف بشكل أكبر، تنفذ المنظمات أدوات مراقبة وإطارات حوكمة للذكاء الاصطناعي التي توفر رؤية في أنماط الاستهلاك ودعم تبني الذكاء الاصطناعي المسؤول.

التنازلات العملية بين التكلفة والأداء

تختار الشركات نماذج الذكاء الاصطناعي الأقل تكلفة لمهام روتينية مثل تلخيص والتصنيف واستخراج البيانات، حيث قد توفر القدرات العقلية المتميزة قيمة إضافية محدودة. يمكن أن تؤثر اعتبارات التكلفة أيضًا على قرارات استراتيجية أوسع.

على سبيل المثال، أوقفت مايكروسوفت據ًا عن تراخيص كلود كود لأنها لا تريد استئجار ذكاء المنافس. بدلا من ذلك، توجه المطورين نحو نموذج الترميز المحلي مصمم للطيار. تعكس قرارات مثل هذه الجهود المتزايدة لتقليل نفقات الذكاء الاصطناعي مع الحفاظ على السيطرة على الاستثمارات التكنولوجية.

然而، يمكن أن يؤدي التخفيض المفرط للتكاليف إلى إحداث تحديات جديدة. قد تنتج النماذج الأقل تكلفة نتائج أقل دقة أو تتطلب إشرافًا بشريًا إضافيًا، مما يقلل من بعض المدخرات المتوقعة. يجب على الشركات تقييم عوامل مثل تعقيد المهمة والآثار التجارية عند اختيار نماذج الذكاء الاصطناعي. الهدف هو موازنة الكفاءة والأداء، مع ضمان أن تخفيضات التكلفة لا تتم على حساب الجودة أو تجربة المستخدم.

كيف يستجيب مزودو الذكاء الاصطناعي

يقدم مزودو الذكاء الاصطناعي خيارات نموذجية متدرجة وتركيبات تسعير مرنة لاستيعاب أنماط استخدام مختلفة وميزانيات. يمكن للشركات اختيار نماذج بأداء وتكلفة متغيرة، مما يسمح لهم بمطابقة قدرات الذكاء الاصطناعي لاحتياجات العمل الخاصة.

على سبيل المثال، توفر OpenAI خطط اشتراك للمستخدمين الذين يريدون الوصول المتوقع والإنفاق الشهري المستقر. كما تقدم تسعيرًا قائمًا على الرموز للعملاء الذين لديهم أحمال عمل أثقل أو أقل قابلية للتوقع.

خارج الفواتير التقليدية القائمة على الاستخدام، يجرّب بعض المزودين مع نماذج التسعير الشهري والقائمة على المهام التي تجعل التكاليف أسهل في التنبؤ. وفي الوقت نفسه، تكتسب النماذج المفتوحة المصدر والتنصيبات المضيفة شعبية كبديل للتسعير القائم على الرموز. يمكن أن توفر هذه الخيارات للشركات سيطرة أكبر على التكاليف التشغيلية والبنية التحتية، على الرغم من أنها تتطلب خبرة تقنية إضافية وموارد حاسوبية لإدارتها بشكل فعال.

موازنة أداء الذكاء الاصطناعي والإنفاق

مع توسع استخدام الذكاء الاصطناعي، يخلق استهلاك الرموز المتزايد تحديات جديدة للتكاليف للشركات ومزودي الذكاء الاصطناعي. تستجيب الشركات باستراتيجيات مثل تحسين الطلب وتوجيه النموذج وممارسات الحوكمة الأقوى للسيطرة على نفقات “Tokenmaxxing” مع الحفاظ على الأداء. ونتيجة لذلك، يصبح فهم اقتصاديات الرموز جزءًا أساسيًا من نجاح نشر وتشغيل تكنولوجيا الذكاء الاصطناعي.

Zac Amos هو كاتب تقني يركز على الذكاء الاصطناعي. وهو أيضًا محرر الميزات في ReHack، حيث يمكنك قراءة المزيد من أعماله.