قادة الفكر
نماذج LLM المخصصة لكل عمل؟ يظهر DeepSeek لنا الطريق

في الماضي، كان نداء التكنولوجيا “هواتف محمولة للجميع” – وبالفعل، غيّرت الاتصالات المحمولة العالم (والأعمال). اليوم، المكافئ لذلك النداء هو إعطاء الجميع الوصول إلى تطبيقات الذكاء الاصطناعي. لكن القوة الحقيقية للذكاء الاصطناعي تكمن في استخدامه لاحتياجات الأعمال والمنظمات المحددة. المسار الذي يفتحه شركة DeepSeek الصينية يظهر كيف يمكن استخdam الذكاء الاصطناعي من قبل الجميع، خاصة أولئك الذين لديهم ميزانيات محدودة، لتلبية احتياجاتهم المحددة. في الواقع، وعد وصول الذكاء الاصطناعي بتكلفة أقل بتغيير النمط المتجذّر لتطبيقات الذكاء الاصطناعي التي غالبًا ما تبقى خارج نطاق الرؤية ل许多 الشركات الصغيرة والمنظمات بسبب متطلبات التكلفة.
نماذج LLM هي – أو كانت – مبادرة باهظة الثمن، تتطلب الوصول إلى كميات هائلة من البيانات، وأعدادًا كبيرة من الحواسيب القوية لمعالجة البيانات، والوقت والموارد المستثمرة في تدريب النموذج. لكن هذه القواعد تتغير. تعمل شركة DeepSeek على ميزانية مقيدة، طوّرت نموذج LLM خاص بها، وتطبيقًا من نوع ChatGPT للاستفسارات – بتكلفة أقل بكثير من تلك للتطبيقات المماثلة التي بنيتها الشركات الأمريكية والأوروبية. يفتح نهج DeepSeek نافذة إلى تطوير LLM للمنظمات الصغيرة التي لا تمتلك مليارات للإنفاق. في الواقع، قد لا يكون يوم بعيد عندما يمكن لمعظم المنظمات الصغيرة تطوير نماذج LLM خاصة بها لتلبية أغراضها المحددة، مما يوفر عادةً حلًا أكثر فعالية من نماذج LLM العامة مثل ChatGPT.
في حين أن المناقشة لا تزال حول التكلفة الحقيقية لشركة DeepSeek، لا يتعلق الأمر ببساطة بالتكلفة التي تميزها والنماذج المماثلة: إنه حقيقة أنهم اعتمدوا شريحة أقل تقدمًا ونهجًا أكثر تركيزًا في التدريب. كشركة صينية خاضعة للقيود التصديرية الأمريكية، لم تكن DeepSeek قادرة على الوصول إلى شرائح Nvidia المتقدمة التي يتم استخدامها بشكل عام للحوسبة الكثيفة المطلوبة لتطوير LLM، وبالتالي أجبرت على استخدام شرائح Nvidia H-800 الأقل قوة، التي لا يمكنها معالجة البيانات بسرعة أو كفاءة.
لمواجهة نقص القوة، اتخذت DeepSeek نهجًا مختلفًا، أكثر تركيزًا ومباشرة في تطوير LLM. بدلاً من رمي جبال من البيانات إلى نموذج والاعتماد على قوة الحوسبة لتسمية وتطبيق البيانات، قامت DeepSeek بتحديد التدريب، استخدام كمية صغيرة من البيانات عالية الجودة “البداية الباردة” وتطبيق IRL (تعلم التعزيز التكراري، مع تطبيق الخوارزمية للبيانات في سيناريوهات مختلفة والتعلم منها). يسمح هذا النهج المحدد للنموذج بالتعلم بشكل أسرع، مع أخطاء أقل وطاقة حوسبة أقل مُهدرة.
مثل طريقة توجيه حركات الطفل بشكل محدد، لمساعدته على لفّ ظهره بنجاح لأول مرة – بدلاً من ترك الطفل لاكتشاف الأمر بنفسه، أو تعليم الطفل مجموعة واسعة من الحركات التي يمكن أن تساعده في لفّ ظهره – يركز علماء البيانات الذين يدرّبون هذه النماذج المحددة على ما هو الأكثر حاجة لبعض المهام والنتائج. من المحتمل أن لا تملك هذه النماذج تطبيقًا موثوقًا به على نطاق واسع مثل نماذج LLM الأكبر مثل ChatGPT، لكنها يمكن أن تُعتمد عليها لبعض التطبيقات المحددة، وأداؤها ب精度 وكفاءة. حتى منتقدو DeepSeek يقرّون بأن نهجها المُبسّط لتطوير النماذج زاد من الكفاءة بشكل كبير، ممكناً لها أن تفعل المزيد بتكلفة أقل.
يتعلق هذا النهج بإعطاء الذكاء الاصطناعي أفضل المدخلات لبلوغه أهدافه بأكثر الطرق ذكاءً وكفاءة، ويمكن أن يكون قيمًا لأي منظمة ترغب في تطوير نموذج LLM لتلبية احتياجاتها وتطبيقاتها المحددة. هذا النهج ي trở nên أكثر قيمة للشركات الصغيرة والمنظمات. الخطوة الأولى هي البدء بالبيانات الصحيحة. على سبيل المثال، شركة ترغب في استخدام الذكاء الاصطناعي لمساعدة فرقها للتسويق والمبيعات يجب أن تدرّب نموذجها على مجموعة بيانات محددة بعناية تركز على محادثات المبيعات، والاستراتيجيات، والمقاييس. هذا يحافظ على نموذج من تبديد الوقت وطاقة الحوسبة على المعلومات غير ذات الصلة. بالإضافة إلى ذلك، يجب أن يكون التدريب منظم في مراحل، مما يضمن أن يتقن النموذج كل مهمة أو مفهوم قبل الانتقال إلى التالي.
هذا أيضًا له أوجه تشابه في تربية الطفل، كما تعلمت بنفسي منذ أن أصبحت أمّة قبل بضعة أشهر. في كلا السيناريوهين، نهج موجه وخطوي يمنع تبديد الموارد ويقلل الاحتكاك. وأخيرًا، هذا النهج مع الأطفال والنماذج الذكية يؤدي إلى تحسين تكراري.随ما ينمو الطفل، أو يتعلم النموذج المزيد، تتحسن قدراته. هذا يعني أن النماذج يمكن تحسينها وتطويرها لتتعامل بشكل أفضل مع المواقف في العالم الحقيقي.
يحافظ هذا النهج على انخفاض التكاليف، ويتجنب تحويل مشاريع الذكاء الاصطناعي إلى مصارف للموارد، مما يجعلها أكثر سهولة لفرق وأشخاص أقل. كما يؤدي إلى أداء أفضل للنماذج الذكية بشكل أسرع؛ وبسبب أن النماذج لا يتم تحميلها بمعلومات غير ضرورية، يمكن تعديلها لتكيف مع المعلومات الجديدة واحتياجات الأعمال المتغيرة – مما هو حاسم في الأسواق التنافسية.
وصول DeepSeek وعالم الذكاء الاصطناعي منخفض التكلفة والأكثر كفاءة – على الرغم من أنه انتشر في البداية ذعرًا عبر عالم الذكاء الاصطناعي والأسواق المالية – هو تطور إيجابي للقطاع. ستؤدي الكفاءة الأكبر وتكلفة الذكاء الاصطناعي الأقل، على الأقل لتطبيقات محددة، في النهاية إلى استخدام أكبر للذكاء الاصطناعي بشكل عام، مما يدفع النمو للجميع، من المطورين إلى مصنعي الشريحة إلى المستخدمين النهائيين. في الواقع، تُظهر DeepSeek مفارقة جيفونز – حيث قد يؤدي المزيد من الكفاءة إلى استخدام أكبر لمورد، لا أقل. مع استمرار هذا الاتجاه، ستكون الشركات الصغيرة التي تركز على استخدام الذكاء الاصطناعي لتلبية احتياجاتها المحددة أكثر استعدادًا للنمو والنجاح.












