ہمارے ساتھ رابطہ

ہر کاروبار کے لیے مخصوص ایل ایل ایم؟ ڈیپ سیک ہمیں راستہ دکھاتا ہے۔

سوات قائدین

ہر کاروبار کے لیے مخصوص ایل ایل ایم؟ ڈیپ سیک ہمیں راستہ دکھاتا ہے۔

mm

ایک زمانے میں، ٹیک کلیریئن کال تھی "سب کے لیے سیل فون" - اور درحقیقت موبائل مواصلات نے کاروبار (اور دنیا) میں انقلاب برپا کر دیا ہے۔ آج، اس کال کے برابر ہر کسی کو رسائی دینا ہے۔ AI کو ایپلی کیشنز لیکن AI کی اصل طاقت اسے کاروبار اور تنظیموں کی مخصوص ضروریات کے لیے استعمال کرنے میں ہے۔ چینی سٹارٹ اپ DeepSeek کی طرف سے روشن کردہ راستہ یہ ظاہر کرتا ہے کہ کس طرح AI کو ہر کوئی، خاص طور پر محدود بجٹ والے، اپنی مخصوص ضروریات کو پورا کرنے کے لیے استعمال کر سکتا ہے۔ درحقیقت کم لاگت والے AI کی آمد نے AI سلوشنز کے گہرائی سے جڑے ہوئے پیٹرن کو تبدیل کرنے کا وعدہ کیا ہے جو اکثر لاگت کے تقاضوں کی وجہ سے بہت سے چھوٹے کاروباروں اور تنظیموں کے لیے نظروں سے اوجھل رہتے ہیں۔

LLMs ہیں – یا تھے – a مہنگی کوشش، جس میں ڈیٹا کی بڑی مقدار تک رسائی، ڈیٹا پر کارروائی کرنے کے لیے بڑی تعداد میں طاقتور کمپیوٹرز، اور ماڈل کی تربیت میں لگائے گئے وقت اور وسائل کی ضرورت ہوتی ہے۔ لیکن وہ اصول بدل رہے ہیں۔ شوسٹرنگ بجٹ پر کام کرتے ہوئے، DeepSeek نے اپنا LLM، اور سوالات کے لیے ChatGPT قسم کی ایپلی کیشن تیار کی ہے – جس میں امریکی اور یورپی کمپنیوں کی طرف سے بنائے گئے ملتے جلتے سسٹمز کے مقابلے بہت کم سرمایہ کاری ہے۔ ڈیپ سیک کا نقطہ نظر چھوٹی تنظیموں کے لیے ایل ایل ایم کی ترقی میں ایک ونڈو کھولتا ہے جن کے پاس خرچ کرنے کے لیے اربوں نہیں ہیں۔ درحقیقت، وہ دن دور نہیں ہوسکتا ہے جب زیادہ تر چھوٹی تنظیمیں اپنے مخصوص مقاصد کی تکمیل کے لیے اپنے LLM تیار کر سکیں، عام طور پر ChatGPT جیسے عام LLM کے مقابلے میں زیادہ موثر حل فراہم کریں۔

جبکہ بحث ڈیپ سیک کی اصل قیمت پر باقی ہے، یہ صرف وہ لاگت نہیں ہے جو اسے اور اس سے ملتے جلتے ماڈلز کو الگ کرتی ہے: یہ حقیقت ہے کہ اس نے کم جدید چپس پر انحصار کیا اور تربیت کے لیے زیادہ توجہ مرکوز کی۔ ایک چینی کمپنی کے طور پر جو امریکی برآمدی پابندیوں کے تابع ہے، ڈیپ سیک تک رسائی حاصل کرنے سے قاصر تھی۔ اعلی درجے کی Nvidia چپس جو عام طور پر LLM کی ترقی کے لیے درکار ہیوی ڈیوٹی کمپیوٹنگ کے لیے استعمال ہوتے ہیں، اور اس لیے اسے استعمال کرنے پر مجبور کیا گیا۔ کم طاقتور Nvidia H-800 چپس، جو ڈیٹا پر اتنی جلدی یا مؤثر طریقے سے کارروائی نہیں کر سکتا۔

اس طاقت کی کمی کو پورا کرنے کے لیے، DeepSeek نے اپنی LLM کی ترقی کے لیے ایک مختلف، زیادہ توجہ مرکوز اور براہ راست طریقہ اختیار کیا۔ کسی ماڈل پر ڈیٹا کے پہاڑ پھینکنے اور ڈیٹا کو لیبل کرنے اور لاگو کرنے کے لیے کمپیوٹنگ کی طاقت پر انحصار کرنے کے بجائے، ڈیپ سیک نے تربیت کو کم کر دیا، اعلی معیار کے "کولڈ اسٹارٹ" ڈیٹا کی تھوڑی مقدار کا استعمال اور IRL کا اطلاق کرنا (تکراری کمک سیکھنےالگورتھم کے ساتھ ڈیٹا کو مختلف منظرناموں پر لاگو کرنا اور اس سے سیکھنا)۔ یہ مرکوز نقطہ نظر ماڈل کو کم غلطیوں اور کم ضائع ہونے والی کمپیوٹنگ طاقت کے ساتھ تیزی سے سیکھنے کی اجازت دیتا ہے۔

اسی طرح والدین کس طرح بچے کی مخصوص حرکات کی رہنمائی کر سکتے ہیں، پہلی بار اسے کامیابی کے ساتھ رول اوور کرنے میں مدد کر سکتے ہیں – بجائے اس کے کہ بچے کو اکیلے چھوڑ دیں، یا بچے کو مختلف قسم کی نقل و حرکت سکھائیں جو نظریہ طور پر رول اوور کرنے میں مدد دے سکتی ہے – ڈیٹا سائنسدان ان زیادہ فوکس شدہ AI ماڈلز کی تربیت کرتے ہیں جو کچھ خاص کاموں اور کاموں کے لیے انتہائی ضروری ہے۔ اس طرح کے ماڈلز میں ممکنہ طور پر ChatGPT جیسے بڑے LLM جتنی قابل بھروسہ ایپلیکیشن نہیں ہوتی، لیکن ان پر مخصوص ایپلی کیشنز کے لیے انحصار کیا جا سکتا ہے، اور ان کو درستگی اور کارکردگی کے ساتھ انجام دیا جا سکتا ہے۔ یہاں تک کہ ڈیپ سیک کے ناقدین بھی تسلیم کرتے ہیں کہ ترقی کے لیے اس کے ہموار طریقے سے کارکردگی میں نمایاں اضافہ ہوا ہے، جس سے یہ بہت کم کے ساتھ زیادہ کرنے کے قابل ہے۔

یہ نقطہ نظر AI کو بہترین ان پٹ دینے کے بارے میں ہے تاکہ یہ اپنے سنگ میل کو ہوشیار ترین، انتہائی موثر طریقے سے ممکن ہو سکے، اور کسی بھی تنظیم کے لیے قیمتی ہو سکتا ہے جو اپنی مخصوص ضروریات اور کاموں کے لیے LLM تیار کرنا چاہتی ہے۔ اس طرح کا نقطہ نظر چھوٹے کاروباروں اور تنظیموں کے لئے تیزی سے قابل قدر ہے۔ پہلا قدم صحیح ڈیٹا کے ساتھ شروع ہو رہا ہے۔ مثال کے طور پر، ایک کمپنی جو اپنی سیلز اور مارکیٹنگ ٹیموں کی مدد کے لیے AI کا استعمال کرنا چاہتی ہے، اسے اپنے ماڈل کو احتیاط سے منتخب کردہ ڈیٹاسیٹ پر تربیت دینی چاہیے جو سیلز کی بات چیت، حکمت عملیوں اور میٹرکس کے مطابق ہو۔ یہ ماڈل کو وقت ضائع کرنے اور غیر متعلقہ معلومات پر کمپیوٹنگ کی طاقت سے بچاتا ہے۔ اس کے علاوہ، تربیت کو مراحل میں ترتیب دینے کی ضرورت ہے، اس بات کو یقینی بناتے ہوئے کہ ماڈل ہر کام یا تصور کو اگلے کام پر جانے سے پہلے ماسٹر کرتا ہے۔

یہ بھی بچے کی پرورش میں مماثلت رکھتا ہے، جیسا کہ میں نے چند ماہ قبل ماں بننے کے بعد خود سیکھا ہے۔ دونوں منظرناموں میں، ایک ہدایت یافتہ، مرحلہ وار نقطہ نظر وسائل کو ضائع کرنے سے بچاتا ہے اور رگڑ کو کم کرتا ہے۔ آخر میں، بچوں کے انسانوں اور AI ماڈلز دونوں کے ساتھ اس طرح کے نقطہ نظر کے نتیجے میں تکراری بہتری ہوتی ہے۔ جیسے جیسے بچہ بڑا ہوتا ہے، یا ماڈل مزید سیکھتا ہے، اس کی صلاحیتوں میں بہتری آتی ہے۔ اس کا مطلب ہے کہ حقیقی دنیا کے حالات کو بہتر طریقے سے سنبھالنے کے لیے ماڈلز کو بہتر اور بہتر بنایا جا سکتا ہے۔

یہ نقطہ نظر لاگت کو کم رکھتا ہے، AI منصوبوں کو وسائل کی نکاسی بننے سے روکتا ہے، اور انہیں چھوٹی ٹیموں اور تنظیموں کے لیے زیادہ قابل رسائی بناتا ہے۔ یہ AI ماڈلز کی زیادہ تیزی سے بہتر کارکردگی کا باعث بنتا ہے۔ اور، چونکہ ماڈلز غیرمعمولی ڈیٹا سے زیادہ نہیں ہوتے ہیں، اس لیے انہیں نئی ​​معلومات اور بدلتی ہوئی کاروباری ضروریات کے مطابق ڈھالنے کے لیے بھی ایڈجسٹ کیا جا سکتا ہے - مسابقتی منڈیوں میں کلیدی۔

ڈیپ سیک کی آمد اور کم لاگت، زیادہ موثر AI کی دنیا - اگرچہ اس نے ابتدائی طور پر پوری AI دنیا اور اسٹاک مارکیٹوں میں خوف و ہراس پھیلا دیا - مجموعی طور پر AI شعبے کے لیے ایک مثبت پیشرفت ہے۔ AI کی زیادہ کارکردگی اور کم لاگت، کم از کم کچھ فوکسڈ ایپلی کیشنز کے لیے، بالآخر عام طور پر AI کے زیادہ استعمال کا نتیجہ ہو گی، جو ڈیولپرز سے لے کر چپ میکرز تک، اختتامی صارفین تک ہر ایک کے لیے ترقی کا باعث بنے گی۔ درحقیقت ڈیپ سیک اس کی وضاحت کرتا ہے۔ جیونز پیراڈوکس - جہاں زیادہ کارکردگی کے نتیجے میں وسائل کا زیادہ استعمال ہوگا، کم نہیں۔ جیسا کہ یہ رجحان جاری نظر آتا ہے، چھوٹے کاروبار جو اپنی مخصوص ضروریات کو پورا کرنے کے لیے AI کے استعمال پر توجہ مرکوز کرتے ہیں وہ بھی ترقی اور کامیابی کے لیے بہتر طریقے سے مرتب ہوں گے۔

Stav Levi-Neumark کے سی ای او اور شریک بانی ہیں۔ Alta اور پروڈکٹ مینجمنٹ اور ریونیو میں اضافے کا ماہر۔ اس سے پہلے، وہ Monday.com کے پہلے ملازمین میں سے ایک تھی، جہاں اس نے "BigBrain" تیار کرنے میں مدد کی، ایک اندرونی BI ٹول جو روزانہ کمپنی کے کاموں کے لیے استعمال ہوتا ہے۔ Stav نے یروشلم کی عبرانی یونیورسٹی سے کمپیوٹر سائنس اور شماریات میں BS.c کی ڈگری حاصل کی ہے۔