سوات قائدین

AI ایجنٹ کے فرق کو پورا کرنا: خود مختاری کے اسپیکٹرم پر عمل درآمد کی حقیقتیں۔

اشاعت اپریل 3، 2025

انیتا کرکووسکا، ویلم میں گروتھ لیڈ کا قیام

حالیہ سروے کے اعداد و شمار 1,250+ ترقیاتی ٹیموں سے ایک حیرت انگیز حقیقت کا پتہ چلتا ہے: 55.2٪ اس سال مزید پیچیدہ ایجنٹی ورک فلو بنانے کا منصوبہ ہے، اس کے باوجود صرف 25.1% نے کامیابی سے AI ایپلی کیشنز کو پروڈکشن میں تعینات کیا ہے۔ عزائم اور عمل درآمد کے درمیان یہ فرق صنعت کے اہم چیلنج کو نمایاں کرتا ہے: ہم کس طرح مؤثر طریقے سے خود مختار AI سسٹمز کی تعمیر، تشخیص اور پیمانے کرتے ہیں؟

"ایجنٹ" کی تجریدی تعریفوں پر بحث کرنے کے بجائے، آئیے عملی نفاذ کے چیلنجوں اور صلاحیت کے اسپیکٹرم پر توجہ مرکوز کریں جس پر آج ترقیاتی ٹیمیں تشریف لے جا رہی ہیں۔

خود مختاری کے فریم ورک کو سمجھنا

خود مختار گاڑیاں طے شدہ صلاحیت کی سطحوں کے ذریعے کس طرح ترقی کرتی ہیں اسی طرح، AI نظام ایک ترقیاتی رفتار کی پیروی کرتے ہیں جہاں ہر سطح پچھلی صلاحیتوں پر استوار ہوتی ہے۔ یہ چھ سطحی فریم ورک (L0-L5) ڈویلپرز کو ان کے AI کے نفاذ کا جائزہ لینے اور منصوبہ بندی کرنے کے لیے ایک عملی عینک فراہم کرتا ہے۔

L0: اصول پر مبنی ورک فلو (فالوور) - پہلے سے طے شدہ اصولوں کے ساتھ روایتی آٹومیشن اور کوئی صحیح ذہانت نہیں
L1: بنیادی جواب دہندہ (Executor) - رد عمل والے نظام جو ان پٹ پر کارروائی کرتے ہیں لیکن میموری یا تکراری استدلال کی کمی ہے
L2: ٹولز کا استعمال (ایکٹر) - وہ سسٹم جو فعال طور پر فیصلہ کرتے ہیں کہ بیرونی ٹولز کو کب کال کرنا ہے اور نتائج کو یکجا کرنا ہے۔
L3: مشاہدہ، منصوبہ، ایکٹ (آپریٹر) - خود تشخیصی صلاحیتوں کے ساتھ ملٹی سٹیپ ورک فلو
L4: مکمل طور پر خود مختار (ایکسپلورر) - مستقل نظام جو ریاست کو برقرار رکھتا ہے اور آزادانہ طور پر کارروائیوں کو متحرک کرتا ہے۔
L5: مکمل طور پر تخلیقی (موجد) - ایسے نظام جو غیر متوقع مسائل کو حل کرنے کے لیے نئے ٹولز اور نقطہ نظر تخلیق کرتے ہیں

موجودہ نفاذ کی حقیقت: جہاں زیادہ تر ٹیمیں آج ہیں۔

نفاذ کی حقیقتیں نظریاتی فریم ورک اور پیداواری نظام کے درمیان بالکل تضاد کو ظاہر کرتی ہیں۔ ہمارے سروے کے اعداد و شمار سے پتہ چلتا ہے کہ زیادہ تر ٹیمیں ابھی تک عملدرآمد کی پختگی کے ابتدائی مراحل میں ہیں:

حکمت عملی کی ترقی میں 25٪ باقی ہیں۔
21% تصور کے ثبوت ہیں۔
1٪ بیٹا ماحول میں جانچ کر رہے ہیں۔
1% پیداوار کی تعیناتی تک پہنچ چکے ہیں۔

یہ تقسیم تصور سے نفاذ کی طرف جانے کے عملی چیلنجوں کی نشاندہی کرتی ہے، یہاں تک کہ خود مختاری کی کم سطحوں پر بھی۔

خود مختاری کی سطح کے لحاظ سے تکنیکی چیلنجز

L0-L1: فاؤنڈیشن بلڈنگ

زیادہ تر پروڈکشن AI سسٹمز آج ان سطحوں پر کام کرتے ہیں، 51.4% ٹیمیں کسٹمر سروس چیٹ بوٹس تیار کرتی ہیں اور 59.7% دستاویز کی تجزیہ پر توجہ مرکوز کرتی ہیں۔ اس مرحلے پر بنیادی نفاذ کے چیلنج انضمام کی پیچیدگی اور قابل اعتماد ہیں، نظریاتی حدود نہیں۔

L2: موجودہ سرحد

یہ وہ جگہ ہے جہاں اب جدید ترین ترقی ہو رہی ہے، 59.7% ٹیمیں ویکٹر ڈیٹا بیس کا استعمال کر رہی ہیں تاکہ ان کے AI سسٹمز کو حقائق پر مبنی معلومات فراہم کی جا سکیں۔ ترقی کے نقطہ نظر وسیع پیمانے پر مختلف ہوتے ہیں:

اندرونی ٹولنگ کے ساتھ 2٪ تعمیر
9% لیوریج تھرڈ پارٹی AI ڈویلپمنٹ پلیٹ فارمز
9% مکمل طور پر فوری انجینئرنگ پر انحصار کرتے ہیں۔

L2 کی ترقی کی تجرباتی نوعیت بہترین طریقوں اور تکنیکی تحفظات کی عکاسی کرتی ہے۔ ٹیموں کو عمل درآمد میں اہم رکاوٹوں کا سامنا کرنا پڑتا ہے، جس میں 57.4% نے ہیلوسینیشن مینجمنٹ کو اپنی اولین تشویش قرار دیا، اس کے بعد استعمال کے معاملے کی ترجیح (42.5%) اور تکنیکی مہارت کے فرق (38%)۔

L3-L5: نفاذ میں رکاوٹیں۔

یہاں تک کہ ماڈل کی صلاحیتوں میں نمایاں ترقی کے باوجود، بنیادی حدود اعلیٰ خود مختاری کی سطح کی طرف پیش رفت کو روکتی ہیں۔ موجودہ ماڈل ایک اہم رکاوٹ کا مظاہرہ کرتے ہیں: وہ حقیقی استدلال کی نمائش کرنے کے بجائے تربیتی اعداد و شمار کے مطابق ہیں۔ یہ بتاتا ہے کہ 53.5% ٹیمیں ماڈل آؤٹ پٹس کی رہنمائی کے لیے فائن ٹیوننگ (32.5%) کے بجائے فوری انجینئرنگ پر کیوں انحصار کرتی ہیں۔

تکنیکی اسٹیک تحفظات

تکنیکی عمل درآمد اسٹیک موجودہ صلاحیتوں اور حدود کی عکاسی کرتا ہے:

ملٹی موڈل انضمام: متن (93.8٪)، فائلیں (62.1٪)، تصاویر (49.8٪)، اور آڈیو (27.7٪)
ماڈل فراہم کرنے والے: OpenAI (63.3%)، Microsoft/Azure (33.8%)، اور Anthropic (32.3%)
نگرانی کے طریقے: اندرون خانہ حل (55.3%)، فریق ثالث کے اوزار (19.4%)، کلاؤڈ فراہم کرنے والی خدمات (13.6%)

جیسے جیسے نظام زیادہ پیچیدہ ہوتے جاتے ہیں، نگرانی کی صلاحیتیں تیزی سے اہم ہوتی جاتی ہیں، 52.7% ٹیمیں اب AI کے نفاذ کی سرگرمی سے نگرانی کر رہی ہیں۔

تکنیکی حدود اعلی خود مختاری کو روکتی ہیں۔

یہاں تک کہ آج کے جدید ترین ماڈل بھی ایک بنیادی حد کا مظاہرہ کرتے ہیں: وہ زیادہ فٹ حقیقی استدلال کی نمائش کے بجائے ڈیٹا کو تربیت دینا۔ یہ بتاتا ہے کہ کیوں زیادہ تر ٹیمیں (53.5%) ماڈل آؤٹ پٹس کی رہنمائی کے لیے فائن ٹیوننگ (32.5%) کے بجائے فوری انجینئرنگ پر انحصار کرتی ہیں۔ اس سے کوئی فرق نہیں پڑتا ہے کہ آپ کی انجینئرنگ کتنی ہی نفیس ہے، موجودہ ماڈل اب بھی حقیقی خود مختار استدلال کے ساتھ جدوجہد کرتے ہیں۔

تکنیکی اسٹیک ان حدود کی عکاسی کرتا ہے۔ جب کہ ملٹی موڈل صلاحیتیں بڑھ رہی ہیں — ٹیکسٹ 93.8%، فائلز 62.1%، امیجز 49.8%، اور آڈیو 27.7% — OpenAI (63.3%)، Microsoft/Azure (33.8%)، اور Anthropic (32.3%) کے بنیادی ماڈلز اب بھی اسی خود کار طریقے سے فنڈز کے ساتھ کام کرتے ہیں۔

ترقی کا نقطہ نظر اور مستقبل کی سمت

آج AI سسٹمز بنانے والی ترقیاتی ٹیموں کے لیے، ڈیٹا سے کئی عملی بصیرتیں سامنے آتی ہیں۔ سب سے پہلے، تعاون ضروری ہے- موثر AI ترقی میں انجینئرنگ (82.3%)، مضامین کے ماہرین (57.5%)، مصنوعات کی ٹیمیں (55.4%)، اور قیادت (60.8%) شامل ہیں۔ یہ کراس فنکشنل ضرورت AI کی ترقی کو روایتی سافٹ ویئر انجینئرنگ سے بنیادی طور پر مختلف بناتی ہے۔

2025 کی طرف دیکھتے ہوئے، ٹیمیں مہتواکانکشی اہداف طے کر رہی ہیں: 58.8% مزید گاہک کو درپیش AI ایپلیکیشنز بنانے کا منصوبہ بنا رہے ہیں، جبکہ 55.2% زیادہ پیچیدہ ایجنٹی ورک فلو کے لیے تیاری کر رہے ہیں۔ ان اہداف کی حمایت کرنے کے لیے، 41.9% اپنی ٹیموں کو بہتر بنانے پر مرکوز ہیں اور 37.9% اندرونی استعمال کے معاملات کے لیے تنظیم کے لیے مخصوص AI بنا رہے ہیں۔

نگرانی کا بنیادی ڈھانچہ بھی تیار ہو رہا ہے، 52.7% ٹیمیں اب پیداوار میں اپنے AI سسٹم کی نگرانی کر رہی ہیں۔ زیادہ تر (55.3%) اندرون ملک حل استعمال کرتے ہیں، جبکہ دیگر فریق ثالث کے ٹولز (19.4%)، کلاؤڈ فراہم کرنے والی خدمات (13.6%)، یا اوپن سورس مانیٹرنگ (9%) کا فائدہ اٹھاتے ہیں۔ جیسے جیسے نظام زیادہ پیچیدہ ہوتے جائیں گے، نگرانی کی یہ صلاحیتیں تیزی سے اہم ہوتی جائیں گی۔

تکنیکی روڈ میپ

جیسا کہ ہم آگے دیکھتے ہیں، L3 اور اس سے آگے کی ترقی کے لیے اضافی بہتری کی بجائے بنیادی کامیابیوں کی ضرورت ہوگی۔ بہر حال، ترقیاتی ٹیمیں زیادہ خود مختار نظاموں کی بنیاد رکھ رہی ہیں۔

خود مختاری کی اعلیٰ سطحوں کی طرف تعمیر کرنے والی ٹیموں کے لیے، فوکس کے شعبوں میں شامل ہونا چاہیے:

مضبوط تشخیصی فریم ورک جو پروگرامی طور پر آؤٹ پٹس کی تصدیق کرنے کے لیے دستی ٹیسٹنگ سے آگے بڑھتے ہیں۔
بہتر نگرانی کے نظام جو پیداوار میں غیر متوقع طرز عمل کا پتہ لگا سکتا ہے اور ان کا جواب دے سکتا ہے۔
ٹول انضمام کے پیٹرن جو AI سسٹم کو سافٹ ویئر کے دوسرے اجزاء کے ساتھ محفوظ طریقے سے بات چیت کرنے کی اجازت دیتا ہے۔
استدلال کی تصدیق کے طریقے پیٹرن کے ملاپ سے حقیقی استدلال کو الگ کرنے کے لیے

اعداد و شمار سے پتہ چلتا ہے کہ مسابقتی فائدہ (31.6%) اور کارکردگی کے فوائد (27.1%) پہلے ہی محسوس کیے جا رہے ہیں، لیکن 24.2% ٹیموں نے ابھی تک کوئی قابل پیمائش اثر نہیں بتایا۔ یہ آپ کے مخصوص تکنیکی چیلنجوں کے لیے مناسب خود مختاری کی سطحوں کے انتخاب کی اہمیت کو اجاگر کرتا ہے۔

جیسا کہ ہم 2025 میں آگے بڑھ رہے ہیں، ترقیاتی ٹیموں کو اس بات کے بارے میں عملی رہنا چاہیے کہ فی الحال کیا ممکن ہے ایسے نمونوں کے ساتھ تجربہ کرتے ہوئے جو مستقبل میں مزید خود مختار نظاموں کو قابل بنائیں گے۔ ہر خودمختاری کی سطح پر تکنیکی صلاحیتوں اور حدود کو سمجھنے سے ڈویلپرز کو باخبر تعمیراتی فیصلے کرنے اور ایسے AI سسٹم بنانے میں مدد ملے گی جو صرف تکنیکی نیاپن کے بجائے حقیقی قدر فراہم کرتے ہیں۔

متعلقہ موضوعات:سوچا رہنماؤں ویلم

اگلا اوپر

AI کے اخراجات میں تیزی آرہی ہے - انہیں کنٹرول میں رکھنے کا طریقہ یہاں ہے۔

مس مت مت

AI تیزی سے برانڈ کنیکٹیویٹی اور مارکیٹنگ کو نئی شکل دے رہا ہے۔

انیتا کرکووسکا، ویلم میں ترقی کی قیادت کرنے والی

انیتا کرکووسکا ایک مضبوط ML پس منظر کے ساتھ ایک AI ماہر ہے، GenAI اور LLM تعلیم میں مہارت رکھتی ہے۔ سابق فلبرائٹ اسکالر، وہ ترقی اور تعلیم کی قیادت کرتی ہیں۔ ویلمکمپنیوں کو AI مصنوعات بنانے اور اسکیل کرنے میں مدد کرنا۔ وہ LLM کی تشخیص کرتی ہے اور AI کے بہترین طریقوں پر وسیع پیمانے پر لکھتی ہے، جس سے کاروباری رہنماؤں کو موثر AI اپنانے کے لیے بااختیار بنایا جاتا ہے۔

متحد اے آئی