مصنوعی ذہانت
سیری سے ریئل ایم تک: ایپل کا اسمارٹ وائس اسسٹنٹس تک کا سفر

2011 میں سری کے آغاز کے بعد سے، ایپل عالمی صارف کی ضروریات کے مطابق صوتی معاون اختراعات میں مسلسل سب سے آگے رہا ہے۔ ReALM کا تعارف اس سفر میں ایک اہم نقطہ کی نشاندہی کرتا ہے، جو آلات کے ساتھ ہمارے تعامل میں صوتی معاونین کے ابھرتے ہوئے کردار کی ایک جھلک پیش کرتا ہے۔ یہ مضمون سری پر ReALM کے اثرات اور مستقبل کے صوتی معاونین کے لیے ممکنہ سمتوں کا جائزہ لیتا ہے۔
آواز کے معاونین کا عروج: سری کی پیدائش
یہ سفر اس وقت شروع ہوا جب ایپل نے سری، ایک جدید ترین مصنوعی ذہانت کے نظام کو اپنے آلات میں ضم کیا، جس سے ہم اپنی ٹیکنالوجی کے ساتھ تعامل کیسے کرتے ہیں۔ کی طرف سے تیار ٹیکنالوجی سے شروع ایس آر آئی انٹرنیشنل۔, Siri آواز سے چلنے والے معاونین کے لیے سونے کا معیار بن گیا۔ صارفین سادہ صوتی کمانڈز کے ذریعے انٹرنیٹ کی تلاش اور شیڈولنگ جیسے کام انجام دے سکتے ہیں، بات چیت کے انٹرفیس کی حدود کو آگے بڑھا سکتے ہیں اور وائس اسسٹنٹ مارکیٹ میں مسابقتی دوڑ کو بھڑکا سکتے ہیں۔
سری 2.0: وائس اسسٹنٹس کا ایک نیا دور
جیسا کہ ایپل کی رہائی کے لئے تیار ہے iOS کے 18 پر عالمی سطح پر ڈویلپرز کانفرنس (ڈبلیوڈبلیو ڈی سی) جون 2024 میں، ٹیک کمیونٹی کے اندر امید پیدا ہو رہی ہے جس کی توقع ہے کہ سری کا ایک اہم ارتقاء ہوگا۔ اس نئے مرحلے، کے طور پر کہا جاتا ہے سری 2.0, تخلیقی AI پیشرفت کو سامنے لانے کا وعدہ کرتا ہے، ممکنہ طور پر سری کو ایک اور بھی زیادہ نفیس ورچوئل اسسٹنٹ میں تبدیل کرتا ہے۔ اگرچہ درست اضافہ خفیہ ہی رہتا ہے، ٹیک کی دنیا میں سری کی بات چیت کی ذہانت اور ذاتی نوعیت کے صارف کے تعامل میں نئی بلندیوں کو حاصل کرنے کے امکانات پر رونق لگی ہوئی ہے، جس سے ChatGPT جیسی ٹیکنالوجیز میں زبان سیکھنے کے جدید ترین ماڈلز کا فائدہ اٹھایا جا رہا ہے۔ اس تناظر میں، ReALM کا تعارف، ایک کمپیکٹ لینگویج ماڈل، ممکنہ اضافہ تجویز کرتا ہے جو Siri 2.0 اپنے صارفین کے لیے متعارف کرا سکتا ہے۔ درج ذیل حصے سری کی جاری ترقی میں ایک اہم قدم کے طور پر ReALM کے کردار اور اس کے ممکنہ اثر و رسوخ پر تبادلہ خیال کریں گے۔
ReALM کی نقاب کشائی
ReALM، جس کا مطلب ہے حوالہ ریزولیوشن بطور لینگویج ماڈلنگ، ایک خصوصی زبان کا ماڈل ہے جو گفتگو کے دوران سیاق و سباق اور مبہم حوالوں کو سمجھنے میں ماہر ہے، جیسے کہ "وہ" یا "یہ۔" یہ بات چیت اور بصری حوالہ جات پر کارروائی کرنے کی صلاحیت کے لیے نمایاں ہے، انہیں متن کی شکل میں تبدیل کرتا ہے۔ یہ صلاحیت ReALM کو ایک ڈائیلاگ کے اندر بغیر کسی رکاوٹ کے اسکرین لے آؤٹ اور عناصر کے ساتھ تعبیر کرنے اور ان کے ساتھ تعامل کرنے کے قابل بناتی ہے، جو بصری طور پر منحصر سیاق و سباق میں سوالات کو درست طریقے سے ہینڈل کرنے کے لیے ایک اہم خصوصیت ہے۔
ReALM کا فن تعمیر چھوٹے ورژن جیسے ReALM-80M سے لے کر بڑے ورژن جیسے ReALM-3B تک ہے، موبائل آلات میں انضمام کے لیے کمپیوٹیشنل طور پر موثر ہونے کے لیے موزوں ہے۔ یہ کارکردگی کم بجلی کے استعمال اور پروسیسنگ وسائل پر کم دباؤ کے ساتھ مسلسل کارکردگی کی اجازت دیتی ہے، جو بیٹری کی زندگی کو بڑھانے اور مختلف آلات پر تیز ردعمل کے اوقات فراہم کرنے کے لیے اہم ہے۔
مزید برآں، ReALM کا ڈیزائن ماڈیولر اپ ڈیٹس کو ایڈجسٹ کرتا ہے، جس سے ریفرنس ریزولوشن میں تازہ ترین پیشرفت کے بغیر کسی رکاوٹ کے انضمام کی سہولت ملتی ہے۔ یہ ماڈیولر اپروچ نہ صرف ماڈل کی موافقت اور لچک کو بڑھاتا ہے بلکہ اس کی طویل مدتی قابل عملیت اور تاثیر کو بھی یقینی بناتا ہے، جس سے یہ آلات کے وسیع میدان عمل میں ابھرتی ہوئی صارف کی ضروریات اور ٹیکنالوجی کے معیارات کو پورا کر سکتا ہے۔
ReALM بمقابلہ زبان کے ماڈل
جبکہ روایتی زبان کے ماڈل پسند کرتے ہیں۔ GPT-3.5 بنیادی طور پر ٹیکسٹ پر کارروائی کرتا ہے، ReALM متن اور بصری دونوں کے ساتھ کام کر کے جیمنی جیسے ماڈلز کی طرح ملٹی موڈل راستہ اختیار کرتا ہے۔ GPT-3.5 اور کی وسیع تر خصوصیات کے برعکس جیمنی، جو ٹیکسٹ جنریشن، فہمی، اور تصویر کی تخلیق جیسے کاموں کو سنبھالتا ہے، ReALM کا مقصد خاص طور پر بات چیت اور بصری سیاق و سباق کو سمجھنا ہے۔ تاہم، جیمنی جیسے ملٹی موڈل ماڈلز کے برعکس جو بصری اور ٹیکسٹ ڈیٹا کو براہ راست پروسیس کرتا ہے، ReALM اسکرینوں کے بصری مواد کو متن، تشریحی اداروں اور ان کی مقامی تفصیلات میں ترجمہ کرتا ہے۔ یہ تبدیلی ReALM کو اسکرین کے مواد کی متنی انداز میں تشریح کرنے کی اجازت دیتی ہے، جس سے اسکرین پر حوالہ جات کی زیادہ درست شناخت اور تفہیم کی سہولت ملتی ہے۔
ریئل ایم سری کو کیسے تبدیل کر سکتا ہے؟
ReALM سری کی صلاحیتوں کو نمایاں طور پر بڑھا سکتا ہے، اسے ایک زیادہ بدیہی اور سیاق و سباق سے آگاہ اسسٹنٹ میں تبدیل کر سکتا ہے۔ یہاں یہ ہے کہ یہ کیسے اثر انداز ہوسکتا ہے:
- بہتر سیاق و سباق کی تفہیم: ReALM بات چیت میں مبہم حوالوں کو سمجھنے میں مہارت رکھتا ہے، ممکنہ طور پر سیاق و سباق پر منحصر سوالات کو سمجھنے کی سری کی صلاحیت کو بہتر بناتا ہے۔ یہ صارفین کو سری کے ساتھ زیادہ قدرتی طور پر بات چیت کرنے کی اجازت دے گا، کیونکہ یہ اضافی تفصیلات کے بغیر "وہ گانا دوبارہ چلائیں" یا "اسے کال کریں" جیسے حوالوں کو سمجھ سکتا ہے۔
- بہتر سکرین تعامل: مکالموں کے اندر اسکرین لے آؤٹ اور عناصر کی ترجمانی کرنے میں اپنی مہارت کے ساتھ، ReALM Siri کو آلہ کے بصری مواد کے ساتھ زیادہ روانی سے مربوط کرنے کے قابل بنا سکتا ہے۔ اس کے بعد سری آن اسکرین آئٹمز سے متعلق کمانڈز پر عمل درآمد کر سکتا ہے، جیسے "میل کے ساتھ ایپ کھولیں" یا "اس صفحہ پر نیچے سکرول کریں"، مختلف کاموں میں اپنی افادیت کو بڑھاتے ہوئے۔
- شخصی: سابقہ تعاملات سے سیکھ کر، ReALM ذاتی نوعیت کے اور موافق جوابات پیش کرنے کی سری کی صلاحیت کو بہتر بنا سکتا ہے۔ وقت گزرنے کے ساتھ، Siri صارف کی ضروریات اور ترجیحات کی پیشین گوئی کر سکتا ہے، ماضی کے رویے اور سیاق و سباق کی تفہیم پر مبنی اقدامات تجویز کر سکتا ہے یا شروع کر سکتا ہے، جو کہ ایک باخبر ذاتی معاون کی طرح ہے۔
- بہتر رسائی۔: ReALM کی سیاق و سباق اور حوالہ کی تفہیم کی صلاحیتوں سے قابل رسائی قابلیت کو نمایاں طور پر فائدہ پہنچ سکتا ہے، جو ٹیکنالوجی کو مزید جامع بناتا ہے۔ Siri، جو ReALM کے ذریعے تقویت یافتہ ہے، مبہم یا جزوی حکموں کی درست ترجمانی کر سکتا ہے، جسمانی یا بصری معذوری والے لوگوں کے لیے آسان اور قدرتی ڈیوائس کے استعمال کی سہولت فراہم کرتا ہے۔
ریئل ایم اور ایپل کی اے آئی حکمت عملی
ReALM کا آغاز ایپل کی AI حکمت عملی کے ایک اہم پہلو کی عکاسی کرتا ہے، جس میں ڈیوائس پر انٹیلی جنس پر زور دیا جاتا ہے۔ یہ ترقی ایج کمپیوٹنگ کے وسیع تر صنعتی رجحان کے ساتھ مطابقت رکھتی ہے، جہاں ڈیٹا کو ڈیوائسز پر مقامی طور پر پروسیس کیا جاتا ہے، لیٹنسی کو کم کرنا، بینڈوتھ کو محفوظ کرنا، اور صارف کے ڈیٹا کو ڈیوائس پر ہی محفوظ کرنا۔
ReALM پروجیکٹ ایپل کے وسیع تر AI اہداف کو بھی ظاہر کرتا ہے، جو نہ صرف کمانڈ پر عمل درآمد پر توجہ مرکوز کرتا ہے بلکہ صارف کی ضروریات کی گہری سمجھ اور پیشین گوئی پر بھی توجہ دیتا ہے۔ ReALM مستقبل کی اختراعات کی طرف ایک قدم کی نمائندگی کرتا ہے جہاں آلات صارف کی عادات اور ترجیحات کی گہرائی سے آگاہی کے ذریعے مزید ذاتی نوعیت کی اور پیش گوئی کرنے والی مدد فراہم کر سکتے ہیں۔
نیچے کی لکیر
ایپل کی سری سے ReALM تک کی ترقی صوتی اسسٹنٹ ٹیکنالوجی میں مسلسل ارتقاء کو نمایاں کرتی ہے، بہتر سیاق و سباق کی تفہیم اور صارف کے تعامل پر توجہ مرکوز کرتی ہے۔ ReALM زیادہ ذہین، پرسنلائزڈ، اور پرائیویسی سے آگاہ آواز کی مدد کی طرف ایک تبدیلی کی طرف اشارہ کرتا ہے، جو کہ ڈیوائس پر پروسیسنگ اور سیکیورٹی کو بہتر بنانے کے لیے ایج کمپیوٹنگ کے صنعتی رجحان سے ہم آہنگ ہے۔