رطم تمكين عمليات نشر الذكاء الاصطناعي في العالم الحقيقي على نطاق واسع - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

قاده التفكير

تمكين عمليات نشر الذكاء الاصطناعي في العالم الحقيقي على نطاق واسع

mm

تم النشر

 on

بقلم براد كينج ، المدير التقني الميداني ، Scality

أدوات الذكاء الاصطناعي / التعلم الآلي والبيانات الضخمة لها خيط مشترك - فهي تحتاج إلى بيانات ، وتحتاج إلى الكثير منها. تقول الحكمة التقليدية أنه كلما كان ذلك أفضل ، كان ذلك أفضل. يتوقع المحللون أن ينمو إنشاء البيانات العالمية إلى أكثر من 180 زيتابايت بحلول عام 2025 - وفي عام 2020 ، وصل حجم البيانات التي تم إنشاؤها وتكرارها إلى مستوى قياسي جديد بلغ 64.2 زيتابايت.

هذه البيانات ذات قيمة عالية - لا يمكن الاستغناء عنها في كثير من الأحيان وتمثل أحيانًا أحداثًا لمرة واحدة أو مرة واحدة في العمر. يجب تخزين هذه البيانات بأمان وأمان ؛ وبينما يُقدر أنه يتم الاحتفاظ بنسبة صغيرة فقط من هذه البيانات التي تم إنشاؤها حديثًا ، يستمر الطلب على سعة التخزين في النمو. في الواقع ، من المتوقع أن تنمو قاعدة سعة التخزين المثبتة بمعدل نمو سنوي مركب يبلغ 19.2٪ بين عامي 2020 و 2025 ، وفقًا للباحثين في رجل دولة.

مع إنشاء المزيد من البيانات - لا سيما من خلال أعباء عمل AI / ML - تحتاج المؤسسات إلى مزيد من التخزين ، ولكن لا يمكن لجميع حلول التخزين التعامل مع أعباء العمل المكثفة والهائلة. ما نحتاجه هو نهج جديد للتخزين. لنلقِ نظرة على كيفية تخطي المؤسسات لهذه التحديات من منظور ثلاث حالات استخدام.

صناعة السفر

بينما اعتاد الكثير منا على السفر مرة أخرى بعد أكثر من عام من الإغلاق ، فإن صناعة السفر تتطلع إلى العودة إلى أوقات ما قبل الجائحة بطريقة رئيسية. وهذا يجعل أهمية البيانات - على وجه التحديد ، التطبيق المناسب واستخدام تلك البيانات - أكثر أهمية.

تخيل ما يمكنك فعله بمعرفة المكان الذي سيسافر فيه غالبية مسافري خطوط الطيران في العالم بعد ذلك أو إلى أين سيذهبون غدًا. بالنسبة لوكالة سفر ، على سبيل المثال ، سيكون ذلك ضخمًا.

لكن مؤسسات السفر هذه تتعامل مع الكثير من البيانات التي تقوم بفرزها لمعرفة ما هو ذو مغزى هو احتمال كبير. يتم إنشاء حوالي بيتابايت من البيانات كل يوم ، ويتم تكرار بعض البيانات بواسطة مواقع مثل Kayak. هذه البيانات حساسة للوقت ، وتحتاج شركات السفر إلى اكتشاف البيانات ذات الأهمية بسرعة. إنهم بحاجة إلى أداة ليكونوا قادرين على إدارة هذا المستوى من المقياس بشكل أكثر فعالية.

صناعة السيارات

مثال آخر يأتي من صناعة السيارات ، والتي تعد بالتأكيد واحدة من أكثر حالات الاستخدام التي يتم الحديث عنها. كانت الصناعة تعمل بجد لفترة طويلة باستخدام أدوات المساعدة مثل أدوات التحكم في الممرات وتجنب الاصطدام وما شابه ذلك. كل هذه المستشعرات تجلب كميات كبيرة من البيانات. وهم بالطبع يطورون ويختبرون ويتحققون من خوارزميات القيادة الذاتية.

ما تحتاجه الصناعة هو طريقة أفضل لفهم هذه البيانات المخزنة حتى يتمكنوا من استخدامها لتحليل الحوادث التي حدث فيها خطأ ما ، وتنظيم مخرجات المستشعر كحالة اختبار ، واختبار الخوارزميات مقابل بيانات المستشعر والمزيد. يحتاجون إلى اختبار ضمان الجودة لتجنب الانحدار ، ويحتاجون إلى توثيق الحالات التي تفشل.

علم الأمراض الرقمي

حالة استخدام أخرى مثيرة للاهتمام لـ AI / ML والتي تتصارع أيضًا مع طوفان البيانات والحاجة إلى استخدام أفضل للبيانات هي علم الأمراض الرقمي. تمامًا مثل الأمثلة الأخرى ، ما يحتاجون إليه حقًا هو القدرة على الاستفادة بشكل أفضل من هذه البيانات حتى يتمكنوا من القيام بأشياء مثل الكشف التلقائي عن الأمراض في عينات الأنسجة ، وإجراء التشخيصات عن بُعد وما إلى ذلك.

لكن التخزين اليوم يحد من الاستخدام. الصور ذات الدقة المفيدة كبيرة جدًا بحيث لا يمكن تخزينها اقتصاديًا. ومع ذلك ، فإن التخزين السريع للعناصر سيمكن قدرات جديدة - مثل بنوك الصور التي يمكن استخدامها كمورد تدريب رئيسي واستخدام منحنيات ملء الفراغ لتسمية / تخزين واسترداد الصور متعددة الدقة في مخزن الكائنات. كما أنه يتيح إمكانية توسعة ومرونة علامات البيانات الوصفية ، مما يسهل البحث عن هذه المعلومات وفهمها.

تتطلب أعباء عمل الذكاء الاصطناعي نهجًا جديدًا

كما رأينا في الحالات الثلاث المذكورة أعلاه ، من الأهمية بمكان أن تكون قادرًا على تجميع وتنظيم كميات هائلة من البيانات المتعلقة بأعباء عمل الذكاء الاصطناعي / التعلم الآلي. غالبًا ما تصل مجموعات البيانات إلى مقياس متعدد بيتابايت ، مع متطلبات الأداء التي يمكن أن تشبع البنية التحتية بأكملها. عند التعامل مع مثل هذا التدريب على نطاق واسع ومجموعات بيانات الاختبار ، فإن التغلب على اختناقات التخزين (الكمون و / أو مشكلات الإنتاجية) وقيود / حواجز السعة هي عناصر أساسية للنجاح.

تتطلب أعباء العمل AI / ML / DL بنية تخزين يمكنها الحفاظ على تدفق البيانات عبر خط الأنابيب ، مع أداء I / O خام ممتاز وقدرة على توسيع السعة. يجب أن تواكب البنية التحتية للتخزين المتطلبات المتزايدة الطلب في جميع مراحل خط أنابيب AI / ML / DL. الحل عبارة عن بنية تحتية للتخزين مصممة خصيصًا للسرعة والنطاق اللامحدود.

استخراج القيمة

لا يمر أسبوع بدون قصص حول إمكانات الذكاء الاصطناعي والتعلم الآلي في تغيير العمليات التجارية والحياة اليومية. هناك العديد من حالات الاستخدام التي توضح بوضوح فوائد استخدام هذه التقنيات. ومع ذلك ، فإن واقع الذكاء الاصطناعي في المؤسسة اليوم هو واحد من مجموعات البيانات الضخمة وحلول التخزين التي لا يمكنها إدارة أعباء العمل الضخمة هذه. لا يمكن للابتكارات في السيارات والرعاية الصحية والعديد من الصناعات الأخرى المضي قدمًا حتى يتم حل مشكلة التخزين. يتغلب التخزين السريع للكائنات على التحدي المتمثل في الاحتفاظ بالبيانات الضخمة حتى تتمكن المؤسسات من استخراج القيمة من هذه البيانات للمضي قدمًا بأعمالها.

بصفته مديرًا فنيًا ميدانيًا ، فإن براد كينج مسؤول عن تصميم أكبر الأنظمة Scality تنتشر في جميع أنحاء العالم. وتشمل هذه الأنظمة متعددة البيتابايت ومتعددة المواقع مع مئات الخوادم. براد هو أحد مؤسسي Scality. بدأ حياته المهنية المتعددة الأوجه كمهندس بحري مع البحرية الفرنسية ، حيث أجرى عمليات محاكاة عددية لانقلاب السفن والأمواج حول السفن الكبيرة. انضم بعد ذلك إلى مختبر أبحاث شلمبرجير في باريس لعدة سنوات ، حيث عمل على ديناميكيات السوائل المضطربة ، وأتمتة المختبرات ، والمحاكاة العددية المتوازية واسعة النطاق ، وتقنيات الإنترنت الجديدة ، بما في ذلك مراقبة مشاريع NCSA (مثل Mosaic) الممولة من قبل شركة شلمبرجير.