اتصل بنا للحصول على مزيد من المعلومات

مقابلات

أوغور تيجلي، المدير الفني في MinIO – سلسلة المقابلات

mm

تم النشر

 on

أوغور تيجلي هو الرئيس الفني في MiniIO، الشركة الرائدة في مجال تخزين العناصر عالية الأداء لـ AI. بصفته مدير التكنولوجيا التنفيذي، يساعد Ugur العملاء على تصميم ونشر البنية التحتية للبيانات المستندة إلى واجهة برمجة التطبيقات والسحابية والقابلة للتطوير على مستوى المؤسسات باستخدام MinIO.

هل يمكنك وصف رحلتك لتصبح مديرًا للتكنولوجيا في MinIO، وكيف شكلت تجاربك أسلوبك في العمل؟ AI والبنية التحتية للبيانات؟

لقد بدأت مسيرتي المهنية في هندسة البنية التحتية في Merrill Lynch كمسؤول النسخ الاحتياطي والاستعادة. واصلت مواجهة التحديات المختلفة والمناصب الفنية المختلفة. انضممت إلى بنك أوف أمريكا من خلال الاستحواذ على ميريل لينش، حيث كنت نائب رئيس قسم هندسة التخزين. ومع ذلك، توسع دوري ليشمل هندسة الحوسبة ومراكز البيانات.

وكجزء من وظيفتي، عملت أيضًا مع العديد من شركات رأس المال الاستثماري (VCs) وشركات محافظها الاستثمارية لتقديم أحدث وأروع التقنيات. خلال أحد اجتماعاتي مع General Catalyst، تعرفت على فكرة MinIO والأشخاص الذين يقفون وراءها. لقد نال إعجابي بسبب الطريقة التي تعاملوا بها مع البنية التحتية للبيانات، فهي تختلف عن أي شخص آخر في السوق. أدركت الشركة أهمية مخزن العناصر وواجهات برمجة التطبيقات القياسية التي بدأت التطبيقات بها. خلال تلك السنوات، كان بإمكانهم التنبؤ بمستقبل الحوسبة و AI قبل أي شخص آخر أو حتى قبل أن يطلق عليه ما هو عليه اليوم. أردت أن أكون جزءًا من تنفيذ تلك الرؤية وبناء شيء فريد حقًا. يعد MinIO الآن متجر العناصر الأكثر انتشارًا على هذا الكوكب.

تأثير أدواري وخبراتي السابقة على كيفية تعاملي مع التقنيات الجديدة، على وجه التحديد AI والبنية التحتية للبيانات، هي أيضًا مجرد تراكم للعديد من المشاريع التي شاركت فيها خلال سنوات عملي في دعم فرق التطبيقات في شركة خدمات مالية شديدة المتطلبات.

بدءًا من الأيام ذات النطاق الترددي المحدود للشبكة، والتي أدت إلى أن تكون تقنية Hadoop هي أحدث التقنيات منذ 15 عامًا، وحتى تقنيات وسائط البيانات المختلفة من محرك الأقراص الثابتة (HDD) إلى محرك الأقراص ذو الحالة الصلبة (SSD)، شكلت العديد من هذه التغييرات التكنولوجية وجهة نظري الحالية التابع AI النظام البيئي والبنية التحتية للبيانات.

تشتهر MinIO بقدراتها على تخزين الكائنات عالية الأداء. كيف يلبي MinIO على وجه التحديد احتياجات AIالشركات التي يقودها اليوم؟

عندما كانت AB وGarima تضعان تصورًا لـ MinIO، كانت أولويتهما الأولى هي التفكير في بيان المشكلة - فقد كانا يعلمان أن البيانات ستستمر في النمو وأن تقنيات التخزين الحالية غير متوافقة مع هذا النمو. الظهور السريع لل AI جعلت وجهات نظرهم البصيرة للسوق حقيقة واقعة. منذ ذلك الحين، أصبح تخزين الكائنات أمرًا أساسيًا لـ AI البنية التحتية (جميع برامج LLM الرئيسية مثل OpenAI وAnthropic كلها مبنية على مخازن الكائنات)، ومركز البيانات الحديث مبني على أساس مخزن الكائنات.

أطلقت MinIO مؤخرًا نظامًا أساسيًا جديدًا لتخزين الكائنات مع ميزات مهمة على مستوى المؤسسات لدعم المؤسسات في عملها AI المبادرات: MinIO Enterprise Object Store. لقد تم تصميمه ليتناسب مع تحديات الأداء والحجم التي تقدمها هائلة AI أعباء العمل وتمكن العملاء من مواجهة التحديات المرتبطة بمليارات الكائنات بسهولة أكبر، بالإضافة إلى مئات الآلاف من عمليات التشفير لكل عقدة في الثانية. يحتوي على ست ميزات تجارية جديدة تستهدف التحديات التشغيلية والتقنية الرئيسية التي يواجهها AI أحمال العمل: الكتالوج (وهذا يحل مشكلة مساحة اسم تخزين الكائنات والبحث في البيانات الوصفية)، وجدار الحماية (مصمم خصيصًا للبيانات)، ونظام إدارة المفاتيح (يحل مشكلة التعامل مع مليارات مفاتيح التشفير)، وذاكرة التخزين المؤقت (تعمل كخدمة تخزين مؤقت) )، وقابلية المراقبة (تسمح للمسؤولين بعرض جميع مكونات النظام عبر كل مثيل)، وأخيرًا، وحدة تحكم المؤسسة (تعمل بمثابة لوح زجاجي واحد لجميع مثيلات MinIO الخاصة بالمؤسسة).

معالجة AI على نطاق واسع أصبحت ذات أهمية متزايدة. هل يمكنك توضيح سبب حدوث ذلك وكيف تقوم MinIO بتسهيل هذه المتطلبات للمؤسسات الحديثة؟

إن كل ما تبنيه المؤسسات تقريبًا أصبح الآن يعتمد على وحدات تخزين الكائنات، الأمر الذي سيتسارع مع وصول أولئك الذين يقومون بتشغيل البنية التحتية باستخدام أحد الأجهزة إلى حائط مسدود في عصر بحيرات البيانات الحديثة و AI. تبحث المؤسسات عن بنى تحتية جديدة لإدارة جميع البيانات الواردة إلى أنظمتها ومن ثم إنشاء تطبيقات تتمحور حول البيانات فوقها - وهذا يتطلب نطاقًا استثنائيًا ومرونة لا يمكن أن يدعمها سوى تخزين الكائنات. وهنا يأتي دور MiniIO ولماذا تتفوق الشركة دائمًا على منافسيها بأميال لأنها مصممة من أجل ماذا AI الاحتياجات - تخزين كميات هائلة من البيانات المنظمة وغير المنظمة وتوفير الأداء على نطاق واسع.

على غرار احتياجات التعلم الآلي (ML) في الأجيال السابقة من AIلقد لعبت البيانات وبحيرات البيانات الحديثة دورًا حاسمًا في نجاح أي عملية "تنبؤية" AI. ولكن مع تقدم "الصناعة" AI، وقد اتسع هذا المشهد ليشمل العديد من المكونات الأخرى، مثل AI بيانات العمليات وخطوط الأنابيب والنماذج الأساسية وقواعد البيانات المتجهة.

تستخدم كل هذه المكونات الإضافية تخزين الكائنات، ويتكامل معظمها مباشرة مع MinIO. على سبيل المثال، تستخدم قاعدة بيانات Milvus، وهي قاعدة بيانات متجهة، MinIO، وتتكامل العديد من محركات الاستعلام الحديثة مع MinIO من خلال واجهات برمجة تطبيقات S3.

AI يمثل الدين الفني مصدر قلق متزايد للعديد من المنظمات. ما هي الاستراتيجيات التي يستخدمها MinIO لمساعدة العملاء على تجنب هذه المشكلة، خاصة فيما يتعلق باستخدام وحدات معالجة الرسومات بشكل أكثر كفاءة؟

السلسلة قوية مثل أضعف حلقاتها – وقوتك AI/ML البنية التحتية هي فقط بنفس سرعة أبطأ مكون لديك. إذا قمت بتدريب نماذج التعلم الآلي باستخدام وحدات معالجة الرسومات، فقد يكون الرابط الضعيف هو حل التخزين الخاص بك. والنتيجة هي ما أسميه "مشكلة تجويع GPU". تحدث مشكلة Starving GPU عندما لا تتمكن الشبكة أو حل التخزين الخاص بك من تقديم بيانات التدريب إلى منطق التدريب الخاص بك بسرعة كافية للاستفادة الكاملة من وحدات معالجة الرسومات الخاصة بك، مما يترك قوة حوسبة قيمة على الطاولة. الشيء الذي يمكن للمؤسسات القيام به للاستفادة الكاملة من وحدات معالجة الرسومات الخاصة بها هو أولاً فهم علامات ضعف بنية البيانات وكيف يمكن أن يؤدي ذلك بشكل مباشر إلى قلة استخدام AI تكنولوجيا. ولتجنب الديون الفنية، يجب على الشركات تغيير طريقة عرضها (وتخزينها) للبيانات.

يمكن للمؤسسات إعداد حل تخزين موجود في نفس مركز البيانات الموجود فيه البنية التحتية للحوسبة الخاصة بها. ومن الناحية المثالية، سيكون هذا في نفس المجموعة التي يوجد بها حسابك. نظرًا لأن MinIO عبارة عن حل تخزين محدد برمجيًا، فهو قادر على توفير الأداء المطلوب لتغذية وحدات معالجة الرسومات الجائعة - وهو أمر حديث هي المعيار لقياس جدوي حققت 325 جيجا بايت/ثانية على GETs و165 جيجا بايت/ثانية على PUTs مع 32 عقدة فقط من محركات أقراص NVMe SSD الجاهزة للاستخدام.

لديك خلفية غنية في إنشاء البنى التحتية للبيانات عالية الأداء للمؤسسات المالية العالمية. كيف تؤثر هذه التجارب على عملك في MinIO، خاصة في تصميم الحلول لتلبية احتياجات الصناعة المتنوعة؟

لقد ساعدت في بناء أول سحابة خاصة لـ Bank of America وقد وفرت هذه المبادرة مليارات الدولارات من خلال توفير الميزات والوظائف المتاحة في السحابة العامة داخليًا بتكلفة أقل. ليس فقط هذه المبادرة الكبرى ولكن العديد من متطلبات التطبيقات المتنوعة الأخرى التي عملت عليها في BofA Merrill Lynch هي التي ساهمت في تشكيل عملي في MinIO من حيث صلته بالحلول الهندسية لعملائنا اليوم.

على سبيل المثال، تعلم ذلك بطريقة خاطئة أو "صعبة" مع الفريق الذي قام ببناء مجموعات Hadoop التي تستخدم فقط مكونات تخزين البيانات للخادم مع الحفاظ على وحدات المعالجة المركزية للخادم غير مستغلة بشكل كافٍ أو شبه خاملة. أتاحت لي الأمثلة البسيطة أو الدروس المستفادة مثل هذه استخدام البيانات المصنفة وحلول الحوسبة في البنية التحتية الحديثة للبيانات اليوم مع مساعدة عملائنا وشركائنا، وهي حلول أفضل من الناحية الفنية وأقل تكلفة باستخدام تقنيات شبكة النطاق الترددي العالي الحالية ومخازن الكائنات عالية الأداء مثل MinIO وأي استفسار أو محرك المعالجة.

 تمثل السحابة الهجينة تحديات وتعقيدات فريدة من نوعها. هل يمكنك مناقشة هذه الأمور بالتفصيل وشرح كيف يساعد "الاندفاع" المختلط لنموذج السحابة الخاص بـ MinIO في التحكم في تكاليف السحابة بشكل فعال؟

لا ينبغي أن يؤدي التحول إلى السحابة المتعددة إلى تضخم ميزانيات تكنولوجيا المعلومات وعدم القدرة على تحقيق الإنجازات - بل يجب أن يساعد في إدارة التكاليف وتسريع خريطة طريق المؤسسة. من الأشياء التي يجب مراعاتها هو إعادة السحابة إلى موطنها الأصلي - فالحقيقة هي أن تحويل العمليات من السحابة إلى البنية التحتية المحلية يمكن أن يؤدي إلى توفير كبير في التكاليف، اعتمادًا على الحالة، ويجب عليك دائمًا النظر إلى السحابة كنموذج تشغيل، وليس وجهة. على سبيل المثال، تقوم المؤسسات بتدوير مثيلات وحدة معالجة الرسومات ولكنها تقضي بعد ذلك وقتًا في المعالجة المسبقة للبيانات من أجل ملاءمتها في وحدة معالجة الرسومات. يؤدي ذلك إلى إهدار الوقت والمال الثمين - تحتاج المؤسسات إلى تحسين الأداء بشكل أفضل من خلال اختيار التقنيات السحابية الأصلية، والأهم من ذلك، التقنيات السحابية المحمولة التي يمكنها إطلاق العنان لقوة السحابات المتعددة دون تكاليف كبيرة. إن استخدام مبادئ نموذج التشغيل السحابي أولاً والالتزام بهذا الإطار يوفر المرونة اللازمة للتكيف مع المتطلبات التشغيلية المتغيرة.

تعتبر حلول Kubernetes الأصلية محورية للبنية التحتية الحديثة. كيف يعمل تكامل MinIO مع Kubernetes على تعزيز قابلية التوسع والمرونة AI البنية التحتية للبيانات؟

MinIO هو تطبيق Kubernetes أصلي من حيث التصميم ومتوافق مع S3 منذ البداية. يمكن للمطورين نشر تخزين الكائنات المستمر بسرعة لجميع تطبيقاتهم السحابية الأصلية. يوفر الجمع بين MinIO وKubernetes منصة قوية تسمح للتطبيقات بالتوسع عبر أي بنية تحتية سحابية متعددة وسحابة هجينة مع الحفاظ على إدارتها وتأمينها مركزيًا، مع تجنب قفل السحابة العامة.

باستخدام Kubernetes كمحرك لها، فإن MinIO قادر على العمل في أي مكان يفعله Kubernetes - والذي، في السحابة الأصلية/ الحديثةAI العالم، هو في الأساس في كل مكان.

وبالنظر إلى المستقبل، ما هي التطورات أو التحسينات المستقبلية التي يمكن للمستخدمين توقعها من MinIO في سياق AI البنية التحتية للبيانات؟

إن شراكاتنا الأخيرة وإطلاق منتجاتنا هي إشارة إلى السوق بأننا لن نتباطأ في أي وقت قريب، وسنواصل الدفع حيث يكون ذلك منطقيًا لعملائنا. على سبيل المثال، عقدنا مؤخرًا شراكة مع Carahsoft لجعل مجموعة تخزين الكائنات المعرفة بالبرمجيات الخاصة بـ MinIO متاحة لقطاعات الحكومة والدفاع والاستخبارات والتعليم. يتيح ذلك لمؤسسات القطاع العام إنشاء أي بنية تحتية للبيانات متنوعة النطاق، بدءًا من بحيرات البيانات الحديثة الموسعة وحتى حلول تخزين البيانات الخاصة بالمهام على الحافة المستقلة. معًا، نقدم هذه الحلول المتطورة والفريدة لعملاء القطاع العام، ونمكنهم من مواجهة تحديات البنية التحتية للبيانات بسهولة وكفاءة. وتأتي هذه الشراكة في وقت تتزايد فيه الجهود نحو تمكين القطاع العام AIجاهز، مع متطلبات مكتب الإدارة والميزانية الأخيرة التي تنص على أن جميع الوكالات الفيدرالية بحاجة إلى رئيس AI ضابط (من بين أمور أخرى). بشكل عام، تساعد الشراكة على تعزيز الصناعة AI الموقف ويمنح القطاع العام الأدوات القيمة اللازمة لتحقيق النجاح.

بالإضافة إلى ذلك، فإن MinIO في وضع جيد جدًا للمستقبل. AI البنية التحتية للبيانات لا تزال في مهدها. العديد من المجالات ستكون أكثر وضوحًا في العامين المقبلين. على سبيل المثال، سترغب معظم المؤسسات في استخدام بياناتها ومستنداتها الخاصة مع النماذج الأساسية وتوليد الاسترجاع المعزز (RAG). سيكون التكامل الإضافي لنمط النشر هذا أمرًا سهلاً بالنسبة لـ MinIO نظرًا لأن كل هذه الاختيارات المعمارية وأنماط النشر تشترك في شيء واحد - كل هذه البيانات مخزنة بالفعل على MinIO.

أخيرًا، لقادة التكنولوجيا الذين يتطلعون إلى بناء أو تحسين البنية التحتية للبيانات الخاصة بهم AIما هي النصيحة التي تقدمها بناءً على خبرتك ورؤيتك في MinIO؟

من أجل جعل أي AI إذا نجحت المبادرة، هناك ثلاثة عناصر أساسية يجب عليك الالتزام بها: الحصول على البيانات الصحيحة، والبنية التحتية المناسبة، والتطبيقات المناسبة. يبدأ الأمر حقًا بفهم ما تحتاجه - لا تخرج وتشتري وحدات معالجة رسوميات باهظة الثمن لمجرد أنك تخشى أن تفوتك الفرصة AI قارب. أنا أؤمن بشدة بهذا المشروع AI ستفشل الاستراتيجيات في عام 2024 إذا ركزت المؤسسات فقط على النماذج نفسها وليس على البيانات. يعد التفكير في النموذج تنازليًا مقابل التفكير في البيانات تصاعديًا خطأً فادحًا – عليك أن تبدأ بالبيانات. بناء البنية التحتية المناسبة للبيانات. ثم فكر في نماذجك. مع تحرك المنظمات نحو AI-البنية الأولى، من الضروري أن تعمل البنية التحتية للبيانات الخاصة بك على تمكين بياناتك - وليس تقييدها.

شكرا لك على المقابلة الرائعة ، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا MiniIO.

شريك مؤسس في unite.AI وعضو في مجلس تكنولوجيا فوربس ، أنطوان أ المستقبلي من هو شغوف بمستقبل الذكاء الاصطناعي والروبوتات.

وهو أيضًا مؤسس Securities.io، موقع ويب يركز على الاستثمار في التكنولوجيا الثورية.