Connect with us

إريك لانداو، المؤسس المشارك والرئيس التنفيذي لشركة Encord – سلسلة المقابلات

مقابلات

إريك لانداو، المؤسس المشارك والرئيس التنفيذي لشركة Encord – سلسلة المقابلات

mm

إريك لانداو هو الرئيس التنفيذي والمؤسس المشارك لشركة Encord، وهي منصة تعلم نشطة لرؤية الكمبيوتر. كان إريك الباحث الكمّي الرئيسي في طاولة دلتا-واحد للأسهم العالمية، حيث وضع الآلاف من النماذج في الإنتاج. قبل انضمامه إلى Encord، قضى ما يقرب من عقد من الزمن في التداول عالي التردد في DRW. يحمل درجة الماجستير في الفيزياء التطبيقية من جامعة هارفارد، وماجستير في الهندسة الكهربائية، ودرجة البكالوريوس في الفيزياء من جامعة ستانفورد.

في وقت فراغه، يتمتع إريك باللعب مع ChatGPT ونماذج اللغة الكبيرة وصنع الكوكتيلات اليدوية.

ما الذي ألهمك لتأسيس Encord، وكيف ساهمت خبرتك في فيزياء الجسيمات والتمويل الكمّي في نهجك لحل “مشكلة البيانات” في الذكاء الاصطناعي؟

بدأت أفكر في التعلم الآلي أثناء عملي في فيزياء الجسيمات والتعامل مع مجموعات بيانات كبيرة جداً خلال فترة وجودي في مركز ستانفورد الخطي للتعجيل (SLAC). كنت أستخدم برنامجًا مصممًا من قبل الفيزيائيين للفيزيائيين، وهو ما يعني أن هناك الكثير مما يمكن إضافته لتحسين تجربة المستخدم. مع أدوات أسهل، كنت سأ能够 تشغيل التحليلات بسرعة أكبر.

في وقت لاحق، أثناء عملي في التمويل الكمّي في DRW، كنت مسؤولاً عن إنشاء آلاف النماذج التي تم نشرها في الإنتاج. مشابهة لخبرتي في الفيزياء، وجدت أن البيانات عالية الجودة حاسمة في制作 نماذج دقيقة وأن إدارة البيانات الكبيرة المعقدة صعبة. كان لدي أولريك تجربة مماثلة في تحويل مجموعات بيانات الصور الكبيرة لرؤية الكمبيوتر.

عندما سمعت عن فكرته الأولى لشركة Encord، كنت على الفور متعاطفًا وفهمت الأهمية. معًا، رأى أولريك وأنا فرصة كبيرة لبناء منصة لتحسين وتسريع عملية تطوير البيانات للذكاء الاصطناعي، مما يجعل من السهل للفرق الحصول على أفضل البيانات في النماذج وبناء أنظمة ذكاء اصطناعي موثوقة.

يمكنك أن تُشرح رؤية شركة Encord وكيف تقارن بأيام الكمبيوتر أو الإنترنت المبكرة من حيث الإمكانات والتحديات؟

تركز رؤية Encord على أن تكون المنصة الأساسية التي تعتمد عليها الشركات لتحويل بياناتها إلى نماذج ذكاء اصطناعي وظيفية. نحن الطبقة بين بيانات الشركة ونظام الذكاء الاصطناعي.

في nhiều طرق، يعكس الذكاء الاصطناعي التحولات السابقة مثل الحوسبة الشخصية والإنترنت في أنه سوف يصبح جزءًا لا يتجزأ من تدفقات العمل لكل فرد وشركة وصناعة. على عكس الثورات التكنولوجية السابقة، التي كانت مقيدة في الغالب بمعامل موور للنمو المركب للحوسبة البالغ 30 ضعفًا كل 10 سنوات، استفادت تطورات الذكاء الاصطناعي من الابتكارات المتزامنة. وبالتالي، تتحرك بسرعة أكبر. كما قال جنسن هوانج من NVIDIA: “من أجل المرة الأولى، نشهد مركبات أسية… نحن مركبون بمليون مرة كل عشر سنوات. ليس مائة مرة، ليس ألف مرة، مليون مرة.” بدون مبالغة، نشهد أسرع تكنولوجيا في التاريخ.

الإمكانات هنا هائلة: من خلال توفير إدارة وتنظيم البيانات عالية الجودة للذكاء الاصطناعي، نحن نتعامل مع عائق يمنع تبني الذكاء الاصطناعي على نطاق أوسع. التحديات تشبه العوائق في بداية العصور التكنولوجية السابقة: الحواصل، نقص أفضل الممارسات، قيود المستخدمين غير التقنيين، وندرة التمثيلات المحددة جيدًا.

تم وضع Encord Index كأداة رئيسية لإدارة وتنظيم بيانات الذكاء الاصطناعي. كيف يختلف عن منصات إدارة البيانات المتاحة حاليًا؟

هناك beberapa طرق تبرز فيها Encord Index:

دليل قابل للتوسيع: يسمح للمستخدمين بإدارة مليارات، وليس ملايين، من نقاط البيانات. تواجه الأدوات الأخرى مشاكل في التوسيع لبيانات غير منظمَة ومحدودة في توحيد جميع البيانات ذات الصلة في المنظمة.

دليل مرن: يدمج مباشرة مع مخازن البيانات الخاصة وتوفير مخازن السحابة مثل AWS وGCP وAzure. على عكس الأدوات الأخرى التي تقتصر على مزود سحابي واحد أو نظام تخزين داخلي، فإن Index غير متأثر بمكان وجود البيانات. إنه يسمح لك بإدارة البيانات من مصادر متعددة مع الحوكمة والسيطرات على الوصول المناسبة التي تمكنك من تطوير تطبيقات ذكاء اصطناعي آمنة ومتوافقة.

دليل متعدد الوسائط: يدعم الذكاء الاصطناعي متعدد الوسائط، لإدارة البيانات على شكل صور، فيديوهات، صوت، نص، وثائق، وغيرها. Index ليس مقيدًا بنوع واحد من البيانات مثل أدوات LLM اليوم. الإدراك البشري متعدد الوسائط، ونحن نعتقد أن الذكاء الاصطناعي متعدد الوسائط سيكون في قلب موجة التطورات التالية للذكاء الاصطناعي، والتي ستستبدل محادثات الدردشة وأدوات LLM.

كيف يُحسن Encord Index عملية اختيار البيانات المناسبة لنماذج الذكاء الاصطناعي، وما هو الأثر على أداء النموذج؟

يحسن Encord Index اختيار البيانات عن طريق توفير تجميع تلقائي لمجموعات البيانات الكبيرة، مما يساعد الفرق على تحديد الاحتفاظ بالبيانات الأكثر صلة فقط وإزالة البيانات غير المفيدة أو متحيزة. هذا العملية لا تقلل فقط حجم مجموعات البيانات ولكن تحسن أيضًا جودة البيانات المستخدمة لتدريب نماذج الذكاء الاصطناعي. لقد رأى عملاؤنا تحسنًا يصل إلى 20% في نماذجهم مع تحقيق تخفيض بنسبة 35% في حجم مجموعة البيانات وتوفير مئات الآلاف من الدولارات في تكاليف الحوسبة والتعليق البشري.

مع التكامل السريع للتكنولوجيات المتقدمة مثل نموذج Segment Anything من Meta، كيف تظل Encord في الطليعة من المناظر المتطورة للذكاء الاصطناعي؟

قمنا ببناء المنصة عمدًا لتكون قادرة على التكيف بسرعة مع التكنولوجيات الجديدة. نحن نركز على توفير نهج برمجي قابل للتوسيع يدمج بسهولة التطورات مثل SAM، مما يضمن أن مستخدمينا دائمًا مجهزون بأحدث الأدوات للبقاء في المنافسة.

نخطط للبقاء في الطليعة من خلال التركيز على الذكاء الاصطناعي متعدد الوسائط. يمكن لمنصة Encord بالفعل إدارة أنواع بيانات معقدة مثل الصور والفيديوهات والنص، لذلك مع ظهور المزيد من التطورات في الذكاء الاصطناعي متعدد الوسائط، نحن مستعدون.

ما هي التحديات الأكثر شيوعًا التي تواجه الشركات عند إدارة بيانات الذكاء الاصطناعي، وكيف تساعد Encord في معالجة هذه التحديات؟

هناك ثلاث تحديات رئيسية تواجه الشركات:

  • تنظيم البيانات والسيطرات الضعيفة: عندما تقوم الشركات بimplementation حلول الذكاء الاصطناعي، غالبًا ما تواجه حقيقة بيانات منعزلة وغير منظمَة وليس لديها إدارة قوية حولها، مما يحد من استخدامها في أنظمة الذكاء الاصطناعي.
  • نقص الخبراء البشريين: مع تعامل نماذج الذكاء الاصطناعي مع مشاكل أكثر تعقيدًا، سوف يكون هناك قريبًا نقص في الخبراء البشريين لتحضير وتأكيد البيانات. مع زيادة demande الذكاء الاصطناعي، يصبح توسيع قوة العمل البشرية صعبًا ومكلفًا.
  • أدوات غير قابلة للتوسيع: نماذج الذكاء الاصطناعي عالية الأداء جائعة للبيانات من حيث البيانات المطلوبة لتحسين، التحقق، RAG، وغيرها من تدفقات العمل. الأدوات السابقة غير مجهزة لإدارة كمية البيانات وأنواع البيانات المطلوبة لنماذج الإنتاج الحالية.

Encord تحل هذه المشاكل عن طريق توفير تجميع تلقائي للبيانات على نطاق واسع، مما يجعل من السهل تحديد البيانات المؤثرة من البيانات المشكلة وضمان إنشاء مجموعات بيانات تدريب واختبار فعالة. إنها تستخدم نهجًا برمجيًا قابلًا للتوسيع يسهل توسيعه أو تقليله حسب تغيير احتياجات إدارة البيانات. أدوات التعليق البشري المساعدة بالذكاء الاصطناعي تمكن الخبراء البشريين في الدورة من تحقيق أقصى استفادة من كفاءة تدفق العمل. هذا العملية حاسمة بشكل خاص في الصناعات مثل الخدمات المالية والرعاية الصحية، حيث يكون مدربو الذكاء الاصطناعي مكلفين. نحن نجعل من السهل إدارة و理解 جميع بيانات المنظمة غير المنظمة، مما يقلل من الحاجة إلى العمل اليدوي.

كيف تتعامل Encord مع مشكلة التحيز في البيانات والمناطق غير الممثلة في مجموعات البيانات لضمان نماذج الذكاء الاصطناعي العادلة والموازنة؟

معالجة التحيز في البيانات هي تركيز حاسم لنا في Encord. منصتنا تكتشف تلقائيًا وتعرض المناطق التي قد تكون فيها البيانات متحيزة، مما يسمح لأفرقة الذكاء الاصطناعي بمعالجة هذه القضايا قبل أن تؤثر على أداء النموذج. نحن أيضًا نضمن أن تكون المناطق غير الممثلة في مجموعات البيانات مدرجة بشكل适当، مما يساعد في تطوير نماذج الذكاء الاصطناعي العادلة والموازنة. من خلال استخدام أدوات التجميع لدينا، يمكن للفرق أن تكون واثقة من أن نماذجها مدربة على بيانات متنوعة وممثلة.

أحصلت Encord مؤخرًا على 30 مليون دولار في التمويل من الجولة الثانية. كيف سوف يسرع هذا التمويل من خارطة منتجاتك وخطط التوسيع؟

سيتم استخدام التمويل البالغ 30 مليون دولار من الجولة الثانية لتوسيع حجم فريق المنتج والهندسة وأبحاث الذكاء الاصطناعي بشكل كبير خلال الستة أشهر القادمة وتسريع تطوير Encord Index وميزات جديدة. نحن أيضًا نوسع وجودنا في سان فرانسيسكو بمكتب جديد، وسيساعدنا هذا التمويل على توسيع عملياتنا لدعم قاعدة العملاء المتزايدة.

كأصغر شركة ذكاء اصطناعي من Y Combinator التي جمعت تمويل الجولة الثانية، ماذا ت归ز إلى نجاح وتوسع Encord السريع؟

إحدى الأسباب التي سمحت لنا بالنمو بسرعة هي أننا اعتمدنا تركيزًا شديدًا على العملاء في جميع مجالات الشركة. نحن دائمًا في تواصل مع العملاء، نستمع باهتمام إلى مشاكلهم، و “نحمل”هم لتحقيق حلول. من خلال التركيز الشديد على احتياجات العملاء بدلاً من الاهتمام بالتحديثات، قمنا بإنشاء منصة تتوافق مع أفضل فرق الذكاء الاصطناعي عبر مختلف الصناعات. عملاؤنا كانوا أداة في جعلنا نصل إلى حيث نحن اليوم. khảنا لتوسيع نطاقنا بسرعة وفعالية لإدارة تعقيدات بيانات الذكاء الاصطناعي جعلت منا حلًا جذابًا للشركات.

نكلف أيضًا نجاحنا إلى زملائنا وشركائنا ومستثمرينا، الذين عملوا بلا كلل لدعم Encord. العمل مع فرق المنتج والهندسة والتسويق من الدرجة الأولى كان له تأثير كبير في نمونا.

مع زيادة أهمية البيانات في الذكاء الاصطناعي، كيف ترى دور منصات بيانات الذكاء الاصطناعي مثل Encord تتطور في السنوات الخمس القادمة؟

مع نمو تطبيقات الذكاء الاصطناعي في التعقيد، سوف يزداد الحاجة إلى حلول إدارة البيانات الكفء والقابل للتوسيع. أعتقد أن كل شركة سوف يكون لها قسم ذكاء اصطناعي في النهاية، مثل وجود أقسام تكنولوجيا المعلومات اليوم. سوف تكون Encord المنصة الوحيدة التي يحتاجونها لإدارة كميات هائلة من البيانات المطلوبة للذكاء الاصطناعي ووضع النماذج في الإنتاج بسرعة.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Encord.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.