مقابلات
فيل هول، رئيس مسؤول النمو في LXT – سلسلة المقابلات

رئيس مسؤول النمو في LXT فيل هول هو المدير التنفيذي السابق في Appen و عضو في مجلس فوربس للتكنولوجيا. في دوره القيادي في Appen، قاد قسمًا يضم أكثر من 1000 موظف ولعب دورًا حاسمًا في تحقيق 17 عامًا متتاليًا من نمو الإيرادات مع ربحية قوية باستمرار. في دوره الحالي مع LXT، يعمل مع فريق مختار من الخبراء لتحقيق أهداف نمو طموحة.
LXT هي شركة رائدة في تدريب البيانات الذكية لتمكين التكنولوجيا الذكية للمنظمات العالمية، بما في ذلك أكبر الشركات التكنولوجية في العالم. في شراكة مع شبكة دولية من المساهمين، تقوم LXT بجمع وتنقيح البيانات عبر عدة وسائط بسرعة ومدى ومرنة كما يتطلبها الشركات. لديهم خبرة عالمية تمتد إلى أكثر من 115 دولة و 750 موقع لغة. تأسست LXT في عام 2010 ومقرها في تورونتو، كندا مع وجود في الولايات المتحدة وأستراليا ومصر وبريطانيا وتركيا. تقدم الشركة خدماتها للعملاء في أمريكا الشمالية وأوروبا وآسيا والمحيط الهادئ والشرق الأوسط.
متى اكتشفت لأول مرة أنك مهتم باللغة؟
لقد كنت مهتمًا باللغة منذ ما أتذكر، ولكن فيما يتعلق bằng التفاعل المباشر مع اللغة واللغويات، كان هناك نقطة تحول كبيرة بالنسبة لي. لقد أدركنا في وقت مبكر جدًا أن أحد أطفالنا يعاني من صعوبات في القراءة، وعندما تحدثنا إلى مدرستها عن الدعم الإضافي، قالوا إن هناك برامج يمكنهم الوصول إليها، ولكن هناك أيضًا أشياء يمكنني القيام بها كمتطوع في المدرسة لمساعدة ابنتنا وأطفال آخرين. كان الأمر ناجحًا، ومن هناك ذهبت لدراسة اللغويات ووجدت نفسي أدرّس في جامعة هنا في سيدني.
كنت تدرّس اللغويات قبل أن تنتقل إلى مجال بيانات الكلام، ما الذي أثار اهتمامك بالتحول؟
Appen في سيدني كانت تحول من كونها عملية تعمل من غرفة في المنزل إلى كونها شركة تجارية كاملة. قيل لي إنهم يبحثون عن لغويين (ربما أكثر دقة، لغوي!) وتم تقديمي إلى المؤسسين جولي وكرايس فونويلر. كان التحول تدريجيًا وامتد على مدى عامين تقريبًا. كنت مترددًا في مغادرة التدريس – العمل مع طلاب تحقيق висок كان ملهمًا وممتعًا جدًا. لكن خاصة خلال تلك السنوات الرائدة، كنت أحل مشكلات صعبة إلى جانب خبراء تكنولوجيا اللغة الرائدين في العالم، ومستويات الحماس كانت عالية. الكثير مما يُعتبر أمرًا مسلمًا به اليوم، كان تحديًا كبيرًا في ذلك الوقت.
خرجت من التقاعد للانضمام إلى LXT. ما الذي دفعك إلى القيام بذلك؟
هذا سؤال مثير للاهتمام لأنني كنت أستمتع بالفعل في التقاعد. في الواقع، اقترب مني المؤسس المشارك والرئيس التنفيذي محمد عمر بعدة أشهر قبل أن أستجيب لاستفساره الأول، لأنني كنت أعيش نمطًا حياة متقاعد ولم أكن قد فكرت حقًا في العودة إلى العمل بدوام كامل.
لكن في النهاية، كانت الفرصة جيدة جدًا لدرجة أنني لم أستطع مقاومتها.
عندما تحدثت مع محمد وآخرون في فريق LXT، عرفت على الفور شغفًا مشتركًا باللغة. الفريق الذي جمعته محمد كان ممتلئًا بالمفكرين الإبداعيين بالطاقة غير المحدودة الذين كانوا ملتزمين تمامًا بمهام الشركة.
كما تعلمت أكثر عن الفرصة مع LXT، أدركت أنها فرصة لم أرد أن أفوتها. هنا كانت شركة ذات إمكانات هائلة للتوسع والنمو في مجال أنا مهتم به. ومع استمرار نمو سوق الذكاء الاصطناعي بشكل أسي، فإن الفرصة لمساعدة المزيد من المنظمات على الانتقال من التجربة إلى الإنتاج هي فرصة مثيرة أنا سعيد جدًا أن أكون جزءًا منها.
ما هي بعض التحديات الحالية لاكتساب البيانات على نطاق واسع؟
التحديات متنوعة مثل التطبيقات التي تدفعها.
من منظور عملي، تشمل التحديات الصحة والأمان والدقة وضمان أن تكون البيانات phù hợp للغرض – وهذا دون أخذ التحديات القانونية والأخلاقية المتزايدة في اكتساب البيانات في الاعتبار.
على سبيل المثال، يتطلب تطوير التكنولوجيا لدعم السيارات ذاتية الحركة جمع كميات هائلة من البيانات عبر سيناريوهات متعددة بحيث تفهم السيارة كيف تستجيب للمواقف في العالم الحقيقي. هناك عدد لا يحصى من الحالات الحدية التي يمكن مواجهتها أثناء القيادة، لذلك تحتاج الخوارزميات التي تعمل تلك المركبات إلى مجموعات بيانات تغطي كل شيء من الشوارع إلى إشارات التوقف إلى الأجسام الساقطة. ثم إذا قمت بضرب ذلك بعدد الأحداث الجوية التي يمكن أن تحدث، يزيد حجم البيانات التدريبية بشكل كبير. تحتاج الشركات التي تدخل مجال السيارات ذاتية الحركة إلى إنشاء خط أنابيب بيانات موثوق به، وعمل ذلك بمفردهم سيتطلب كمية هائلة من الموارد.
مثال آخر هو توسيع منتج ذكاء اصطناعي موجود إلى أسواق جديدة للاستحواذ على حصة السوق و العملاء الجدد. هذا يتطلب بالضرورة بيانات لغة، ولتحقيق الدقة، من الحاسم الحصول على بيانات كلام من المتحدثين الأصليين عبر مجموعة متنوعة من الملفات الديموغرافية. بعد جمع البيانات، تحتاج ملفات الصوت إلى النقل لتدريب خوارزميات اللغة الطبيعية للمنتج. القيام بذلك لعدة لغات وبكميات البيانات التي تحتاجها لتكون فعالة هو تحدي كبير للشركات القيام به بمفردها، خاصة إذا كانت تفتقر إلى الخبرة الداخلية في هذا المجال.
هذه هي مجرد أمثلة قليلة من التحديات الكثيرة الموجودة في جمع البيانات للذكاء الاصطناعي على نطاق واسع، ولكن كما يمكنك أن تتخيلها، تجميع البيانات المنزلية والأجهزة المحمولة والبيومترية كلها تحديات محددة.
ما هي الطرق الحالية التي تجمع وتنقيح البيانات بها LXT؟
في LXT، نجمع وتنقيح البيانات بشكل مختلف لكل عميل، لأن جميع تعاملاتنا مخصصة لتلبية مواصفات عملائنا. نعمل عبر أنواع بيانات متعددة، بما في ذلك الصوت والصورة والكلام والنص والفيديو.对于 جمع البيانات، نعمل مع شبكة من المقاولين على المستوى العالمي لجمع البيانات في هذه الوسائط المختلفة. يمكن أن تتراوح المجموعات من الحصول على البيانات في بيئات العالم الحقيقي مثل المنازل أو المكاتب أو داخل السيارة، إلى الاستوديو مع مهندسين محترفين في حالة بعض مشاريع جمع بيانات الكلام.
قدراتنا على تنقيح البيانات تشمل أيضًا عدة وسائط. بدأت خبرتنا في مجال الكلام وتوسعت خلال 12 عامًا الماضية إلى أكثر من 115 دولة و 750 موقع لغة. هذا يعني أن الشركات من جميع الأحجام يمكن أن تعتمد على LXT لمساعدتها على اختراق مجموعة واسعة من الأسواق واكتساب شريحة جديدة من العملاء. مؤخرًا، توسعت إلى بيانات النص والصورة والفيديو، ومنصتنا الداخلية تستخدم لتسليم بيانات عالية الجودة إلى عملائنا.
منطقة أخرى مثيرة للاهتمام للنمو بالنسبة لنا هي عملنا الآمن لتنقيح البيانات. في هذا العام فقط، توسعنا مساحة مرافقنا الآمنة المعتمدة من ISO 27001 من موقعين إلى خمسة مواقع في جميع أنحاء العالم. لقد طوّرنا دليلًا يسمح لنا بإنشاء مرافق جديدة في غضون بضعة أشهر. الخدمات التي نركز عليها في هذه المرافق الآمنة هي حاليًا تنقيح بيانات الكلام و النقل، ولكنها يمكن استخدامها لتنقيح أنواع بيانات متعددة.
لماذا تُعتبر مصادر البيانات بهذه الطريقة بديلاً متفوقًا للبيانات الاصطناعية؟
البيانات الاصطناعية هي تطور مثير في مجال الذكاء الاصطناعي وهي مناسبة لاستخدامات محددة، خاصة الحالات الحدية التي يصعب التقاطها في العالم الحقيقي. استخدام البيانات الاصطناعية في زيادة، خاصة في المراحل الأولى من نضج الذكاء الاصطناعي عندما لا تزال الشركات في وضع تجريبي. ومع ذلك، تظهر أبحاثنا أن عندما تنضج الشركات استراتيجيات الذكاء الاصطناعي وت推د المزيد من النماذج إلى الإنتاج، فإنهم أكثر احتمالية لاستخدام أساليب التعلم الآلي الخاضعة للإشراف أو شبه الخاضعة للإشراف التي تعتمد على بيانات تم تعليمها من قبل الإنسان.
البشر أفضل من الحواسيب في فهم الدقة لإنشاء البيانات اللازمة لتدريب نماذج التعلم الآلي على الأداء بدقة عالية. كما أن الإشراف البشري حاسم لخفض الانحياز.
لماذا هذه البيانات مهمة جدًا لمعالجة الكلام واللغة الطبيعية؟
لكي تعمل خوارزميات معالجة الكلام واللغة الطبيعية بشكل فعال في الأسواق المقصودة، تحتاج إلى تدريبها بكميات كبيرة من البيانات التي تم الحصول عليها من المتحدثين الأصليين الذين لديهم السياق الثقافي للمستخدمين النهائيين الذين يمثلونهم. بدون هذه البيانات، سيكون تبني الذكاء الاصطناعي للكلام محدودًا جدًا.
بالإضافة إلى ذلك، يجب مراعاة البيئة عند جمع بيانات الكلام. إذا كانت حلول الذكاء الاصطناعي للكلام التي يتم تدريبها ستستخدم في سيارة، على سبيل المثال، هناك ظروف جوية وطرق مختلفة تؤثر على الكلام ويتعين مراعاتها. هذه هي سيناريوهات معقدة حيث يمكن أن يساعد شريك بيانات محترف.
هل هناك أي شيء آخر تود مشاركته حول LXT؟
أولاً، أريد أن أشكركم على الفرصة لمشاركة قصتنا! أود أن أبرز أن شركتنا ملتزمة بمساعدة المنظمات من جميع الأحجام على النجاح في مبادرات الذكاء الاصطناعي. لقد ركزنا على تسليم بيانات الذكاء الاصطناعي المخصصة للشركات في جميع أنحاء العالم لمدة 12 عامًا، وسنكون سعداء بالتواصل مع أي شخص يبحث عن إنشاء خط أنابيب بيانات موثوق به لدعم مشاريعه التي تتعلق بالذكاء الاصطناعي.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا LXT.












