رطم الدكتور نيل ياجر ، المؤسس المشارك وكبير العلماء في Phrasee - سلسلة مقابلات - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

مقابلات

الدكتور نيل ياجر ، المؤسس المشارك وكبير العلماء في Phrasee - سلسلة مقابلات

mm
تحديث on

الدكتور نيل ياجر هو كبير العلماء في Phrasee، ومهندس طريقة Phrasee ، وهي أداة كتابة نصوص مدعومة بالذكاء الاصطناعي ساعدت في تحسين نسخة تسويقية لبعض العلامات التجارية الأكثر شهرة في العالم ، بما في ذلك eBay و Groupon و Virgin - بالإضافة إلى الكثير ، من أستراليا إلى أمريكا ، في أكثر من 20 لغة ، من الإنجليزية إلى اليابانية.

كتب الدكتور ياجر أكثر من اثني عشر منشورًا أكاديميًا ، قام بتأليف كتاب عن التنقيب عن البيانات، وتحمل العديد من براءات الاختراع. باعتباره أحد الخبراء الرائدين في العالم في تسويق الذكاء الاصطناعي ، فهو حاصل على درجة الدكتوراه في علوم الكمبيوتر من جامعة نيو ساوث ويلز في أستراليا.

أنت مخضرم لمدة 20 عامًا في صناعة التكنولوجيا ، ما هي بعض الأدوار السابقة المتعلقة بالذكاء الاصطناعي؟ 

لقد شاركت في الأعمال المتعلقة بالذكاء الاصطناعي منذ حصولي على درجة الدكتوراه في منتصف العقد الأول من القرن الحادي والعشرين. ومع ذلك، فقد مر المجال بالعديد من عمليات إعادة التسمية منذ ذلك الحين. على سبيل المثال، منذ 2000 عامًا قمت بدراسة "التعرف على الأنماط الإحصائية". وبعد بضع سنوات، أصبح هذا معروفًا باسم "التعلم الآلي"، وهو اسم أكثر جاذبية. وفي الآونة الأخيرة، أصبح التعلم الآلي (و"التعلم العميق" على وجه الخصوص) مرادفا لـ "الذكاء الاصطناعي" بشكل عام. لدي مشاعر مختلطة حول هذا الموضوع. فمن ناحية، علمني عملي مع شركة "Phrasee" أهمية العلامة التجارية. ومن ناحية أخرى، فإن مصطلح "الذكاء الاصطناعي" يحمل معه أشياء كثيرة ويمكن أن يؤدي إلى مفاهيم خاطئة حول التكنولوجيا. وأتساءل أين سنكون لو كنا جميعا لا نزال نسميها "التعرف على الأنماط الإحصائية".

معظم أعمالي السابقة كانت في مجالات معالجة الإشارات والرؤية الحاسوبية. لم أتعرض كثيرًا لمعالجة اللغة الطبيعية قبل استخدام العبارة. لقد تعلمت منذ ذلك الحين أن اللغة ربما تكون المشكلة الأكثر صعوبة في الذكاء الاصطناعي.

 

في عام 2008 شاركت في تأليف كتاب بعنوان "نظام القياسات الحيوية وتحليل البيانات: التصميم والتقييم واستخراج البيانات، الذي يربط بين جوانب الإحصاء والتعلم الآلي لتوفير دليل شامل لتقييم وتفسير وفهم البيانات الحيوية. خارج المزيد من موارد الحوسبة ، هل تعتقد أن هذا المجال قد تطور منذ نشر هذا الكتاب؟ هل يمكن أن تصف كيف؟ 

لقد هز التعلم العميق مجالات رؤية الكمبيوتر ومعالجة اللغة والتعلم الآلي منذ أن كتبت هذا الكتاب. لن يكون من الممكن كتابة هذا الكتاب اليوم بدون قسم عن التعلم العميق.

انطلقت ثورة التعلم العميق بالفعل في عام 2012 عندما فاز نموذج التعلم العميق في مسابقة تسمى ImageNet. ImageNet هي مجموعة بيانات للتعرف المرئي على الكائن حيث يحدد الكمبيوتر ما هو موجود في الصورة (على سبيل المثال "كلب" أو "بالون"). لعقود من الزمان ، كان الباحثون يحققون مكاسب متزايدة في مجموعات البيانات المعيارية مثل هذه. يعمل كل حقل فرعي بشكل مستقل ويعتمد بشكل كبير على الخبرة الخاصة بالمجال. بين عشية وضحاها تقريبًا ، أصبحت جميع النماذج التي تم بناؤها بشق الأنفس على مدار سنوات عديدة قديمة. كانت خوارزميات التعلم العميق التي صممها الغرباء تفوز بالمسابقات بهوامش كبيرة. أدى هذا إلى إحداث تحول في صناعة الذكاء الاصطناعي.

لا يزال المجال يتحرك بسرعة وقد تطور حتى منذ بدء Phrasee قبل بضع سنوات فقط. على سبيل المثال ، أدوات التعلم العميق التي نعتمد عليها الآن لم تكن موجودة حتى عندما أسسنا الشركة. وتيرة الابتكار تجلب معها تحديات خاصة بها.

 

هل يمكن أن تشاركنا ما يمكن أن تقدمه Phrasee للشركات؟ 

Phrasee يحل مشكلتين للأعمال. أولاً ، هناك مشكلة كتابة نسخة تسويقية. يوجد الآن قنوات إعلانية أكثر من أي وقت مضى (مثل البريد الإلكتروني ، و AdWords ، ووسائل التواصل الاجتماعي ، والمطبوعات ، والبودكاست ، وما إلى ذلك). من الصعب كتابة نسخة عالية الجودة لكل هذه العناصر وتتوافق مع أسلوب العلامة التجارية ونبرة الصوت. يعالج Phrasee مشكلة الحجم عن طريق إنشاء نسخة تلقائيًا. ثانيًا ، من المهم أن تكون كل اللغة المستخدمة فعالة. لا تقوم Phrasee بإنشاء لغة فحسب ، بل تستخدم أيضًا التعلم الآلي للتنبؤ بتأثير الرسائل وتحسينها وفقًا لذلك.

 

ما الذي جذبك إلى فكرة استخدام معالجة اللغة الطبيعية (NLP) والتعلم العميق لتحسين قوة نسخ الإعلان؟ 

إن استخدام الذكاء الاصطناعي لتعظيم تأثير حملات التسويق الرقمي ليس فكرة جديدة. هناك فرق من الأشخاص الحاصلين على درجة الدكتوراه في الفيزياء الذين تم تجنيدهم للعمل على تحسين الإعلانات. ومع ذلك ، في معظم الحالات ، يركزون جهودهم في البحث والتطوير على أشياء مثل تقسيم الجمهور ، والتخصيص ، وتوقيت التسليم ، وموضع الإعلان ، والخطوط ، وما إلى ذلك. عندما كنا نردد الأفكار لأول مرة حول Phrasee ، لاحظنا أنه يتم تحسين كل شيء تقريبًا عن الإعلانات باستثناء اللغة الفعلية المستخدمة! حددنا ذلك على أنه فجوة في السوق وفرصة كبيرة.

 

Phrasee قادر على تحسين نسخة التسويق بأكثر من 20 لغة ، بما في ذلك اليابانية. هل يمكنك مناقشة بعض مشكلات معالجة اللغة الطبيعية الفريدة التي تواجه اللغات الأجنبية؟ 

أحدث إضافة إلى مجموعتنا من اللغات المدعومة هي الروسية. هذه لغة سلافية ، وهي مختلفة تمامًا عن اللغات الهندو أوروبية الأخرى. في هذه الحالة ، كان من الضروري بناء قواعد جديدة في نظام توليد اللغة لدينا بحيث يكون الإخراج بطلاقة وصحيحة نحويًا. هذه ليست مجرد مشكلة لغة. إنها أيضًا مشكلة تطوير برمجيات. عندما تكون مخرجات نظامنا باللغة الأم للمطور ، فمن السهل نسبيًا اكتشاف الأخطاء والتحقق من أن كل شيء يعمل بشكل صحيح. ومع ذلك ، عند العمل على الروسية أو اليابانية ، يمكن أن نخرج هراء وليس لدينا أي فكرة. من المهم أن يكون لديك متحدث أصلي يشارك عن كثب في عملية ضمان الجودة.

التحدي ليس فقط مع اللغات الأجنبية. هناك بعض الاختلافات الإقليمية المثيرة للاهتمام أيضًا. على سبيل المثال ، توجد اختلافات نحوية في اللغة الإنجليزية في الولايات المتحدة والمملكة المتحدة وأستراليا وكندا وما إلى ذلك. في اللغة الإنجليزية البريطانية "ألقي نظرة" ، بينما في الإنجليزية الأمريكية "تلقي نظرة". يمكن أن يختلف معنى الكلمات أيضًا من مكان إلى آخر. "المطاط" ممحاة في المملكة المتحدة ، لكن الواقي الذكري في أمريكا الشمالية! من أجل استخدام أنظمة NLG لتطبيقات الأعمال ، يجب عليهم التعامل مع كل هذه التفاصيل الدقيقة.

 

هل يمكنك أيضًا مشاركة بعض التفاصيل حول كيفية استخدام التعلم العميق في Phrasee؟ 

هناك مكونان رئيسيان للذكاء الاصطناعي لتقنية Phrasee. الأول هو توليد اللغة الطبيعية (NLG) ، والذي ينتج اللغة بالفعل. والثاني هو التعلم العميق ، والتركيز هنا على الأداء. يمكن أن يعني الأداء أشياء مختلفة حسب السياق. على سبيل المثال ، الهدف من سطر موضوع البريد الإلكتروني هو جذب المستلم لفتح البريد الإلكتروني ومشاهدة المحتوى بداخله. بالنسبة إلى Facebook ، قد يكون الهدف هو زيادة الإعجابات أو المشاركات. بالنظر إلى الكميات الكبيرة من البيانات التاريخية ، من الممكن العثور على اتجاهات وأنماط دقيقة لن يلاحظها الإنسان أبدًا. هذه مشكلة تعلم الآلة قياسية.

يقدم التعلم العميق بعض المزايا مقارنة بنهج التعلم الآلي التقليدي. مع التعلم الآلي التقليدي ، هناك تركيز قوي على "هندسة الميزات". هذا يعني أن المطور يحتاج إلى تحديد ما يعتقد أنه أهم ميزات اللغة. على سبيل المثال الكلمات والطول واستخدام الرموز التعبيرية وما إلى ذلك. المشكلة هي أن هذا مقيد بمهارة وخيال المهندس. ومع ذلك ، مع التعلم العميق ، يتم إدخال النص الخام في النموذج ، ويقوم ببناء التمثيل الآلي الخاص به للغة (يُعرف هذا بالتعلم الشامل). لذلك ، فهي خالية من التحيز البشري وهي نهج قوي. ومع ذلك ، فإن الجانب السلبي هو أنه قد يكون من الصعب فهم سبب تصرف النموذج بالطريقة التي يتصرف بها. "القابلية للتفسير" هي منطقة بحث نشطة داخل مجتمع التعلم العميق. ومع ذلك ، هناك مفاضلة أساسية بين تعقيد النظام وقدرتنا على فهمه. لغة البشر فوضوية ، لذا فإن حلول البرمجة اللغوية العصبية الناجحة عادة ما تكون بدرجة عالية من التعقيد.

 

إحدى وظائف Phrasee هي القدرة على الكتابة بنبرة فريدة للعلامة التجارية ، هل يمكنك توضيح كيفية تنفيذ ذلك؟ 

عندما نقوم بتسجيل عميل جديد ، فإن أول شيء نقوم به هو جمع معلومات حول أسلوب اتصال علامته التجارية. يتضمن ذلك أي إرشادات رسمية للعلامة التجارية ، وحملات تسويقية تاريخية ، وسلسلة من الاستبيانات التي قمنا بتطويرها لهذا الغرض. يتم استخدام كل هذه المعلومات من قبل فريق داخلي من فنيي اللغة لبناء "نموذج لغة" خاص بالعميل. تعد نماذج اللغة الخاصة بنا توليدية ، مما يعني أنها قادرة على إنتاج لغة لم يسبق لها مثيل بأسلوب العميل الفريد.

يمكن تحديث نماذج اللغة في أي وقت. على سبيل المثال ، في الوقت الحالي نحن في ذروة أزمة COVID-19. يقوم فريق اللغة لدينا بمراجعة نماذجنا للتأكد من أنه لا يمكن إنشاء لغة غير لائقة. عبارة مثل "هذه الصفقات تنتشر بسرعة!" ربما كان غير ضار قبل بضعة أشهر ولكن من الواضح أنه غير مناسب في خضم جائحة عالمي. هذا يدل على مرونة نظامنا.

 

ما نوع البيانات التي تحتاجها شركة تريد أن تبدأ مع Phrasee؟ 

بصراحة ، ليست هناك حاجة إلى الكثير من البيانات للبدء معنا. الخطوة الأولى هي تحديد منطقة المشروع المناسبة. على سبيل المثال ، قد يكون هذا هو سطور الموضوع لرسائل البريد الإلكتروني الترويجية الأسبوعية. من الناحية المثالية ، سيكون لهذا الجمهور جمهور كبير نسبيًا وستكون الاتصالات منتظمة. بمجرد تحديد المشروع ، نحتاج إلى معلومات حول الموضوع المقصود وصوت العلامة التجارية من أجل بناء نموذج اللغة. يحتاج Phrasee لنتائج الأداء بشكل مستمر. نظرًا لأن حلنا يستخدم التعلم الآلي ، فمن المهم أن نقيس ونتتبع المقاييس الرئيسية بمرور الوقت. يتم تغذية هذه المعلومات مرة أخرى في نظامنا بحيث يمكن تحسينها باستمرار للمشاركة.

 

هل هناك أي شيء آخر تود مشاركته حول Phrasee؟ 

عندما بدأنا أنا وباري وفيكتوريا شركة Phrasee قبل خمس سنوات ، كنا على يقين من أنها ستكون مجرد مسألة وقت قبل أن تبتكر الكثير من الشركات الناشئة الأخرى منتجات مماثلة. كانت خطتنا هي تحقيق قفزة في المنافسة والبقاء متقدمًا بخطوة. ومع ذلك ، فقد فوجئنا بقلة الداخلين إلى هذه المساحة. اين الجميع؟ أعتقد أن هناك عدة أسباب لذلك ، ولكن أحد الأسباب الرئيسية هو أن اللغة مشكلة صعبة للغاية. أظن أن آخرين حاولوا إنشاء منتجات مماثلة لكنهم فشلوا في وقت مبكر في مراحل البحث والتطوير. هذا دليل على مدى تميز تقنيتنا.

شكرًا لك على المقابلة المفيدة حول معالجة اللغة الطبيعية وتوليد اللغة الطبيعية والتعلم العميق. لمعرفة المزيد من الزوار قد يزورون Phrasee.