اتصل بنا للحصول على مزيد من المعلومات

ألكسندر ياراتس، رئيس قسم البحث في Perplexity – سلسلة المقابلات

تقديم العرض الوظيفي

ألكسندر ياراتس، رئيس قسم البحث في Perplexity – سلسلة المقابلات

mm

ألكسندر ياراتس هو رئيس البحث في الحيرة منظمة العفو الدولية. بدأ حياته المهنية في ياندكس في عام 2017، وكان يدرس بالتزامن في مدرسة ياندكس لتحليل البيانات. كانت السنوات الأولى مكثفة ولكنها مجزية، مما دفعه إلى النمو ليصبح قائدًا للفريق الهندسي. مدفوعًا بطموحه للعمل مع أحد عمالقة التكنولوجيا، انضم إلى شركة Google في عام 2022 كمهندس برمجيات أول، مع التركيز على فريق مساعد Google (المعروف لاحقًا باسم Google Bard). ثم انتقل بعد ذلك إلى الحيرة كرئيس للبحث.

Perplexity AI هو محرك بحث ومحادثة مدعوم بالذكاء الاصطناعي يجيب على الاستفسارات باستخدام النص التنبؤي باللغة الطبيعية. تم إطلاق Perplexity في عام 2022، وتقوم بإنشاء إجابات باستخدام المصادر من الويب وتستشهد بالروابط داخل الاستجابة النصية.

ما الذي دفعك في البداية إلى الاهتمام بالتعلم الآلي؟

كان اهتمامي بالتعلم الآلي (ML) عملية تدريجية. خلال سنوات دراستي، قضيت وقتًا طويلاً في دراسة الرياضيات ونظرية الاحتمالات والإحصاء، وحصلت على فرصة لتجربة خوارزميات التعلم الآلي الكلاسيكية مثل الانحدار الخطي وKNN. كان من المثير للاهتمام رؤية كيفية بناء دالة تنبؤية مباشرة من البيانات ثم استخدامها للتنبؤ بالبيانات غير المرئية. قادني هذا الاهتمام إلى كلية ياندكس لتحليل البيانات، وهو برنامج ماجستير في التعلم الآلي شديد التنافسية في روسيا (يتم قبول 200 طالب فقط كل عام). هناك، تعلمت الكثير عن خوارزميات التعلم الآلي الأكثر تقدمًا وطورت حدسي. كانت أهم نقطة خلال هذه العملية عندما تعرفت على الشبكات العصبية والتعلم العميق. أصبح واضحًا جدًا لي أن هذا هو ما أرغب في متابعته على مدى العقدين المقبلين.

لقد عملت سابقًا في Google كمهندس برمجيات أول لمدة عام، ما هي بعض النقاط الرئيسية التي استخلصتها من هذه التجربة؟

قبل الانضمام إلى Google، أمضيت أكثر من أربع سنوات في Yandex، مباشرة بعد التخرج من مدرسة Yandex لتحليل البيانات. وهناك، قمت بقيادة فريق قام بتطوير أساليب مختلفة للتعلم الآلي لشركة Yandex Taxi (نظير لشركة Uber في روسيا). انضممت إلى هذه المجموعة في بدايتها وأتيحت لي فرصة العمل ضمن فريق متماسك وسريع الخطى نما بسرعة على مدار أربع سنوات، سواء من حيث عدد الموظفين (من 30 إلى 500 شخص) أو القيمة السوقية (أصبحت أكبر خدمة سيارات أجرة). مزود في روسيا، متجاوزًا أوبر وغيرها).

طوال هذه الفترة، حظيت بشرف بناء العديد من الأشياء من الصفر وإطلاق العديد من المشاريع من الصفر إلى الواحد. أحد المشاريع الأخيرة التي عملت عليها كان بناء روبوتات الدردشة لدعم الخدمة. وهناك، ألقيت نظرة أولية على قوة نماذج اللغات الكبيرة، وكنت منبهرًا بمدى أهميتها في المستقبل. قادني هذا الإدراك إلى شركة Google، حيث انضممت إلى فريق Google Assistant، والذي تمت إعادة تسميته لاحقًا باسم Google Bard (أحد منافسي Perplexity).

في Google، أتيحت لي الفرصة لمعرفة الشكل الذي تبدو عليه البنية التحتية ذات المستوى العالمي، وكيفية عمل البحث وLLMs، وكيفية تفاعلهما مع بعضهما البعض لتقديم إجابات واقعية ودقيقة. لقد كانت هذه تجربة تعليمية رائعة، ولكن مع مرور الوقت شعرت بالإحباط بسبب بطء وتيرة العمل في Google والشعور بعدم إنجاز أي شيء على الإطلاق. كنت أرغب في العثور على شركة تعمل في مجال البحث وLLMs وتتحرك بسرعة، أو حتى بشكل أسرع، مما كنت عليه عندما كنت في Yandex. ولحسن الحظ، حدث هذا بشكل عضوي.

داخليًا في Google، بدأت أرى لقطات شاشة لـ Perplexity والمهام التي تتطلب مقارنة مساعد Google مع Perplexity. أثار هذا اهتمامي بالشركة، وبعد عدة أسابيع من البحث، اقتنعت برغبتي في العمل هناك، لذا تواصلت مع الفريق وعرضت خدماتي.

هل يمكنك تحديد دورك ومسؤولياتك الحالية في Perplexity؟

أعمل حاليًا كرئيس لفريق البحث وأنا مسؤول عن بناء نظام الاسترجاع الداخلي لدينا الذي يعمل على تشغيل Perplexity. يعمل فريق البحث لدينا على بناء نظام الزحف على الويب، ومحرك الاسترجاع، وخوارزميات التصنيف. تسمح لي هذه التحديات بالاستفادة من الخبرة التي اكتسبتها في Google (العمل على البحث وLLMs) وكذلك في Yandex. من ناحية أخرى، يوفر منتج Perplexity فرصًا فريدة لإعادة تصميم وإعادة هندسة الشكل الذي يجب أن يبدو عليه نظام الاسترجاع في عالم يتمتع ببرامج ماجستير إدارة أعمال قوية جدًا. على سبيل المثال، لم يعد من المهم تحسين خوارزميات التصنيف لزيادة احتمالية النقرة؛ وبدلاً من ذلك، فإننا نركز على تحسين مدى فائدة إجاباتنا وواقعيتها. هذا هو التمييز الأساسي بين محرك الإجابة ومحرك البحث. نحاول أنا وفريقي بناء شيء يتجاوز الروابط الزرقاء العشرة التقليدية، ولا أستطيع التفكير في أي شيء أكثر إثارة للعمل عليه حاليًا.

هل يمكنك توضيح الانتقال في Perplexity من تطوير أداة تحويل النص إلى SQL إلى التركيز على إنشاء بحث مدعوم بالذكاء الاصطناعي؟

لقد عملنا في البداية على إنشاء محرك تحويل النص إلى SQL الذي يوفر محرك إجابات متخصصًا في المواقف التي تحتاج فيها إلى الحصول على إجابة سريعة استنادًا إلى بياناتك المنظمة (على سبيل المثال، جدول بيانات أو جدول). لقد أتاح لنا العمل في مشروع تحويل النص إلى SQL اكتساب فهم أعمق بكثير لـ LLMs وRAG، وقادنا إلى إدراك أساسي: هذه التكنولوجيا أقوى وأكثر عمومية مما كنا نعتقد في الأصل. وسرعان ما أدركنا أنه يمكننا الذهاب إلى ما هو أبعد من مصادر البيانات جيدة التنظيم ومعالجة البيانات غير المنظمة أيضًا.

ما هي التحديات والأفكار الرئيسية خلال هذا التحول؟

تمثلت التحديات الرئيسية خلال هذا التحول في تحويل شركتنا من شركة إلى شركة للمستهلكين، وإعادة بناء بنيتنا التحتية لدعم البحث غير المنظم. وسرعان ما أدركنا خلال عملية الترحيل هذه أن العمل على منتج موجه للعملاء أصبح أكثر متعة، حيث نتلقى تدفقًا مستمرًا من التعليقات والتفاعل، وهو أمر لم نلحظه كثيرًا عندما كنا نبني محرك تحويل النصوص إلى SQL ونركز على حلول المؤسسات.

يبدو أن تقنية التوليد المعزز بالاسترجاع (RAG) تُعدّ حجر الأساس في قدرات البحث في Perplexity. هل يمكنك شرح كيفية استخدام Perplexity لتقنية التوليد المعزز بالاسترجاع بشكل مختلف مقارنةً بالمنصات الأخرى، وكيف يؤثر ذلك على دقة نتائج البحث؟

RAG هو مفهوم عام لتوفير المعرفة الخارجية لـ LLM. في حين أن الفكرة قد تبدو بسيطة للوهلة الأولى، إلا أن بناء مثل هذا النظام الذي يخدم عشرات الملايين من المستخدمين بكفاءة ودقة يمثل تحديًا كبيرًا. كان علينا تصميم هذا النظام داخليًا من الصفر وبناء العديد من المكونات المخصصة التي أثبتت أهميتها لتحقيق الأجزاء الأخيرة من الدقة والأداء. لقد صممنا نظامنا حيث تعمل العشرات من حاملي شهادات LLM (تتراوح من الكبيرة إلى الصغيرة) بالتوازي للتعامل مع طلب مستخدم واحد بسرعة وفعالية من حيث التكلفة. لقد أنشأنا أيضًا بنية تحتية للتدريب والاستدلال تسمح لنا بتدريب طلاب ماجستير إدارة الأعمال جنبًا إلى جنب مع البحث الشامل، بحيث يتم دمجهم بشكل محكم. وهذا يقلل بشكل كبير من الهلوسة ويحسن من فائدة إجاباتنا.

في ظل القيود التي تواجهها شركة Perplexity مقارنة بموارد Google، كيف تدير الشركة استراتيجياتها الخاصة بفهرسة الويب والزحف إليه لتظل قادرة على المنافسة وتضمن الحصول على معلومات محدثة؟

يتطلب بناء فهرس شامل كفهرس جوجل وقتًا وموارد كبيرة. لذا، نركز على المواضيع التي يستفسر عنها مستخدمونا باستمرار على Perplexity. وقد اتضح أن غالبية مستخدمينا يستخدمون Perplexity كمساعد في العمل والبحث، وتبحث العديد من الاستفسارات عن أجزاء ويب عالية الجودة وموثوقة ومفيدة. هذا توزيع أسّي، حيث يمكنك تحقيق نتائج مهمة باتباع نهج 80/20. بناءً على هذه الرؤى، تمكنا من بناء فهرس أكثر شمولًا، مُحسّن للجودة والمصداقية. حاليًا، نقضي وقتًا أقل في البحث عن النتائج الأولية، ولكن مع توسيع نطاق بنيتنا التحتية، سنسعى أيضًا للبحث عن النتائج الأولية.

كيف تعمل نماذج اللغة الكبيرة (LLMs) على تعزيز قدرات البحث في Perplexity، وما الذي يجعلها فعالة بشكل خاص في تحليل المعلومات وعرضها من الويب؟

نحن نستخدم LLMs في كل مكان، سواء للمعالجة في الوقت الفعلي أو دون الاتصال بالإنترنت. تسمح لنا LLMs بالتركيز على الأجزاء الأكثر أهمية وذات الصلة بصفحات الويب. لقد تجاوزوا أي شيء من قبل في تعظيم نسبة الإشارة إلى الضوضاء، مما يجعل من الأسهل بكثير معالجة العديد من الأشياء التي لم يكن من الممكن معالجتها من قبل بواسطة فريق صغير. بشكل عام، ربما يكون هذا هو الجانب الأكثر أهمية في LLMs: فهو يمكّنك من القيام بأشياء معقدة مع فريق صغير جدًا.

وبالنظر إلى المستقبل، ما هي التحديات التكنولوجية أو السوقية الرئيسية التي تتوقعها شركة Perplexity؟

وبينما نتطلع إلى المستقبل، فإن أهم التحديات التكنولوجية بالنسبة لنا سوف تتمحور حول الاستمرار في تحسين مدى فائدة إجاباتنا ودقتها. نحن نهدف إلى زيادة نطاق وتعقيد أنواع الاستفسارات والأسئلة التي يمكننا الإجابة عليها بشكل موثوق. إلى جانب هذا، نحن نهتم كثيرًا بالسرعة وكفاءة الخدمة لنظامنا وسنركز بشكل كبير على خفض تكاليف الخدمة قدر الإمكان دون المساس بجودة منتجنا.

برأيك، لماذا يعتبر أسلوب Perplexity في البحث متفوقًا على أسلوب Google في ترتيب المواقع الإلكترونية وفقًا للروابط الخلفية، وغيرها من مقاييس ترتيب محركات البحث المثبتة؟

نحن نعمل على تحسين مقياس تصنيف مختلف تمامًا عن محركات البحث الكلاسيكية. تم تصميم هدف التصنيف الخاص بنا للجمع بين نظام الاسترجاع وLLMs. ويختلف هذا النهج تمامًا عن نهج محركات البحث الكلاسيكية، التي تعمل على تحسين احتمالية النقرة أو ظهور الإعلان.

شكرا لك على المقابلة الرائعة ، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا الحيرة منظمة العفو الدولية.

أنطوان هو قائد صاحب رؤية وشريك مؤسس لشركة Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. وهو رجل أعمال متسلسل، ويعتقد أن الذكاء الاصطناعي سيكون له نفس التأثير على المجتمع مثل الكهرباء، وغالبًا ما يتم ضبطه وهو يهذي عن إمكانات التقنيات المبتكرة والذكاء الاصطناعي العام.

ك المستقبليوهو مكرس لاستكشاف كيف ستشكل هذه الابتكارات عالمنا. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التقنيات المتطورة التي تعمل على إعادة تعريف المستقبل وإعادة تشكيل قطاعات بأكملها.