เชื่อมต่อกับเรา

บทสัมภาษณ์

Alexandr Yarats หัวหน้าฝ่ายการค้นหาของ Perplexity – ซีรีส์สัมภาษณ์

mm

การตีพิมพ์

 on

Alexandr Yarats เป็นหัวหน้าฝ่ายค้นหาของ AI ความฉงนสนเท่ห์- เขาเริ่มต้นอาชีพที่ Yandex ในปี 2017 โดยศึกษาที่ Yandex School of Data Analysis ไปพร้อมๆ กัน ช่วงปีแรกๆ เต็มไปด้วยความเข้มข้นแต่ก็คุ้มค่า ผลักดันให้เขาเติบโตจนกลายเป็นหัวหน้าทีมวิศวกรรม ด้วยความปรารถนาที่จะร่วมงานกับบริษัทเทคโนโลยียักษ์ใหญ่ เขาจึงได้ร่วมงานกับ Google ในปี 2022 ในตำแหน่งวิศวกรซอฟต์แวร์อาวุโส โดยมุ่งเน้นที่ทีม Google Assistant (ต่อมาคือ Google Bard) จากนั้นเขาก็ย้ายไปที่ Perplexity ในตำแหน่งหัวหน้าฝ่ายค้นหา

Perplexity AI เป็นเครื่องมือค้นหาการสนทนาและการวิจัยที่ขับเคลื่อนด้วย AI ซึ่งตอบคำถามโดยใช้ข้อความคาดการณ์ภาษาธรรมชาติ Perplexity เปิดตัวในปี 2022 สร้างคำตอบโดยใช้แหล่งข้อมูลจากเว็บและอ้างอิงลิงก์ภายในข้อความตอบกลับ

อะไรทำให้คุณสนใจแมชชีนเลิร์นนิงตั้งแต่แรก

ความสนใจของฉันในการเรียนรู้ของเครื่อง (ML) เป็นกระบวนการที่ค่อยเป็นค่อยไป ในช่วงปีการศึกษา ฉันใช้เวลาส่วนใหญ่ในการศึกษาคณิตศาสตร์ ทฤษฎีความน่าจะเป็น และสถิติ และได้รับโอกาสในการเล่นกับอัลกอริธึมแมชชีนเลิร์นนิงแบบคลาสสิก เช่น การถดถอยเชิงเส้นและ KNN เป็นเรื่องน่าทึ่งที่ได้เห็นว่าคุณสามารถสร้างฟังก์ชันการทำนายได้โดยตรงจากข้อมูล แล้วใช้มันเพื่อทำนายข้อมูลที่มองไม่เห็นได้อย่างไร ความสนใจนี้ทำให้ฉันได้เข้าเรียนที่ Yandex School of Data Analysis ซึ่งเป็นหลักสูตรปริญญาโทด้านแมชชีนเลิร์นนิงที่มีการแข่งขันสูงในรัสเซีย (รับเพียง 200 คนในแต่ละปี) ที่นั่น ฉันได้เรียนรู้มากมายเกี่ยวกับอัลกอริธึมการเรียนรู้ของเครื่องขั้นสูงและสร้างสัญชาตญาณของตัวเอง จุดที่สำคัญที่สุดในระหว่างกระบวนการนี้คือตอนที่ฉันเรียนรู้เกี่ยวกับโครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก มันชัดเจนสำหรับฉันว่านี่คือสิ่งที่ฉันอยากจะไล่ตามในอีกสองสามทศวรรษข้างหน้า

ก่อนหน้านี้คุณเคยทำงานที่ Google ในตำแหน่งวิศวกรซอฟต์แวร์อาวุโสเป็นเวลา 1 ปี อะไรคือสิ่งสำคัญที่คุณได้รับจากประสบการณ์นี้

ก่อนที่จะมาร่วมงานกับ Google ฉันเคยทำงานที่ Yandex มากกว่าสี่ปีทันทีหลังจากสำเร็จการศึกษาจาก Yandex School of Data Analysis ที่นั่น ฉันเป็นผู้นำทีมที่พัฒนาวิธีการเรียนรู้ของเครื่องต่างๆ สำหรับ Yandex Taxi (คล้ายกับ Uber ในรัสเซีย) ฉันเข้าร่วมกลุ่มนี้ตั้งแต่เริ่มก่อตั้ง และมีโอกาสทำงานในทีมที่ใกล้ชิดและรวดเร็วซึ่งเติบโตอย่างรวดเร็วในช่วงสี่ปี ทั้งในด้านจำนวนพนักงาน (ตั้งแต่ 30 ถึง 500 คน) และมูลค่าตลาด (กลายเป็นบริการรถแท็กซี่ที่ใหญ่ที่สุด) ผู้ให้บริการในรัสเซีย แซงหน้า Uber และอื่นๆ)

ตลอดเวลานี้ ฉันได้รับสิทธิพิเศษในการสร้างสิ่งต่างๆ มากมายตั้งแต่เริ่มต้นและเปิดตัวหลายโครงการตั้งแต่ศูนย์ไปจนถึงหนึ่งโครงการ หนึ่งในโปรเจ็กต์สุดท้ายที่ฉันทำคือการสร้างแชทบอทเพื่อรองรับการบริการ ที่นั่น ฉันได้เห็นแวบแรกเกี่ยวกับพลังของแบบจำลองภาษาขนาดใหญ่ และรู้สึกทึ่งกับความสำคัญของแบบจำลองเหล่านี้ในอนาคต การตระหนักรู้นี้นำฉันมาสู่ Google ซึ่งฉันได้เข้าร่วมทีม Google Assistant ซึ่งต่อมาได้เปลี่ยนชื่อเป็น Google Bard (หนึ่งในคู่แข่งของ Perplexity)

ที่ Google ฉันมีโอกาสเรียนรู้ว่าโครงสร้างพื้นฐานระดับโลกมีลักษณะอย่างไร Search และ LLM ทำงานอย่างไร และทั้งสองอย่างนี้โต้ตอบกันอย่างไรเพื่อให้คำตอบที่เป็นข้อเท็จจริงและถูกต้อง นี่เป็นประสบการณ์การเรียนรู้ที่ยอดเยี่ยม แต่เมื่อเวลาผ่านไป ฉันรู้สึกหงุดหงิดกับการทำงานที่ช้าของ Google และความรู้สึกที่ไม่มีอะไรสำเร็จเลย ฉันต้องการค้นหาบริษัทที่ทำงานด้านการค้นหาและ LLM และดำเนินการได้เร็วหรือเร็วกว่าตอนที่ฉันอยู่ที่ Yandex โชคดีที่สิ่งนี้เกิดขึ้นโดยธรรมชาติ

ภายใน Google ฉันเริ่มเห็นภาพหน้าจอของ Perplexity และงานที่ต้องเปรียบเทียบ Google Assistant กับ Perplexity สิ่งนี้ทำให้ฉันสนใจบริษัทนี้มาก และหลังจากค้นคว้ามาหลายสัปดาห์ ฉันก็มั่นใจว่าอยากทำงานที่นั่น ฉันจึงติดต่อทีมและเสนอบริการต่างๆ

คุณสามารถกำหนดบทบาทและความรับผิดชอบปัจจุบันของคุณที่ Perplexity ได้หรือไม่?

ขณะนี้ฉันทำหน้าที่เป็นหัวหน้าทีมค้นหาและรับผิดชอบในการสร้างระบบการสืบค้นข้อมูลภายในที่ขับเคลื่อน Perplexity ทีมค้นหาของเราทำงานเพื่อสร้างระบบการรวบรวมข้อมูลเว็บ กลไกการดึงข้อมูล และอัลกอริธึมการจัดอันดับ ความท้าทายเหล่านี้ทำให้ฉันสามารถใช้ประโยชน์จากประสบการณ์ที่ได้รับจาก Google (การทำงานเกี่ยวกับการค้นหาและ LLM) รวมถึงที่ Yandex ในทางกลับกัน ผลิตภัณฑ์ของ Perplexity มอบโอกาสพิเศษในการออกแบบใหม่และปรับโครงสร้างระบบการดึงข้อมูลใหม่ว่าควรมีลักษณะอย่างไรในโลกที่มี LLM ที่ทรงพลังมาก ตัวอย่างเช่น การเพิ่มประสิทธิภาพอัลกอริธึมการจัดอันดับเพื่อเพิ่มความน่าจะเป็นของการคลิกนั้นไม่สำคัญอีกต่อไป แต่เรากำลังมุ่งเน้นไปที่การปรับปรุงความช่วยเหลือและข้อเท็จจริงของคำตอบของเราแทน นี่คือความแตกต่างพื้นฐานระหว่างระบบตอบรับและเครื่องมือค้นหา ทีมของฉันและฉันกำลังพยายามสร้างบางสิ่งที่จะไปไกลกว่าลิงก์สีน้ำเงิน 10 ลิงก์แบบเดิมๆ และฉันไม่คิดว่าจะมีอะไรน่าตื่นเต้นไปกว่านี้อีกแล้วในการทำงานตอนนี้

คุณสามารถอธิบายรายละเอียดเกี่ยวกับการเปลี่ยนแปลงที่ Perplexity จากการพัฒนาเครื่องมือข้อความเป็น SQL ไปสู่การสร้างการค้นหาที่ขับเคลื่อนด้วย AI ได้หรือไม่

ในตอนแรกเราทำงานเกี่ยวกับการสร้างเครื่องมือแปลงข้อความเป็น SQL ที่ให้เครื่องมือตอบแบบพิเศษในสถานการณ์ที่คุณต้องการได้รับคำตอบอย่างรวดเร็วโดยอิงตามข้อมูลที่มีโครงสร้างของคุณ (เช่น สเปรดชีตหรือตาราง) การทำงานในโครงการข้อความเป็น SQL ช่วยให้เรามีความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับ LLM และ RAG และนำเราไปสู่การตระหนักรู้ที่สำคัญ: เทคโนโลยีนี้มีประสิทธิภาพและกว้างไกลกว่าที่เราคิดไว้มาก เราตระหนักได้อย่างรวดเร็วว่าเราสามารถไปได้ไกลกว่าแหล่งข้อมูลที่มีโครงสร้างที่ดีและจัดการกับข้อมูลที่ไม่มีโครงสร้างได้เช่นกัน

อะไรคือความท้าทายและข้อมูลเชิงลึกที่สำคัญในระหว่างการเปลี่ยนแปลงนี้

ความท้าทายที่สำคัญระหว่างการเปลี่ยนแปลงนี้คือการเปลี่ยนบริษัทของเราจากการเป็น B2B เป็น B2C และการสร้างกลุ่มโครงสร้างพื้นฐานของเราใหม่เพื่อรองรับการค้นหาที่ไม่มีโครงสร้าง อย่างรวดเร็วในระหว่างกระบวนการโยกย้ายนี้ เราตระหนักได้ว่าการทำงานกับผลิตภัณฑ์ที่ต้องพบปะกับลูกค้าจะสนุกกว่ามาก เมื่อคุณเริ่มได้รับคำติชมและการมีส่วนร่วมอย่างต่อเนื่อง ซึ่งเป็นสิ่งที่เราไม่ได้เห็นมากนักเมื่อเราสร้าง เอ็นจิ้นข้อความเป็น SQL และมุ่งเน้นไปที่โซลูชันระดับองค์กร

การดึงข้อมูล-เสริมการสร้าง (RAG) ดูเหมือนจะเป็นรากฐานสำคัญของความสามารถในการค้นหาของ Perplexity คุณช่วยอธิบายได้ไหมว่า Perplexity ใช้ RAG แตกต่างจากแพลตฟอร์มอื่นๆ อย่างไร และสิ่งนี้ส่งผลต่อความแม่นยำของผลการค้นหาอย่างไร

RAG เป็นแนวคิดทั่วไปในการให้ความรู้ภายนอกแก่ LLM แม้ว่าแนวคิดนี้อาจดูเรียบง่ายเมื่อมองแวบแรก แต่การสร้างระบบที่รองรับผู้ใช้หลายสิบล้านคนอย่างมีประสิทธิภาพและแม่นยำถือเป็นความท้าทายที่สำคัญ เราต้องออกแบบระบบนี้ภายในบริษัทตั้งแต่เริ่มต้น และสร้างส่วนประกอบแบบกำหนดเองจำนวนมากซึ่งพิสูจน์แล้วว่ามีความสำคัญอย่างยิ่งในการบรรลุความแม่นยำและประสิทธิภาพขั้นสุดท้าย เราออกแบบระบบของเราโดยที่ LLM นับสิบ (ตั้งแต่ใหญ่ไปจนถึงเล็ก) ทำงานคู่ขนานเพื่อจัดการคำขอของผู้ใช้หนึ่งคนอย่างรวดเร็วและคุ้มต้นทุน นอกจากนี้เรายังสร้างโครงสร้างพื้นฐานการฝึกอบรมและการอนุมานที่ช่วยให้เราสามารถฝึกอบรม LLM ร่วมกับการค้นหาตั้งแต่ต้นทางถึงปลายทาง ดังนั้นจึงมีการบูรณาการอย่างแนบแน่น สิ่งนี้ช่วยลดอาการประสาทหลอนได้อย่างมากและปรับปรุงความช่วยเหลือในคำตอบของเรา

ด้วยข้อจำกัดเมื่อเทียบกับทรัพยากรของ Google Perplexity จัดการกลยุทธ์การรวบรวมข้อมูลเว็บและจัดทำดัชนีเพื่อรักษาความสามารถในการแข่งขันและรับรองข้อมูลที่ทันสมัยได้อย่างไร

การสร้างดัชนีให้ครอบคลุมพอๆ กับของ Google ต้องใช้เวลาและทรัพยากรค่อนข้างมาก แต่เรากำลังมุ่งเน้นไปที่หัวข้อที่ผู้ใช้ของเรามักสอบถามเกี่ยวกับ Perplexity ปรากฎว่าผู้ใช้ส่วนใหญ่ของเราใช้ Perplexity เป็นตัวช่วยในการทำงาน/วิจัย และคำถามมากมายก็ค้นหาส่วนที่มีคุณภาพสูง เชื่อถือได้ และเป็นประโยชน์ของเว็บ นี่คือการกระจายกฎหมายพลังงาน ซึ่งคุณสามารถบรรลุผลลัพธ์ที่สำคัญได้ด้วยแนวทาง 80/20 จากข้อมูลเชิงลึกเหล่านี้ เราสามารถสร้างดัชนีที่มีขนาดกะทัดรัดมากขึ้นซึ่งปรับให้เหมาะสมกับคุณภาพและความเป็นจริงได้ ในปัจจุบัน เราใช้เวลาน้อยลงในการไล่ตามหาง แต่เมื่อเราขยายโครงสร้างพื้นฐานของเรา เราก็จะไล่ตามหางด้วย

โมเดลภาษาขนาดใหญ่ (LLM) ช่วยเพิ่มความสามารถในการค้นหาของ Perplexity ได้อย่างไร และอะไรทำให้พวกเขามีประสิทธิภาพเป็นพิเศษในการแยกวิเคราะห์และนำเสนอข้อมูลจากเว็บ

เราใช้ LLM ทุกที่ ทั้งสำหรับการประมวลผลแบบเรียลไทม์และออฟไลน์ LLM ช่วยให้เราสามารถมุ่งเน้นไปที่ส่วนที่สำคัญที่สุดและเกี่ยวข้องที่สุดของหน้าเว็บ พวกเขาก้าวไปไกลกว่าสิ่งใดๆ เมื่อก่อนในการเพิ่มอัตราส่วนสัญญาณต่อเสียงรบกวนให้สูงสุด ซึ่งทำให้ง่ายขึ้นมากในการจัดการกับหลายๆ สิ่งที่ทีมเล็กๆ ไม่สามารถดำเนินการได้ก่อนหน้านี้ โดยทั่วไป นี่อาจเป็นส่วนที่สำคัญที่สุดของ LLM: ช่วยให้คุณสามารถทำสิ่งที่ซับซ้อนกับทีมขนาดเล็กมากได้

เมื่อมองไปข้างหน้า อะไรคือความท้าทายหลักทางเทคโนโลยีหรือตลาดที่ Perplexity คาดการณ์ไว้?

เมื่อเรามองไปข้างหน้า ความท้าทายทางเทคโนโลยีที่สำคัญที่สุดสำหรับเราจะมุ่งเน้นไปที่การปรับปรุงความช่วยเหลือและความถูกต้องของคำตอบของเราอย่างต่อเนื่อง เรามุ่งหวังที่จะเพิ่มขอบเขตและความซับซ้อนของประเภทคำถามและคำถามที่เราสามารถตอบได้อย่างน่าเชื่อถือ นอกจากนี้เรายังให้ความสำคัญกับความเร็วและประสิทธิภาพการให้บริการของระบบของเราเป็นอย่างมาก และจะมุ่งเน้นอย่างมากในการลดต้นทุนการให้บริการให้มากที่สุดเท่าที่จะทำได้ โดยไม่กระทบต่อคุณภาพของผลิตภัณฑ์ของเรา

ในความเห็นของคุณ เหตุใดแนวทางการค้นหาของ Perplexity จึงเหนือกว่าแนวทางของ Google ในการจัดอันดับเว็บไซต์ตามลิงก์ย้อนกลับ และตัวชี้วัดการจัดอันดับเครื่องมือค้นหาอื่น ๆ ที่ได้รับการพิสูจน์แล้ว

เรากำลังเพิ่มประสิทธิภาพการวัดการจัดอันดับที่แตกต่างอย่างสิ้นเชิงจากเครื่องมือค้นหาแบบคลาสสิก วัตถุประสงค์การจัดอันดับของเราได้รับการออกแบบเพื่อรวมระบบการดึงข้อมูลและ LLM เข้าด้วยกัน แนวทางนี้ค่อนข้างแตกต่างจากเครื่องมือค้นหาแบบเดิม ซึ่งช่วยเพิ่มความน่าจะเป็นของการคลิกหรือการแสดงโฆษณา

ขอบคุณสำหรับบทสัมภาษณ์ที่ดี ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม AI ความฉงนสนเท่ห์.

ผู้ร่วมก่อตั้ง unite.AI และเป็นสมาชิกของ สภาเทคโนโลยี Forbes อองตวนเป็นอ ผู้เป็นเจ้ายังมาไม่ถึง ผู้หลงใหลเกี่ยวกับอนาคตของ AI และหุ่นยนต์

เขายังเป็นผู้ก่อตั้ง หลักทรัพย์.ioซึ่งเป็นเว็บไซต์ที่เน้นการลงทุนด้านเทคโนโลยีก่อกวน