ปัญญาประดิษฐ์

การใช้บทวิจารณ์เพื่อสร้างระบบผู้แนะนำที่ใช้งานได้

วันที่อัพเดท on December 9, 2022

หากคุณเคยซื้อผลิตภัณฑ์ทางออนไลน์และประหลาดใจกับความไร้เหตุผลและการไม่สามารถบังคับใช้ได้ของ 'รายการที่เกี่ยวข้อง' ที่ตามหลอกหลอนกระบวนการซื้อและหลังการขาย คุณเข้าใจแล้วว่าสินค้ายอดนิยมและกระแสหลัก ระบบผู้แนะนำ มักจะขาดความเข้าใจในความสัมพันธ์ระหว่างการซื้อที่คาดหวัง

หากคุณซื้อของที่ไม่บ่อยและไม่บ่อย เช่น เตาอบ คำแนะนำสำหรับเตาอบอื่นๆ มักจะไม่จำเป็น แม้ว่าระบบผู้แนะนำที่แย่ที่สุด ไม่ยอมรับสิ่งนี้. ตัวอย่างเช่น ในช่วงปี 2000 ระบบผู้แนะนำของ TiVO ได้สร้างข้อโต้แย้งในภาคส่วนนี้ในช่วงแรกโดย การกำหนดเพศที่รับรู้ใหม่ ของผู้ใช้คนหนึ่ง ซึ่งต่อมาได้พยายาม "เปลี่ยนโปรไฟล์ผู้ใช้ให้เป็นผู้ชายอีกครั้ง" โดยการเลือกภาพยนตร์เกี่ยวกับสงคราม ซึ่งเป็นแนวทางที่หยาบคายในการแก้ไขอัลกอริทึม

ยิ่งไปกว่านั้น คุณไม่จำเป็นต้องซื้ออะไรที่ Amazon (เช่น) หรือเริ่มดูภาพยนตร์ที่มีคำอธิบายที่คุณกำลังดูบนแพลตฟอร์มการสตรีมหลัก ๆ เพื่อให้ ขาดข้อมูล อัลกอริทึมผู้แนะนำเพื่อเริ่มต้นอย่างสนุกสนานในเส้นทางที่ผิด การค้นหา อาศัย และคลิกเข้าไปในหน้า 'รายละเอียด' ก็เพียงพอแล้ว และข้อมูลที่มีอยู่น้อยนิด (และอาจไม่ถูกต้อง) นี้มีแนวโน้มว่าจะคงอยู่ต่อไปในเซสชันการสืบค้นในอนาคตที่แพลตฟอร์ม

พยายามทำให้ระบบผู้แนะนำลืม

บางครั้งอาจเป็นไปได้ที่จะแทรกแซง: Netflix จัดให้มีระบบ 'ยกนิ้วโป้งขึ้น/ลง' ซึ่งในทางทฤษฎีแล้วควรช่วยให้อัลกอริธึมการเรียนรู้ของเครื่องลบแนวคิดและคำที่ฝังอยู่บางอย่างออกจากโปรไฟล์คำแนะนำของคุณ (แม้ว่าประสิทธิภาพของระบบจะมีผล ถูกสอบสวนและยังง่ายกว่ามากในการพัฒนาอัลกอริทึมผู้แนะนำส่วนบุคคลตั้งแต่เริ่มต้น กว่าจะลบออนโทโลยีที่ไม่ต้องการออกไปได้) ในขณะที่ Amazon ให้คุณ ลบชื่อเรื่อง จากประวัติลูกค้าของคุณ ซึ่งควรดาวน์เกรดโดเมนที่ไม่พึงปรารถนาที่แทรกซึมคำแนะนำของคุณ

Hulu มี ลักษณะคล้ายคลึงกันในขณะที่ HBO Max มี ถอยกลับบางส่วน จากระบบผู้แนะนำอัลกอริทึมเท่านั้น เมื่อเผชิญกับข้อบกพร่องในปัจจุบัน

ประสบการณ์ระดับผู้บริโภคที่เคร่งครัดเหล่านี้ไม่ได้แตะต้องคำวิจารณ์ที่แพร่หลายและเพิ่มมากขึ้นของระบบผู้แนะนำแพลตฟอร์มโฆษณาแบบ 'เฉยเมย' (โดยที่ การเปลี่ยนแปลงที่โดดเด่นกำลังมา เนื่องจากความเดือดดาลของสาธารณชน) หรือหัวข้อที่ก่อความไม่สงบของคำแนะนำเกี่ยวกับ AI บนโซเชียลมีเดีย โดยที่ไซต์ต่างๆ เช่น YouTube, Twitter และ Facebook อดทนต่อคำวิจารณ์ต่อคำแนะนำที่ไม่เกี่ยวข้องหรือแม้กระทั่งสร้างความเสียหาย

เครื่องจักรดูเหมือนจะไม่รู้ว่าเราต้องการอะไร เว้นแต่เราต้องการ รายการที่อยู่ติดกัน ที่ปรากฏขึ้นในการค้นหาของเรา แม้ว่าโดยหลักแล้วรายการนั้นจะซ้ำหรือสลับกับรายการหลักที่เราอาจเพิ่งซื้อ แทนที่จะเป็นการซื้อเสริมหรือเสริมที่อาจเกิดขึ้น

คำแนะนำที่ถูกต้องพร้อมข้อมูลรีวิว

ความร่วมมือด้านการวิจัยครั้งใหม่จากจีนและออสเตรเลียนำเสนอวิธีการใหม่ในการจัดการกับคำแนะนำที่ไม่เหมาะสมดังกล่าว โดยใช้รีวิวจากผู้ใช้ภายนอกเพื่อทำความเข้าใจความสัมพันธ์ที่แท้จริงระหว่างสินค้าในการช็อปปิ้ง ในการทดสอบ สถาปัตยกรรมมีประสิทธิภาพเหนือกว่าวิธีการที่ทันสมัยทั้งหมด โดยเสนอความหวังสำหรับระบบผู้แนะนำที่มีแผนผังภายในที่ดีขึ้นของการขึ้นต่อกันของรายการ:

RI-GNN มีประสิทธิภาพเหนือกว่าคู่แข่งรายสำคัญในด้านความถูกต้องของความสัมพันธ์ระหว่างรายการต่างๆ โดยทำงานได้ดีที่สุดในเซสชันที่มีรายการมากกว่า XNUMX รายการ ระบบได้รับการทดสอบกับชุดข้อมูล Pet Supplies และ Movies and TV จาก ข้อมูลรีวิวของ Amazon (2018) ที่มา: https://arxiv.org/pdf/2201.12532.pdf

ในการเริ่มระบบ โครงการจะจัดการกับความท้าทายที่โดดเด่นในการสร้างคำแนะนำแม้ในเซสชันที่ไม่ระบุตัวตน โดยที่ระบบผู้แนะนำไม่สามารถเข้าถึงรายละเอียดที่ผู้ใช้เป็นผู้ให้ เช่น ประวัติการซื้อ หรือรีวิวออนไลน์ของผู้ใช้เกี่ยวกับการซื้อก่อนหน้านี้

ใหม่ กระดาษ ถูกเรียก ทบทวนการพึ่งพาที่อยู่ติดกันในคำแนะนำตามเซสชันและมาจากนักวิจัยที่ Qilu University of Technology และ Beijing Institute of Technology ในประเทศจีน, RMIT University ที่ Melbourne และ Australian Artificial Intelligence Institute ที่ University of Technology Sydney

ทำอะไรต่อไป

ภารกิจหลักของคำแนะนำตามเซสชัน (SBR) คือการกำหนดรายการ 'ถัดไป' จากรายการปัจจุบัน โดยพิจารณาจากความสัมพันธ์ที่คำนวณได้กับรายการปัจจุบัน ในทางปฏิบัติ สิ่งนี้สามารถแสดงเป็นรายการของ 'รายการที่เกี่ยวข้อง' ในหน้ารายการสำหรับกรงนกที่เว็บไซต์อีคอมเมิร์ซ

หากคุณกำลังซื้อกรงนก คุณน่าจะต้องการอะไรอีกบ้าง อย่างน้อยที่สุด คุณจะต้องมีนกที่จะใส่เข้าไป นั่นคือ การพึ่งพาอาศัยกันอย่างแท้จริง. อย่างไรก็ตามกรงนกมีจุดเด่นในด้านภววิทยา สินค้าสัตว์เลี้ยงที่ไม่มีการขายนก ในทางกลับกัน อาหารแมว อยู่ในภววิทยาแบบเดียวกัน แม้ว่าการต่อท้ายชามให้อาหารแมวเป็นคำแนะนำที่เกี่ยวข้องสำหรับผลิตภัณฑ์กรงนกก็คือ การพึ่งพาที่ผิดพลาด - สมาคมที่เข้าใจผิดและเข้าใจผิด

จากกระดาษ: ความสัมพันธ์จริงและเท็จระหว่างรายการต่างๆ แสดงให้เห็นทางด้านขวาเป็นกราฟระหว่างรายการ

เช่นเดียวกับที่เกิดขึ้นบ่อยครั้งในสถาปัตยกรรมแมชชีนเลิร์นนิง มันเป็นเรื่องท้าทายที่จะโน้มน้าวระบบผู้แนะนำว่าเอนทิตีที่ 'ห่างไกล' (นก ไม่มีคุณสมบัติเลยใน ผลิตภัณฑ์สัตว์เลี้ยง) อาจมีความสัมพันธ์ที่แท้จริงและมีความสำคัญกับรายการหนึ่งๆ ในขณะที่รายการที่อยู่ในหมวดหมู่เดียวกัน และมีความใกล้ชิดกันอย่างมากในด้านการทำงานและแนวคิดหลัก (เช่น ชามอาหารแมว) อาจเป็นมุมฉากหรือตรงข้ามโดยตรงกับการซื้อที่กำลังพิจารณา

วิธีเดียวที่จะสร้างการแมปเหล่านี้ระหว่างเอนทิตีที่ 'ไม่ติดกัน' คือการรวบรวมปัญหา เนื่องจากความสัมพันธ์ที่เป็นปัญหาเป็นแง่มุมของประสบการณ์ของมนุษย์ ไม่สามารถคาดเดาได้ด้วยโปรแกรม และอาจอยู่นอกเหนือขอบเขตที่เข้าถึงได้ของแนวทางทั่วไป การติดฉลากชุดข้อมูล เช่น อังคารเครื่องกลเติร์ก.

ดังนั้น นักวิจัยจึงใช้กลไกการประมวลผลภาษาธรรมชาติ (NLP) เพื่อดึงคำเด่นจากบทวิจารณ์ผลิตภัณฑ์ และใช้ความถี่จากการวิเคราะห์เหล่านี้เพื่อสร้างการฝังที่สามารถ 'จับคู่' รายการที่ดูเหมือนอยู่ห่างไกลได้

สถาปัตยกรรมสำหรับ Neural Network (RI-GNN) แบบกราฟระหว่างรายการที่ผ่านการตรวจสอบแล้ว

สถาปัตยกรรมและข้อมูล

ตามรายงานฉบับใหม่ งานก่อนหน้านี้ที่มีลักษณะคล้ายคลึงกันได้ใช้ประโยชน์จากประวัติการตรวจสอบของผู้ใช้ที่เข้าสู่ระบบเองเพื่อจัดทำแผนที่พื้นฐาน ดีพคอนน์ และ อาร์เอ็นเอ ทั้งสองใช้วิธีนี้ อย่างไรก็ตาม วิธีนี้ช่วยลดข้อเท็จจริงที่ว่าผู้ใช้อาจไม่ได้เขียนรีวิวใดๆ หรือบทวิจารณ์ใดๆ ที่เกี่ยวข้องกับสินค้าเฉพาะที่ 'อยู่นอกขอบเขต' ของพฤติกรรมการซื้อตามปกติ นอกจากนี้ นี่เป็นวิธีการแบบ 'กล่องขาว' เนื่องจากถือว่าผู้ใช้ได้มีส่วนร่วมกับเต้ารับเพียงพอแล้วเพื่อสร้างบัญชีและเข้าสู่ระบบ

Graph Neural Network (GNN) แบบขยายที่เสนอโดยนักวิจัยใช้แนวทางที่ขับเคลื่อนด้วย Oracle มากขึ้น ซึ่งได้มาจากการพึ่งพาที่แท้จริง prioriเพื่อให้ผู้ใช้ที่ไม่ระบุชื่อและออกจากระบบสามารถรับคำแนะนำที่เกี่ยวข้องมากขึ้นโดยป้อนข้อมูลเพียงเล็กน้อย

ระบบเสริมการทบทวนมีชื่อว่า โครงข่ายประสาทเทียมแบบกราฟระหว่างรายการที่ผ่านการตรวจสอบแล้ว (ริ-กนฺ). นักวิจัยได้ทดสอบกับสอง ชุดข้อมูลจาก Amazon, อุปกรณ์สัตว์เลี้ยง และ ภาพยนตร์และทีวี. แม้ว่าสิ่งนี้จะช่วยแก้ปัญหาความพร้อมใช้งานของบทวิจารณ์ได้ค่อนข้างเรียบร้อย แต่การใช้งานจริงจำเป็นต้องค้นหาและรวบรวมฐานข้อมูลบทวิจารณ์ที่เหมาะสม ตามทฤษฎีแล้ว แหล่งข้อมูลดังกล่าวอาจเป็นอะไรก็ได้ตั้งแต่โพสต์บนโซเชียลเน็ตเวิร์กไปจนถึงคำตอบบน Quora

นอกจากนี้ การแมปความสัมพันธ์ระดับสูงในลักษณะนี้จะมีประโยชน์ต่อแอปพลิเคชันแมชชีนเลิร์นนิงที่หลากหลายนอกเหนือจากระบบผู้แนะนำ หลายโครงการในปัจจุบันประสบปัญหาเนื่องจากขาดการทำแผนที่ระหว่างโดเมนและภายในโดเมนเนื่องจากเงินทุนและขอบเขตที่จำกัด ในขณะที่แรงผลักดันเชิงพาณิชย์ของระบบผู้แนะนำอีคอมเมิร์ซที่มีความรู้อย่างแท้จริงและมาจากฝูงชนอาจช่วยเติมเต็มช่องว่างดังกล่าวได้

เมตริกและการทดสอบ

ผู้เขียนได้ทดสอบ RI-GNN กับสองเวอร์ชันของชุดข้อมูลแต่ละชุด ซึ่งแต่ละชุดประกอบด้วยประวัติการซื้อของผู้ใช้และบทวิจารณ์ทั่วไปของผลิตภัณฑ์ รายการที่ปรากฏน้อยกว่าห้าครั้งถูกลบออก และประวัติผู้ใช้จะแบ่งออกเป็นหน่วยของสัปดาห์ ชุดข้อมูลเวอร์ชันแรกแสดงเซสชันทั้งหมดที่มีมากกว่าหนึ่งรายการ และเวอร์ชันที่สองทั้งหมดมีมากกว่าห้ารายการ

โปรเจ็กต์นี้ใช้ P@K (Precision) และ MRR@K (Mean Reciprocal Rank) สำหรับการวัดผล สถาปัตยกรรมของคู่แข่งที่ทดสอบได้แก่: เอส-เคเอ็นเอ็น; GRU4Rec; เอส-ป๊อป; ประทับ; BERT4Rec; ดีเอชซีเอ็น; GCE-GNN; เอสอาร์-จีเอ็นเอ็นและ นาร์ม.

กรอบงานได้รับการฝึกอบรมเป็นชุดๆ ละ 100 ออน อาดัม ในอัตราการเรียนรู้ 0.001 โดยกำหนดหัวข้อเป็น 24 และ 20 ตามลำดับ สำหรับ อุปกรณ์สัตว์เลี้ยง และ ภาพยนตร์และทีวี.

เผยแพร่ครั้งแรก 1 กุมภาพันธ์ 2022

ต่อไป

เหตุใด Deepfakes จึงไม่สามารถถ่ายทอดอารมณ์ที่ลึกซึ้งได้

อย่าพลาด

การวิเคราะห์นโยบายความเป็นส่วนตัวตลอด 25 ปีด้วยการเรียนรู้ของเครื่อง

Martin Anderson

นักเขียนเกี่ยวกับการเรียนรู้ของเครื่อง ปัญญาประดิษฐ์ และข้อมูลขนาดใหญ่
เว็บไซต์ส่วนตัว: martinanderson.ai
ติดต่อ: [ป้องกันอีเมล]
ทวิตเตอร์: @manders_ai