ปัญญาประดิษฐ์
ระบบแนะนำเนื้อคู่ AI ขึ้นอยู่กับรูปภาพเท่านั้น
นักวิจัยจากสหราชอาณาจักรใช้โครงข่ายประสาทเทียมเพื่อพัฒนาระบบแนะนำตามรูปภาพทั้งหมดสำหรับการจับคู่หาคู่ออนไลน์ ซึ่งจะพิจารณาเฉพาะว่าผู้ใช้สองคนสนใจรูปภาพของกันและกันหรือไม่ (แทนที่จะเป็นข้อมูลโปรไฟล์ เช่น งาน อายุ ฯลฯ ) และพบว่ามีประสิทธิภาพดีกว่าระบบที่ 'ตื้น' น้อยกว่าในแง่ของการได้รับการจับคู่ที่แม่นยำ
ระบบผลลัพธ์ที่เรียกว่า Temporal Image-Based Reciprocal Recommender (TIRR) และใช้ Recurrent Neural Networks (RNN) เพื่อตีความความชอบในอดีตของผู้ใช้สำหรับใบหน้าที่เขาหรือเธอพบขณะเรียกดูการจับคู่ที่อาจเกิดขึ้น
พื้นที่ กระดาษ มีสิทธิ์ - อาจทำให้ท้อใจ - รูปถ่ายเป็นสิ่งที่คุณต้องการสำหรับคำแนะนำซึ่งกันและกันในการหาคู่ออนไลน์และมาจากนักวิจัยสองคนที่มหาวิทยาลัยบริสตอล โดยปรับปรุงโดยเฉพาะอย่างยิ่งจากระบบที่คล้ายกัน (เรียกว่า อิมเรค) ออกโดยทีมเดียวกันในปี 2020
ในการทดสอบ ระบบได้รับความแม่นยำล้ำสมัยในความสามารถในการทำนาย ซึ่งกันและกัน จับคู่ระหว่างผู้ใช้ ซึ่งไม่เพียงปรับปรุงผลงานในปี 2020 ของนักวิจัยเท่านั้น แต่ยังรวมถึงระบบแนะนำการออกเดทแบบอิงเนื้อหาอื่น ๆ ที่คำนึงถึงข้อมูลแบบข้อความที่มีรายละเอียดมากขึ้นในโปรไฟล์การหาคู่
ชุดข้อมูลการออกเดทในโลกแห่งความจริง
TIRR ได้รับการฝึกอบรมเกี่ยวกับข้อมูลผู้ใช้ที่ให้บริการโดยบริการหาคู่ออนไลน์ 'ยอดนิยม' ที่ไม่มีชื่อซึ่งมี 'ผู้ใช้ที่ลงทะเบียนหลายล้านคน' ซึ่งอนุญาตให้ผู้ใช้สื่อสารกันเมื่อแต่ละคน 'ชอบ' โปรไฟล์ของอีกฝ่าย ชุดย่อยของข้อมูลที่ใช้รวมถึงอาสาสมัคร 200,000 คน แยกระหว่างชายและหญิงเท่าๆ กัน และประมาณ 800,000 การตั้งค่าที่ผู้ใช้แสดงออกมาในโปรไฟล์การออกเดททั้งหมด
เนื่องจากบริการหาคู่ที่ไม่เปิดเผยตัวตนซึ่งให้ข้อมูลสนับสนุนเฉพาะการจับคู่ระหว่างเพศตรงข้าม การวิจัยจึงครอบคลุมเฉพาะการจับคู่ระหว่างชาย/หญิงเท่านั้น
TIRR ปรับปรุงจากการออกแบบระบบผู้แนะนำซึ่งกันและกัน (RRS) ก่อนหน้านี้ในฟิลด์นี้ โดยการคำนวณความน่าจะเป็นโดยตรงของการจับคู่ระหว่างสองโปรไฟล์ โดยพิจารณาจากรูปโปรไฟล์เท่านั้น ระบบก่อนหน้าจะทำนายการตั้งค่าทิศทางเดียวสองทิศทางแทน จากนั้นจึงรวมเข้าด้วยกันเพื่อรับการทำนาย
นักวิจัยไม่รวมผู้ใช้ที่ถูกลบออกจากบริการหาคู่ (ไม่ว่าด้วยเหตุผลใดก็ตาม รวมทั้งการออกจากระบบโดยสมัครใจ) และไม่รวมโปรไฟล์ที่ไม่มีรูปถ่ายใบหน้า
ประวัติผู้ใช้ถูกจำกัดไว้ที่หนึ่งปีย้อนหลัง เพื่อหลีกเลี่ยงความผิดปกติที่อาจเกิดขึ้นเมื่อไซต์หาคู่ปรับแต่งอัลกอริทึมเมื่อเวลาผ่านไป นอกจากนี้ยังจำกัดการตั้งค่าของผู้ใช้สูงสุด 15 รายการ เนื่องจากสิ่งเหล่านี้แสดงให้เห็นว่าเพียงพอต่อการพิสูจน์การออกแบบโมเดล ในขณะที่การใช้การตั้งค่าที่กว้างขวางมากขึ้นจะลดประสิทธิภาพลงและเพิ่มเวลาการฝึกอบรม
นอกจากนี้ ผู้ใช้ตัวยงหรือผู้ใช้ระยะยาวบางคนมีประวัติด้วย พัน ของการตั้งค่า ซึ่งอาจเสี่ยงที่จะบิดเบือนน้ำหนักของคุณสมบัติที่ได้รับ และยืดเวลาการฝึกออกไปอีก
เครือข่ายสยาม
TIRR สูตรโดยใช้ a เครือข่ายสยาม, โดยทั่วไปใช้สำหรับ การเรียนรู้แบบ 'นัดเดียว'.
เครือข่ายได้รับการฝึกฝนโดยใช้ binary crossentropy ซึ่งเป็นฟังก์ชันการสูญเสียทั่วไปในโครงข่ายประสาทเทียม และฟังก์ชันที่นักวิจัยพบว่าให้ผลลัพธ์ที่เหนือกว่าเมื่อเปรียบเทียบกับ การสูญเสียในทางตรงกันข้าม. แบบหลังมีประสิทธิภาพมากที่สุดในระบบที่ประเมินความเท่าเทียมกันระหว่างสองหน้า แต่เนื่องจากนี่ไม่ใช่วัตถุประสงค์ของ TIRR จึงเป็นแนวทางที่ทำงานได้ไม่ดีในบริบทนี้
จำเป็นที่ระบบจะต้องเก็บรักษาและสร้างจากข้อมูลที่พัฒนาขึ้นในขณะที่การฝึกอบรมวนซ้ำหลายครั้งบนข้อมูลเดิม และเครือข่ายของสยามใน TIRR จะใช้ แอลเอสทีเอ็ม (หน่วยความจำระยะสั้นระยะยาว) เพื่อทำการตัดสินใจเหล่านี้ และเพื่อให้แน่ใจว่าฟีเจอร์ที่ถือว่าเกี่ยวข้องจะไม่ถูกละทิ้งแบบเฉพาะกิจ เนื่องจากเฟรมเวิร์กสร้างข้อมูลเชิงลึก
นักวิจัยพบว่าเครือข่ายฝึกฝนช้ามากเมื่อข้อมูลทั้งหมดถูกป้อนเข้า และต่อมาแบ่งการฝึกอบรมออกเป็นสามขั้นตอนโดยใช้ข้อมูลย่อยสามชุดที่แตกต่างกัน มีข้อดีเพิ่มเติมบางประการในเรื่องนี้ เนื่องจากการทดลองในปี 2020 ของนักวิจัยได้แสดงให้เห็นแล้วว่าการฝึกชุดข้อมูลชายและหญิงแยกจากกันจะช่วยปรับปรุงประสิทธิภาพของระบบผู้แนะนำซึ่งกันและกัน
การทดสอบ
ในการประเมินประสิทธิภาพของ TIRR นักวิจัยเก็บข้อมูลส่วนหนึ่งไว้ด้านหนึ่งและรันผ่านระบบที่รวมเข้าด้วยกันอย่างสมบูรณ์ อย่างไรก็ตาม เนื่องจากระบบค่อนข้างแปลกใหม่ จึงไม่มีระบบก่อนหน้าที่คล้ายคลึงกันโดยตรงซึ่งสามารถนำมาเปรียบเทียบได้
ดังนั้นนักวิจัยจึงสร้างเส้นโค้งลักษณะการทำงานของเครื่องรับ (ร็อค) พื้นฐานสำหรับเครือข่ายสยาม ก่อนที่จะใช้ Uniform Manifold Approximation and Projection for Dimensional Reduction (ยูแมพ) เพื่อทำให้เวกเตอร์ 128 มิติเล็กลงเพื่อให้เห็นภาพได้ง่าย เพื่อสร้างกระแสความชอบและไม่ชอบที่สอดคล้องกัน
TIRR ได้รับการทดสอบกับการกรองร่วมกันและระบบตามเนื้อหาที่มีขอบเขตใกล้เคียงกัน รวมถึงงานก่อนหน้าของนักวิจัย ImRec (ดูด้านบน) และ RECON, RRS จากปี 2010 ตลอดจนอัลกอริทึมการกรองร่วมกัน RCF (RRS การออกเดทปี 2015 ตามเนื้อหาข้อความของโปรไฟล์การออกเดท) และ แอลเอฟอาร์อาร์ (โครงการที่คล้ายกันจากปี 2019)
ในทุกกรณี TIRR สามารถให้ความแม่นยำที่เหนือกว่า แม้ว่าเพียงเล็กน้อยเมื่อเทียบกับ LFRR ซึ่งอาจบ่งบอกถึงปัจจัยที่สัมพันธ์กันระหว่างเนื้อหาข้อความโปรไฟล์และระดับความน่าดึงดูดใจที่รับรู้ได้ของรูปโปรไฟล์ของอาสาสมัคร
ความใกล้เคียงกันระหว่าง TIRR ที่ใช้รูปภาพและ LFRR ที่ใช้ข้อความมากขึ้นทำให้มีความเป็นไปได้อย่างน้อยสองอย่าง: การรับรู้ของผู้ใช้เกี่ยวกับความน่าดึงดูดทางสายตานั้นได้รับอิทธิพลจากเนื้อหาข้อความของโปรไฟล์ หรือเนื้อหาข้อความนั้นได้รับความสนใจและการยอมรับมากกว่าที่อาจเกิดขึ้นหากรูปภาพที่เกี่ยวข้องไม่ถูกมองว่าน่าสนใจ
ด้วยเหตุผลที่ชัดเจน ทีมวิจัยไม่สามารถเผยแพร่ชุดข้อมูลหรือซอร์สโค้ดสำหรับ TIRR ได้ แต่สนับสนุนให้ทีมอื่นทำซ้ำและยืนยันแนวทางของตน
nb รูปภาพที่ใช้ในภาพประกอบหลักมาจาก thispersondoesnotexist.com