ปัญญาประดิษฐ์

ระบบแนะนำเนื้อคู่ AI ขึ้นอยู่กับรูปภาพเท่านั้น

วันที่อัพเดท on สิงหาคม 27, 2021

นักวิจัยจากสหราชอาณาจักรใช้โครงข่ายประสาทเทียมเพื่อพัฒนาระบบแนะนำตามรูปภาพทั้งหมดสำหรับการจับคู่หาคู่ออนไลน์ ซึ่งจะพิจารณาเฉพาะว่าผู้ใช้สองคนสนใจรูปภาพของกันและกันหรือไม่ (แทนที่จะเป็นข้อมูลโปรไฟล์ เช่น งาน อายุ ฯลฯ ) และพบว่ามีประสิทธิภาพดีกว่าระบบที่ 'ตื้น' น้อยกว่าในแง่ของการได้รับการจับคู่ที่แม่นยำ

ระบบผลลัพธ์ที่เรียกว่า Temporal Image-Based Reciprocal Recommender (TIRR) และใช้ Recurrent Neural Networks (RNN) เพื่อตีความความชอบในอดีตของผู้ใช้สำหรับใบหน้าที่เขาหรือเธอพบขณะเรียกดูการจับคู่ที่อาจเกิดขึ้น

พื้นที่ กระดาษ มีสิทธิ์ - อาจทำให้ท้อใจ - รูปถ่ายเป็นสิ่งที่คุณต้องการสำหรับคำแนะนำซึ่งกันและกันในการหาคู่ออนไลน์และมาจากนักวิจัยสองคนที่มหาวิทยาลัยบริสตอล โดยปรับปรุงโดยเฉพาะอย่างยิ่งจากระบบที่คล้ายกัน (เรียกว่า อิมเรค) ออกโดยทีมเดียวกันในปี 2020

ในการทดสอบ ระบบได้รับความแม่นยำล้ำสมัยในความสามารถในการทำนาย ซึ่งกันและกัน จับคู่ระหว่างผู้ใช้ ซึ่งไม่เพียงปรับปรุงผลงานในปี 2020 ของนักวิจัยเท่านั้น แต่ยังรวมถึงระบบแนะนำการออกเดทแบบอิงเนื้อหาอื่น ๆ ที่คำนึงถึงข้อมูลแบบข้อความที่มีรายละเอียดมากขึ้นในโปรไฟล์การหาคู่

ชุดข้อมูลการออกเดทในโลกแห่งความจริง

TIRR ได้รับการฝึกอบรมเกี่ยวกับข้อมูลผู้ใช้ที่ให้บริการโดยบริการหาคู่ออนไลน์ 'ยอดนิยม' ที่ไม่มีชื่อซึ่งมี 'ผู้ใช้ที่ลงทะเบียนหลายล้านคน' ซึ่งอนุญาตให้ผู้ใช้สื่อสารกันเมื่อแต่ละคน 'ชอบ' โปรไฟล์ของอีกฝ่าย ชุดย่อยของข้อมูลที่ใช้รวมถึงอาสาสมัคร 200,000 คน แยกระหว่างชายและหญิงเท่าๆ กัน และประมาณ 800,000 การตั้งค่าที่ผู้ใช้แสดงออกมาในโปรไฟล์การออกเดททั้งหมด

เนื่องจากบริการหาคู่ที่ไม่เปิดเผยตัวตนซึ่งให้ข้อมูลสนับสนุนเฉพาะการจับคู่ระหว่างเพศตรงข้าม การวิจัยจึงครอบคลุมเฉพาะการจับคู่ระหว่างชาย/หญิงเท่านั้น

TIRR ปรับปรุงจากการออกแบบระบบผู้แนะนำซึ่งกันและกัน (RRS) ก่อนหน้านี้ในฟิลด์นี้ โดยการคำนวณความน่าจะเป็นโดยตรงของการจับคู่ระหว่างสองโปรไฟล์ โดยพิจารณาจากรูปโปรไฟล์เท่านั้น ระบบก่อนหน้าจะทำนายการตั้งค่าทิศทางเดียวสองทิศทางแทน จากนั้นจึงรวมเข้าด้วยกันเพื่อรับการทำนาย

นักวิจัยไม่รวมผู้ใช้ที่ถูกลบออกจากบริการหาคู่ (ไม่ว่าด้วยเหตุผลใดก็ตาม รวมทั้งการออกจากระบบโดยสมัครใจ) และไม่รวมโปรไฟล์ที่ไม่มีรูปถ่ายใบหน้า

ประวัติผู้ใช้ถูกจำกัดไว้ที่หนึ่งปีย้อนหลัง เพื่อหลีกเลี่ยงความผิดปกติที่อาจเกิดขึ้นเมื่อไซต์หาคู่ปรับแต่งอัลกอริทึมเมื่อเวลาผ่านไป นอกจากนี้ยังจำกัดการตั้งค่าของผู้ใช้สูงสุด 15 รายการ เนื่องจากสิ่งเหล่านี้แสดงให้เห็นว่าเพียงพอต่อการพิสูจน์การออกแบบโมเดล ในขณะที่การใช้การตั้งค่าที่กว้างขวางมากขึ้นจะลดประสิทธิภาพลงและเพิ่มเวลาการฝึกอบรม

นอกจากนี้ ผู้ใช้ตัวยงหรือผู้ใช้ระยะยาวบางคนมีประวัติด้วย พัน ของการตั้งค่า ซึ่งอาจเสี่ยงที่จะบิดเบือนน้ำหนักของคุณสมบัติที่ได้รับ และยืดเวลาการฝึกออกไปอีก

เครือข่ายสยาม

TIRR สูตรโดยใช้ a เครือข่ายสยาม, โดยทั่วไปใช้สำหรับ การเรียนรู้แบบ 'นัดเดียว'.

เทมเพลตเครือข่ายสยามซึ่งเครือข่ายประสาทเทียมแบบขนาน (CNN) แบ่งปันน้ำหนัก แต่ไม่ใช่ข้อมูล พวกเขายังแบ่งปันฟังก์ชันการสูญเสียที่ได้มาจากเอาต์พุตของ CNN แต่ละรายการ และฉลากความจริงพื้นฐาน ที่มา: https://arxiv.org/pdf/2108.11714.pdf

เครือข่ายได้รับการฝึกฝนโดยใช้ binary crossentropy ซึ่งเป็นฟังก์ชันการสูญเสียทั่วไปในโครงข่ายประสาทเทียม และฟังก์ชันที่นักวิจัยพบว่าให้ผลลัพธ์ที่เหนือกว่าเมื่อเปรียบเทียบกับ การสูญเสียในทางตรงกันข้าม. แบบหลังมีประสิทธิภาพมากที่สุดในระบบที่ประเมินความเท่าเทียมกันระหว่างสองหน้า แต่เนื่องจากนี่ไม่ใช่วัตถุประสงค์ของ TIRR จึงเป็นแนวทางที่ทำงานได้ไม่ดีในบริบทนี้

จำเป็นที่ระบบจะต้องเก็บรักษาและสร้างจากข้อมูลที่พัฒนาขึ้นในขณะที่การฝึกอบรมวนซ้ำหลายครั้งบนข้อมูลเดิม และเครือข่ายของสยามใน TIRR จะใช้ แอลเอสทีเอ็ม (หน่วยความจำระยะสั้นระยะยาว) เพื่อทำการตัดสินใจเหล่านี้ และเพื่อให้แน่ใจว่าฟีเจอร์ที่ถือว่าเกี่ยวข้องจะไม่ถูกละทิ้งแบบเฉพาะกิจ เนื่องจากเฟรมเวิร์กสร้างข้อมูลเชิงลึก

สถาปัตยกรรมเครือข่ายของสยามเฉพาะสำหรับ TIRR

นักวิจัยพบว่าเครือข่ายฝึกฝนช้ามากเมื่อข้อมูลทั้งหมดถูกป้อนเข้า และต่อมาแบ่งการฝึกอบรมออกเป็นสามขั้นตอนโดยใช้ข้อมูลย่อยสามชุดที่แตกต่างกัน มีข้อดีเพิ่มเติมบางประการในเรื่องนี้ เนื่องจากการทดลองในปี 2020 ของนักวิจัยได้แสดงให้เห็นแล้วว่าการฝึกชุดข้อมูลชายและหญิงแยกจากกันจะช่วยปรับปรุงประสิทธิภาพของระบบผู้แนะนำซึ่งกันและกัน

การแบ่งช่วงการฝึกสำหรับเครือข่ายสยามของ TIRR

การทดสอบ

ในการประเมินประสิทธิภาพของ TIRR นักวิจัยเก็บข้อมูลส่วนหนึ่งไว้ด้านหนึ่งและรันผ่านระบบที่รวมเข้าด้วยกันอย่างสมบูรณ์ อย่างไรก็ตาม เนื่องจากระบบค่อนข้างแปลกใหม่ จึงไม่มีระบบก่อนหน้าที่คล้ายคลึงกันโดยตรงซึ่งสามารถนำมาเปรียบเทียบได้

ดังนั้นนักวิจัยจึงสร้างเส้นโค้งลักษณะการทำงานของเครื่องรับ (ร็อค) พื้นฐานสำหรับเครือข่ายสยาม ก่อนที่จะใช้ Uniform Manifold Approximation and Projection for Dimensional Reduction (ยูแมพ) เพื่อทำให้เวกเตอร์ 128 มิติเล็กลงเพื่อให้เห็นภาพได้ง่าย เพื่อสร้างกระแสความชอบและไม่ชอบที่สอดคล้องกัน

ทางด้านซ้าย ROC ของเครือข่ายสยามเป็นตัวบ่งชี้ประสิทธิภาพพื้นฐาน ทางด้านขวา การแสดงภาพ UMAP จะแสดง 'ชอบ' เป็นสีแดง 'ไม่ชอบ' เป็นสีดำ

TIRR ได้รับการทดสอบกับการกรองร่วมกันและระบบตามเนื้อหาที่มีขอบเขตใกล้เคียงกัน รวมถึงงานก่อนหน้าของนักวิจัย ImRec (ดูด้านบน) และ RECON, RRS จากปี 2010 ตลอดจนอัลกอริทึมการกรองร่วมกัน RCF (RRS การออกเดทปี 2015 ตามเนื้อหาข้อความของโปรไฟล์การออกเดท) และ แอลเอฟอาร์อาร์ (โครงการที่คล้ายกันจากปี 2019)

ในทุกกรณี TIRR สามารถให้ความแม่นยำที่เหนือกว่า แม้ว่าเพียงเล็กน้อยเมื่อเทียบกับ LFRR ซึ่งอาจบ่งบอกถึงปัจจัยที่สัมพันธ์กันระหว่างเนื้อหาข้อความโปรไฟล์และระดับความน่าดึงดูดใจที่รับรู้ได้ของรูปโปรไฟล์ของอาสาสมัคร

ความใกล้เคียงกันระหว่าง TIRR ที่ใช้รูปภาพและ LFRR ที่ใช้ข้อความมากขึ้นทำให้มีความเป็นไปได้อย่างน้อยสองอย่าง: การรับรู้ของผู้ใช้เกี่ยวกับความน่าดึงดูดทางสายตานั้นได้รับอิทธิพลจากเนื้อหาข้อความของโปรไฟล์ หรือเนื้อหาข้อความนั้นได้รับความสนใจและการยอมรับมากกว่าที่อาจเกิดขึ้นหากรูปภาพที่เกี่ยวข้องไม่ถูกมองว่าน่าสนใจ

ด้วยเหตุผลที่ชัดเจน ทีมวิจัยไม่สามารถเผยแพร่ชุดข้อมูลหรือซอร์สโค้ดสำหรับ TIRR ได้ แต่สนับสนุนให้ทีมอื่นทำซ้ำและยืนยันแนวทางของตน

nb รูปภาพที่ใช้ในภาพประกอบหลักมาจาก thispersondoesnotexist.com

หัวข้อที่เกี่ยวข้อง:โครงข่ายประสาทเทียม เดท แอพหาคู่การวิจัย

ต่อไป

รวมการสังเคราะห์เสียงพูดและท่าทาง

อย่าพลาด

ซอฟต์แวร์ Baby Detector ตรวจสอบอัตราการเต้นของหัวใจและการหายใจ

Martin Anderson

นักเขียนเกี่ยวกับการเรียนรู้ของเครื่อง ปัญญาประดิษฐ์ และข้อมูลขนาดใหญ่
เว็บไซต์ส่วนตัว: martinanderson.ai
ติดต่อ: [ป้องกันอีเมล]
ทวิตเตอร์: @manders_ai

ยูไนเต็ด.เอไอ

ระบบแนะนำเนื้อคู่ AI ขึ้นอยู่กับรูปภาพเท่านั้น

ปัญญาประดิษฐ์