ต้นขั้ว ระบบแนะนำเนื้อคู่ AI อ้างอิงจากรูปภาพเท่านั้น - Unite.AI
เชื่อมต่อกับเรา

ปัญญาประดิษฐ์

ระบบแนะนำเนื้อคู่ AI ขึ้นอยู่กับรูปภาพเท่านั้น

mm
วันที่อัพเดท on

นักวิจัยจากสหราชอาณาจักรใช้โครงข่ายประสาทเทียมเพื่อพัฒนาระบบแนะนำตามรูปภาพทั้งหมดสำหรับการจับคู่หาคู่ออนไลน์ ซึ่งจะพิจารณาเฉพาะว่าผู้ใช้สองคนสนใจรูปภาพของกันและกันหรือไม่ (แทนที่จะเป็นข้อมูลโปรไฟล์ เช่น งาน อายุ ฯลฯ ) และพบว่ามีประสิทธิภาพดีกว่าระบบที่ 'ตื้น' น้อยกว่าในแง่ของการได้รับการจับคู่ที่แม่นยำ

ระบบผลลัพธ์ที่เรียกว่า Temporal Image-Based Reciprocal Recommender (TIRR) และใช้ Recurrent Neural Networks (RNN) เพื่อตีความความชอบในอดีตของผู้ใช้สำหรับใบหน้าที่เขาหรือเธอพบขณะเรียกดูการจับคู่ที่อาจเกิดขึ้น

พื้นที่ กระดาษ มีสิทธิ์ - อาจทำให้ท้อใจ - รูปถ่ายเป็นสิ่งที่คุณต้องการสำหรับคำแนะนำซึ่งกันและกันในการหาคู่ออนไลน์และมาจากนักวิจัยสองคนที่มหาวิทยาลัยบริสตอล โดยปรับปรุงโดยเฉพาะอย่างยิ่งจากระบบที่คล้ายกัน (เรียกว่า อิมเรค) ออกโดยทีมเดียวกันในปี 2020

ในการทดสอบ ระบบได้รับความแม่นยำล้ำสมัยในความสามารถในการทำนาย ซึ่งกันและกัน จับคู่ระหว่างผู้ใช้ ซึ่งไม่เพียงปรับปรุงผลงานในปี 2020 ของนักวิจัยเท่านั้น แต่ยังรวมถึงระบบแนะนำการออกเดทแบบอิงเนื้อหาอื่น ๆ ที่คำนึงถึงข้อมูลแบบข้อความที่มีรายละเอียดมากขึ้นในโปรไฟล์การหาคู่

ชุดข้อมูลการออกเดทในโลกแห่งความจริง

TIRR ได้รับการฝึกอบรมเกี่ยวกับข้อมูลผู้ใช้ที่ให้บริการโดยบริการหาคู่ออนไลน์ 'ยอดนิยม' ที่ไม่มีชื่อซึ่งมี 'ผู้ใช้ที่ลงทะเบียนหลายล้านคน' ซึ่งอนุญาตให้ผู้ใช้สื่อสารกันเมื่อแต่ละคน 'ชอบ' โปรไฟล์ของอีกฝ่าย ชุดย่อยของข้อมูลที่ใช้รวมถึงอาสาสมัคร 200,000 คน แยกระหว่างชายและหญิงเท่าๆ กัน และประมาณ 800,000 การตั้งค่าที่ผู้ใช้แสดงออกมาในโปรไฟล์การออกเดททั้งหมด

เนื่องจากบริการหาคู่ที่ไม่เปิดเผยตัวตนซึ่งให้ข้อมูลสนับสนุนเฉพาะการจับคู่ระหว่างเพศตรงข้าม การวิจัยจึงครอบคลุมเฉพาะการจับคู่ระหว่างชาย/หญิงเท่านั้น

TIRR ปรับปรุงจากการออกแบบระบบผู้แนะนำซึ่งกันและกัน (RRS) ก่อนหน้านี้ในฟิลด์นี้ โดยการคำนวณความน่าจะเป็นโดยตรงของการจับคู่ระหว่างสองโปรไฟล์ โดยพิจารณาจากรูปโปรไฟล์เท่านั้น ระบบก่อนหน้าจะทำนายการตั้งค่าทิศทางเดียวสองทิศทางแทน จากนั้นจึงรวมเข้าด้วยกันเพื่อรับการทำนาย

นักวิจัยไม่รวมผู้ใช้ที่ถูกลบออกจากบริการหาคู่ (ไม่ว่าด้วยเหตุผลใดก็ตาม รวมทั้งการออกจากระบบโดยสมัครใจ) และไม่รวมโปรไฟล์ที่ไม่มีรูปถ่ายใบหน้า

ประวัติผู้ใช้ถูกจำกัดไว้ที่หนึ่งปีย้อนหลัง เพื่อหลีกเลี่ยงความผิดปกติที่อาจเกิดขึ้นเมื่อไซต์หาคู่ปรับแต่งอัลกอริทึมเมื่อเวลาผ่านไป นอกจากนี้ยังจำกัดการตั้งค่าของผู้ใช้สูงสุด 15 รายการ เนื่องจากสิ่งเหล่านี้แสดงให้เห็นว่าเพียงพอต่อการพิสูจน์การออกแบบโมเดล ในขณะที่การใช้การตั้งค่าที่กว้างขวางมากขึ้นจะลดประสิทธิภาพลงและเพิ่มเวลาการฝึกอบรม

นอกจากนี้ ผู้ใช้ตัวยงหรือผู้ใช้ระยะยาวบางคนมีประวัติด้วย พัน ของการตั้งค่า ซึ่งอาจเสี่ยงที่จะบิดเบือนน้ำหนักของคุณสมบัติที่ได้รับ และยืดเวลาการฝึกออกไปอีก

เครือข่ายสยาม

TIRR สูตรโดยใช้ a เครือข่ายสยาม, โดยทั่วไปใช้สำหรับ การเรียนรู้แบบ 'นัดเดียว'.

เทมเพลตเครือข่ายสยามซึ่งเครือข่ายประสาทเทียมแบบขนาน (CNN) แบ่งปันน้ำหนัก แต่ไม่ใช่ข้อมูล พวกเขายังแบ่งปันฟังก์ชันการสูญเสียที่ได้มาจากเอาต์พุตของ CNN แต่ละรายการ และฉลากความจริงพื้นฐาน ที่มา: https://arxiv.org/pdf/2108.11714.pdf

เทมเพลตเครือข่ายสยามซึ่งเครือข่ายประสาทเทียมแบบขนาน (CNN) แบ่งปันน้ำหนัก แต่ไม่ใช่ข้อมูล พวกเขายังแบ่งปันฟังก์ชันการสูญเสียที่ได้มาจากเอาต์พุตของ CNN แต่ละรายการ และฉลากความจริงพื้นฐาน  ที่มา: https://arxiv.org/pdf/2108.11714.pdf

เครือข่ายได้รับการฝึกฝนโดยใช้ binary crossentropy ซึ่งเป็นฟังก์ชันการสูญเสียทั่วไปในโครงข่ายประสาทเทียม และฟังก์ชันที่นักวิจัยพบว่าให้ผลลัพธ์ที่เหนือกว่าเมื่อเปรียบเทียบกับ การสูญเสียในทางตรงกันข้าม. แบบหลังมีประสิทธิภาพมากที่สุดในระบบที่ประเมินความเท่าเทียมกันระหว่างสองหน้า แต่เนื่องจากนี่ไม่ใช่วัตถุประสงค์ของ TIRR จึงเป็นแนวทางที่ทำงานได้ไม่ดีในบริบทนี้

จำเป็นที่ระบบจะต้องเก็บรักษาและสร้างจากข้อมูลที่พัฒนาขึ้นในขณะที่การฝึกอบรมวนซ้ำหลายครั้งบนข้อมูลเดิม และเครือข่ายของสยามใน TIRR จะใช้ แอลเอสทีเอ็ม (หน่วยความจำระยะสั้นระยะยาว) เพื่อทำการตัดสินใจเหล่านี้ และเพื่อให้แน่ใจว่าฟีเจอร์ที่ถือว่าเกี่ยวข้องจะไม่ถูกละทิ้งแบบเฉพาะกิจ เนื่องจากเฟรมเวิร์กสร้างข้อมูลเชิงลึก

สถาปัตยกรรมเครือข่ายของสยามเฉพาะสำหรับ TIRR

สถาปัตยกรรมเครือข่ายของสยามเฉพาะสำหรับ TIRR

นักวิจัยพบว่าเครือข่ายฝึกฝนช้ามากเมื่อข้อมูลทั้งหมดถูกป้อนเข้า และต่อมาแบ่งการฝึกอบรมออกเป็นสามขั้นตอนโดยใช้ข้อมูลย่อยสามชุดที่แตกต่างกัน มีข้อดีเพิ่มเติมบางประการในเรื่องนี้ เนื่องจากการทดลองในปี 2020 ของนักวิจัยได้แสดงให้เห็นแล้วว่าการฝึกชุดข้อมูลชายและหญิงแยกจากกันจะช่วยปรับปรุงประสิทธิภาพของระบบผู้แนะนำซึ่งกันและกัน

การแบ่งช่วงการฝึกสำหรับเครือข่ายสยามของ TIRR

การแบ่งช่วงการฝึกสำหรับเครือข่ายสยามของ TIRR

การทดสอบ

ในการประเมินประสิทธิภาพของ TIRR นักวิจัยเก็บข้อมูลส่วนหนึ่งไว้ด้านหนึ่งและรันผ่านระบบที่รวมเข้าด้วยกันอย่างสมบูรณ์ อย่างไรก็ตาม เนื่องจากระบบค่อนข้างแปลกใหม่ จึงไม่มีระบบก่อนหน้าที่คล้ายคลึงกันโดยตรงซึ่งสามารถนำมาเปรียบเทียบได้

ดังนั้นนักวิจัยจึงสร้างเส้นโค้งลักษณะการทำงานของเครื่องรับ (ร็อค) พื้นฐานสำหรับเครือข่ายสยาม ก่อนที่จะใช้ Uniform Manifold Approximation and Projection for Dimensional Reduction (ยูแมพ) เพื่อทำให้เวกเตอร์ 128 มิติเล็กลงเพื่อให้เห็นภาพได้ง่าย เพื่อสร้างกระแสความชอบและไม่ชอบที่สอดคล้องกัน

ทางด้านซ้าย ROC ของเครือข่ายสยามเป็นตัวบ่งชี้ประสิทธิภาพพื้นฐาน ทางด้านขวา การแสดงภาพ UMAP จะแสดง 'ชอบ' เป็นสีแดง 'ไม่ชอบ' เป็นสีดำ

ทางด้านซ้าย ROC ของเครือข่ายสยามเป็นตัวบ่งชี้ประสิทธิภาพพื้นฐาน ทางด้านขวา การแสดงภาพ UMAP จะแสดง 'ชอบ' เป็นสีแดง 'ไม่ชอบ' เป็นสีดำ

TIRR ได้รับการทดสอบกับการกรองร่วมกันและระบบตามเนื้อหาที่มีขอบเขตใกล้เคียงกัน รวมถึงงานก่อนหน้าของนักวิจัย ImRec (ดูด้านบน) และ RECON, RRS จากปี 2010 ตลอดจนอัลกอริทึมการกรองร่วมกัน RCF (RRS การออกเดทปี 2015 ตามเนื้อหาข้อความของโปรไฟล์การออกเดท) และ แอลเอฟอาร์อาร์ (โครงการที่คล้ายกันจากปี 2019)

ในทุกกรณี TIRR สามารถให้ความแม่นยำที่เหนือกว่า แม้ว่าเพียงเล็กน้อยเมื่อเทียบกับ LFRR ซึ่งอาจบ่งบอกถึงปัจจัยที่สัมพันธ์กันระหว่างเนื้อหาข้อความโปรไฟล์และระดับความน่าดึงดูดใจที่รับรู้ได้ของรูปโปรไฟล์ของอาสาสมัคร

ความใกล้เคียงกันระหว่าง TIRR ที่ใช้รูปภาพและ LFRR ที่ใช้ข้อความมากขึ้นทำให้มีความเป็นไปได้อย่างน้อยสองอย่าง: การรับรู้ของผู้ใช้เกี่ยวกับความน่าดึงดูดทางสายตานั้นได้รับอิทธิพลจากเนื้อหาข้อความของโปรไฟล์ หรือเนื้อหาข้อความนั้นได้รับความสนใจและการยอมรับมากกว่าที่อาจเกิดขึ้นหากรูปภาพที่เกี่ยวข้องไม่ถูกมองว่าน่าสนใจ

ด้วยเหตุผลที่ชัดเจน ทีมวิจัยไม่สามารถเผยแพร่ชุดข้อมูลหรือซอร์สโค้ดสำหรับ TIRR ได้ แต่สนับสนุนให้ทีมอื่นทำซ้ำและยืนยันแนวทางของตน

 

nb รูปภาพที่ใช้ในภาพประกอบหลักมาจาก thispersondoesnotexist.com

นักเขียนเกี่ยวกับการเรียนรู้ของเครื่อง ปัญญาประดิษฐ์ และข้อมูลขนาดใหญ่
เว็บไซต์ส่วนตัว: martinanderson.ai
ติดต่อ: [ป้องกันอีเมล]
ทวิตเตอร์: @manders_ai