ხელოვნური ინტელექტი

AI Soulmate Recommender სისტემა, რომელიც დაფუძნებულია მხოლოდ სურათებზე

განახლებულია on 27 წლის 2021 აგვისტო

მკვლევარებმა დიდი ბრიტანეთიდან გამოიყენეს ნერვული ქსელები, რათა შეემუშავებინათ მთლიანად გამოსახულებაზე დაფუძნებული სარეკომენდაციო სისტემა ონლაინ გაცნობის მატჩებისთვის, რომელიც მხოლოდ ითვალისწინებს, იზიდავს თუ არა ორ მომხმარებელს ერთმანეთის ფოტოები (და არა პროფილის ინფორმაცია, როგორიცაა სამუშაო, ასაკი და ა.შ.). ), და დაადგინეს, რომ ის აჯობებს ნაკლებად „არაღრმა“ სისტემებს ზუსტი შესატყვისების მიღების თვალსაზრისით.

შედეგად სისტემას ეწოდება დროებითი გამოსახულებაზე დაფუძნებული საპასუხო რეკომენდაცია (TIRR) და იყენებს განმეორებით ნერვულ ქსელებს (RNNs) მომხმარებლის ისტორიული მიდრეკილების ინტერპრეტაციისთვის სახეების მიმართ, რომლებსაც ის ხვდება პოტენციური შესატყვისების დათვალიერებისას.

ის ქაღალდი უფლება აქვს - შესაძლოა გულდასაწყვეტად - ფოტოები არის ყველაფერი, რაც გჭირდებათ საპასუხო რეკომენდაციისთვის ონლაინ გაცნობისთვისდა მომდინარეობს ბრისტოლის უნივერსიტეტის ორი მკვლევრისგან, რომლებიც მნიშვნელოვნად აუმჯობესებენ მსგავს სისტემას (ე.წ. ImRec) გამოუშვა იგივე გუნდი 2020 წელს.

ტესტებში სისტემამ მიიღო უახლესი სიზუსტე წინასწარმეტყველების უნარში საპასუხო მომხმარებელთა შორის შესატყვისები, რაც უმჯობესდება არა მხოლოდ მკვლევართა 2020 წლის მუშაობის, არამედ სხვა კონტენტზე დაფუძნებული გაცნობის საპასუხო რეკომენდაციების სისტემებზე, რომლებიც ითვალისწინებენ უფრო დეტალურ, ტექსტზე დაფუძნებულ ინფორმაციას გაცნობის პროფილებში.

რეალური სამყაროს გაცნობის მონაცემთა ნაკრები

TIRR-მ გაიარა ტრენინგი მომხმარებლის ინფორმაციაზე, რომელიც მოწოდებული იყო უსახელო „პოპულარული“ ონლაინ გაცნობის სერვისის მიერ „რამდენიმე მილიონი დარეგისტრირებული მომხმარებლის“ საშუალებით, რომელიც მომხმარებლებს საშუალებას აძლევს დაუკავშირდნენ ერთმანეთს მხოლოდ მას შემდეგ, რაც თითოეულს „მოეწონება“ მეორის პროფილი. გამოყენებული მონაცემების ქვეჯგუფი მოიცავდა 200,000 სუბიექტს, თანაბრად იყოფა მამაკაცებსა და ქალებს შორის და დაახლოებით 800,000 მომხმარებლის მიერ გამოხატული პრეფერენციები გაცნობის ყველა პროფილში.

ვინაიდან ანონიმური გაცნობის სერვისი, რომელიც უზრუნველყოფს მონაცემებს, მხარს უჭერს მხოლოდ ჰეტეროსექსუალურ დამთხვევებს, კვლევაში მხოლოდ მამაკაცის/ქალის შესატყვისი იყო დაფარული.

TIRR აუმჯობესებს წინა საპასუხო სარეკომენდაციო სისტემების (RRS) დიზაინს ამ სფეროში ორ პროფილს შორის დამთხვევის ალბათობის პირდაპირ გაანგარიშებით, მხოლოდ პროფილის სურათებზე დაყრდნობით. წინა სისტემებმა სანაცვლოდ იწინასწარმეტყველა ორი ცალმხრივი პრეფერენციები და შემდეგ გააერთიანა ისინი პროგნოზის მისაღებად.

მკვლევარებმა გამორიცხეს მომხმარებლები, რომლებიც ამოღებულნი იყვნენ გაცნობის სერვისიდან (ნებისმიერი მიზეზით, მათ შორის ნებაყოფლობით დატოვების ჩათვლით) და გამორიცხეს პროფილები, რომლებიც არ შეიცავს სახეზე დაფუძნებულ ფოტოებს.

მომხმარებლის ისტორია შემოიფარგლებოდა ერთი წლის წინ, რათა თავიდან ავიცილოთ პოტენციური ანომალიები, რომლებიც შეიძლება მოხდეს, როდესაც გაცნობის საიტი დროთა განმავლობაში ცვლიდა ალგორითმებს. ისინი ასევე შემოიფარგლებოდა მაქსიმუმ 15 მომხმარებლის პრეფერენციებით, რადგან ეს საკმარისი იყო მოდელის დიზაინის დასამტკიცებლად, ხოლო პრეფერენციების უფრო ფართო გამოყენებამ შეამცირა შესრულება და გაზარდა ტრენინგის დრო.

გარდა ამისა, ზოგიერთ უფრო მგზნებარე ან გრძელვადიან მომხმარებელს ჰქონდა ისტორია ათასობით პრეფერენციების, რამაც შესაძლოა საფრთხე შეუქმნას მიღებული მახასიათებლების წონას და შემდგომ გაახანგრძლივოს ვარჯიშის დრო.

სიამის ქსელი

TIRR ჩამოყალიბებულია ა სიამის ქსელი, ჩვეულებრივ გამოიყენება "ერთჯერადი" სწავლა.

შაბლონი სიამის ქსელი, სადაც პარალელური კონვოლუციური ნერვული ქსელები (CNN) იზიარებენ წონას, მაგრამ არა მონაცემებს. ისინი ასევე იზიარებენ ზარალის ფუნქციას, რომელიც მიღებულია თითოეული CNN-ის შედეგებიდან და ჭეშმარიტების ეტიკეტზე. წყარო: https://arxiv.org/pdf/2108.11714.pdf

ქსელი გაწვრთნილი იყო ბინარული კროსენტროპიის გამოყენებით, ნერვულ ქსელებში დაკარგვის საერთო ფუნქციით, და რომელიც მკვლევარებმა აღმოაჩინეს, რომ უფრო მაღალ შედეგებს იძლევა. კონტრასტული დაკარგვა. ეს უკანასკნელი ყველაზე ეფექტურია სისტემებში, რომლებიც აფასებენ პარიტეტს ორ სახეს შორის, მაგრამ რადგან ეს არ არის TIRR-ის მიზანი, ეს არის მიდგომა, რომელიც ცუდად მუშაობს ამ კონტექსტში.

აუცილებელია სისტემამ შეინარჩუნოს და დაეყრდნოს ინფორმაციას, რომელსაც ის ავითარებს, როდესაც ტრენინგი მრავალჯერ იმეორებს ერთსა და იმავე მონაცემებს, ხოლო სიამის ქსელი TIRR-ში იყენებს LSTM (გრძელვადიანი მოკლევადიანი მეხსიერების) ქსელი ამ გადაწყვეტილებების მისაღებად და იმის უზრუნველსაყოფად, რომ რელევანტურად მიჩნეული ფუნქციები არ იქნება უგულებელყოფილი ad hoc, რადგან ჩარჩო აყალიბებს თავის შეხედულებებს.

სპეციფიური სიამის ქსელის არქიტექტურა TIRR-ისთვის.

მკვლევარებმა დაადგინეს, რომ ქსელი ძალიან ნელა ვარჯიშობდა, როდესაც ყველა მონაცემი იყო შეყვანილი და შემდგომში ტრენინგი დაყო სამ ეტაპად, მონაცემთა სამი განსხვავებული ქვეჯგუფის გამოყენებით. ამაში არის გარკვეული დამატებითი უპირატესობა, რადგან მკვლევარების 2020 წლის ექსპერიმენტებმა უკვე აჩვენა, რომ მამრობითი და მდედრობითი სქესის მონაცემთა ნაკრების ცალ-ცალკე სწავლება აუმჯობესებს საპასუხო სარეკომენდაციო სისტემის მუშაობას.

TIRR-ის სიამის ქსელის ცალკეული სასწავლო სესიების დაშლა.

ტესტირება

TIRR-ის მუშაობის შესაფასებლად, მკვლევარებმა შეინახეს მიღებული მონაცემების ნაწილი ერთ მხარეს და გაატარეს იგი სრულად კონვერგირებული სისტემის მეშვეობით. თუმცა, ვინაიდან სისტემა საკმაოდ ახალია, არ არსებობს პირდაპირ ანალოგიური წინა სისტემები, რომელთანაც მისი შედარება შეიძლება.

ამიტომ მკვლევარებმა პირველად დაადგინეს მიმღების ოპერაციული მახასიათებლების მრუდი (ROC) საბაზისო ხაზი სიამის ქსელისთვის, სანამ გამოიყენებდით ერთიანი მრავალფეროვნების მიახლოებას და პროექციას განზომილების შემცირებისთვის (UMAP) 128-განზომილებიანი ვექტორების შესამცირებლად მარტივი ვიზუალიზაციისთვის, რათა ჩამოყალიბდეს მოწონებების და არ მოწონების თანმიმდევრული ნაკადი.

მარცხნივ, სიამის ქსელის ROC, როგორც შესრულების საბაზისო მაჩვენებელი; მარჯვნივ, UMAP ვიზუალიზაცია აჩვენებს "მოწონებებს" წითლად, "არ მომწონს" შავში.

TIRR ტესტირება ჩატარდა ერთობლივი ფილტრაციისა და კონტენტზე დაფუძნებული სისტემების წინააღმდეგ მსგავსი ამბიტით, მათ შორის მკვლევართა წინა სამუშაო ImRec (იხ. ზემოთ), და რეკონს, RRS 2010 წლიდან, ისევე როგორც ერთობლივი ფილტრაციის ალგორითმები RCF (2015 წლის გაცნობის RRS დაფუძნებული გაცნობის პროფილების ტექსტურ შინაარსზე) და LFRR (მსგავსი პროექტი 2019 წლიდან).

ყველა შემთხვევაში TIRR-ს შეეძლო უმაღლესი სიზუსტის შეთავაზება, თუმცა მხოლოდ ზღვრულად LFRR-თან შედარებით, რაც შესაძლოა მიუთითებდეს პროფილის ტექსტის შინაარსსა და სუბიექტების პროფილის ფოტოების მიმზიდველობის აღქმულ დონეს შორის დამაკავშირებელ ფაქტორებს.

თითქმის თანასწორობა გამოსახულებაზე დაფუძნებულ TIRR-სა და უფრო ტექსტზე დაფუძნებულ LFRR-ს შორის იძლევა მინიმუმ ორ შესაძლებლობას: რომ მომხმარებლების ვიზუალური მიმზიდველობის აღქმაზე გავლენას ახდენს პროფილების ტექსტური შინაარსი; ან ტექსტის შინაარსი უფრო მეტ ყურადღებას და მოწონებას აქცევს, ვიდრე შეიძლებოდა მომხდარიყო, თუ ასოცირებული სურათი არ აღიქმებოდა მიმზიდველად.

აშკარა მიზეზების გამო, კვლევის ჯგუფს არ შეუძლია TIRR-ის მონაცემთა ნაკრების ან წყაროს კოდის გამოქვეყნება, მაგრამ წაახალისებს სხვა გუნდებს, გაამრავლონ და დაადასტურონ თავიანთი მიდგომა.

nb მთავარ ილუსტრაციაში გამოყენებული სურათები არის thispersondoesnotexist.com-დან.

შემდეგი

მეტყველებისა და ჟესტების გამაერთიანებელი სინთეზი

არ გამოტოვოთ

ბავშვის დეტექტორის პროგრამული უზრუნველყოფა გულისა და სუნთქვის სიხშირის მონიტორინგს

მარტინ ანდერსონი

მწერალი მანქანათმცოდნეობის, ხელოვნური ინტელექტისა და დიდი მონაცემების შესახებ.
პირადი საიტი: მარტინადერსონი.აი
კონტაქტი: [ელ.ფოსტით დაცულია]
Twitter: @manders_ai

Unite.AI

AI Soulmate Recommender სისტემა, რომელიც დაფუძნებულია მხოლოდ სურათებზე

ხელოვნური ინტელექტი

AI Soulmate Recommender სისტემა, რომელიც დაფუძნებულია მხოლოდ სურათებზე

სარჩევი

რეალური სამყაროს გაცნობის მონაცემთა ნაკრები

სიამის ქსელი

ტესტირება

ბოლო პოსტები

Unite.AI

AI Soulmate Recommender სისტემა, რომელიც დაფუძნებულია მხოლოდ სურათებზე

სარჩევი

რეალური სამყაროს გაცნობის მონაცემთა ნაკრები

სიამის ქსელი

ტესტირება

შეიძლება მოგწონს

ბოლო პოსტები