Bizimle iletişime geçin

Yapay Zeka

Yalnızca Görsellere Dayalı Yapay Zeka Ruh Eşi Tavsiye Sistemi

mm

İngiltere'den araştırmacılar, çevrimiçi flört eşleşmeleri için tamamen görüntü tabanlı bir öneri sistemi geliştirmek amacıyla sinir ağlarını kullandılar. Bu sistem, yalnızca iki kullanıcının birbirlerinin fotoğraflarına ilgi duyup duymadığını (meslek, yaş vb. gibi profil bilgileri yerine) dikkate alıyor ve doğru eşleşme elde etme açısından daha az "yüzeysel" sistemlerden daha iyi performans gösterdiğini buldular.

Ortaya çıkan sisteme Zamansal Görüntü Tabanlı Karşılıklı Önerici (TIRR) adı veriliyor ve kullanıcının potansiyel eşleşmeleri ararken karşılaştığı yüzlere ilişkin geçmiş eğilimini yorumlamak için Yinelemeli Sinir Ağları'nı (RNN'ler) kullanıyor.

MKS kâğıt hakkı - belki de cesaret kırıcı bir şekilde - Çevrimiçi Buluşmada Karşılıklı Tavsiye İçin Tek İhtiyacınız Olan Fotoğraflar, ve Bristol Üniversitesi'ndeki iki araştırmacıdan geliyor ve benzer bir sistem üzerinde önemli ölçüde gelişiyor ( ImRec) 2020 yılında aynı ekip tarafından piyasaya sürüldü.

Testlerde, sistem tahmin etme yeteneğinde son teknoloji doğruluk elde etti. karşılıklı Kullanıcılar arasındaki eşleşmeler, yalnızca araştırmacıların 2020 yılındaki çalışmalarını değil, aynı zamanda flört profillerinde daha ayrıntılı, metin tabanlı bilgileri dikkate alan diğer içerik tabanlı flört karşılıklı öneri sistemlerini de geliştiriyor.

Gerçek Dünya Arkadaş Veri Kümesi

TIRR, "birkaç milyon kayıtlı kullanıcısı" olan ve kullanıcıların yalnızca birbirlerinin profilini "beğendikten" sonra birbirleriyle iletişim kurmalarına izin veren, ismi açıklanmayan "popüler" bir çevrimiçi tanışma servisi tarafından sağlanan kullanıcı bilgileriyle eğitildi. Kullanılan veri alt kümesi, erkekler ve kadınlar arasında eşit olarak bölünmüş 200,000 katılımcıyı ve tüm tanışma profillerinde yaklaşık 800,000 kullanıcı tarafından ifade edilen tercihleri ​​içeriyordu.

Verileri sağlayan anonim flört servisi sadece heteroseksüel eşleşmeleri desteklediği için araştırmada sadece erkek/kadın eşleşmeleri ele alınmıştır.

TIRR, yalnızca profil görüntülerine dayalı olarak iki profil arasındaki eşleşme olasılığını doğrudan hesaplayarak bu alandaki önceki karşılıklı öneri sistemleri (RRS) tasarımlarını geliştirir. Bunun yerine önceki sistemler, iki tek yönlü tercihi tahmin etmiş ve ardından bir tahmin elde etmek için bunları bir araya getirmişti.

Araştırmacılar, flört hizmetinden çıkarılan kullanıcıları (kendi isteğiyle ayrılmak da dahil olmak üzere herhangi bir nedenle) ve yüz tabanlı fotoğraflar içermeyen profilleri hariç tuttu.

Arkadaşlık sitesi algoritmalarını zaman içinde değiştirirken meydana gelebilecek potansiyel anormallikleri önlemek için kullanıcı geçmişleri bir yıl önceyle sınırlıydı. Ayrıca, maksimum 15 kullanıcı tercihiyle sınırlandırıldılar, çünkü bunların model tasarımını kanıtlamak için yeterli olduğu gösterildi, tercihlerin daha kapsamlı kullanımı performansı düşürdü ve eğitim sürelerini artırdı.

Ek olarak, daha hevesli veya uzun süreli kullanıcıların bazılarının geçmişleri vardı. Binlerce Bu, elde edilen özelliklerin ağırlığını çarpıtma ve eğitim sürelerini daha da uzatma riski taşıyabilecek tercihlerin.

Siyam Ağı

TIRR kullanılarak formüle edilmiştir Siyam ağı, genellikle için kullanılır 'tek seferlik' öğrenme.

Paralel Konvolüsyonel Sinir Ağlarının (CNN'ler) ağırlıkları paylaştığı ancak verileri paylaşmadığı bir şablon Siyam ağı. Ayrıca, her bir CNN'nin çıktılarından türetilen bir kayıp fonksiyonunu ve bir temel doğruluk etiketini paylaşırlar. Kaynak: https://arxiv.org/pdf/2108.11714.pdf

Paralel Konvolüsyonel Sinir Ağlarının (CNN'ler) ağırlıkları paylaştığı ancak verileri paylaşmadığı bir şablon Siyam ağı. Ayrıca, her bir CNN'nin çıktılarından türetilen bir kayıp fonksiyonunu ve bir temel doğruluk etiketini paylaşırlar.  Kaynak: https://arxiv.org/pdf/2108.11714.pdf

Ağ, sinir ağlarında yaygın bir kayıp fonksiyonu olan ve araştırmacıların, diğerlerine kıyasla daha üstün sonuçlar verdiğini tespit ettiği ikili çapraz entropi kullanılarak eğitildi. karşılaştırmalı kayıpİkincisi, iki yüz arasındaki eşitliği değerlendiren sistemlerde en etkilidir, ancak bu TIRR'nin amacı olmadığından, bu bağlamda zayıf performans gösteren bir yaklaşımdır.

Sistemin, eğitim aynı veriler üzerinde birçok kez yineleme yaptıkça geliştirdiği bilgileri koruması ve üzerine inşa etmesi gerekir ve TIRR'deki Siyam ağı bir LSTM (Uzun Süreli Kısa Süreli Bellek) ağı, bu kararları vermek ve çerçeve içgörülerini oluştururken ilgili görülen özelliklerin geçici olarak atılmamasını sağlamak için.

TIRR için özel Siyam ağ mimarisi.

TIRR için özel Siyam ağ mimarisi.

Araştırmacılar, tüm veriler girildiğinde ağın çok yavaş eğitildiğini ve ardından eğitimi üç farklı veri alt kümesini kullanarak üç aşamaya böldüğünü tespit ettiler. Bu, araştırmacıların 2020 deneylerinin erkek ve kadın veri kümelerini ayrı ayrı eğitmenin karşılıklı öneri sisteminin performansını artırdığını göstermesi nedeniyle ek bir avantaj daha sağlıyor.

TIRR'nin Siyam ağı için ayrı eğitim oturumlarının dökümü.

TIRR'nin Siyam ağı için ayrı eğitim oturumlarının dökümü.

Test yapmak

TIRR'nin performansını değerlendirmek için araştırmacılar, elde edilen verilerin bir kısmını bir kenara ayırıp tamamen birleşik sistemden geçirdiler. Ancak, sistem oldukça yeni olduğundan, karşılaştırılabileceği doğrudan benzer önceki sistemler bulunmamaktadır.

Bu nedenle araştırmacılar önce bir Alıcı Çalışma Karakteristik Eğrisi oluşturdular (ROC) Siyam ağı için taban çizgisi, Boyut Azaltma için Tekdüze Manifold Yaklaşımı ve Projeksiyon kullanılmadan önce (UMAP) tutarlı bir beğeni ve beğenmeme akışı oluşturmak için kolay görselleştirme için 128 boyutlu vektörleri inceltmek.

Solda, performansın temel göstergesi olarak Siyam ağının ROC'si; sağda, UMAP görselleştirmesi "beğenilenleri" kırmızıyla, "beğenmeyenleri" siyahla gösterir.

Solda, performansın temel göstergesi olarak Siam ağının ROC'si; sağda, UMAP görselleştirmesi 'beğenileri' kırmızı, 'beğenmemeleri' siyah olarak gösteriyor.

TIRR, araştırmacıların önceki çalışması ImRec (yukarıya bakınız) dahil olmak üzere benzer bir kapsama sahip işbirlikçi filtreleme ve içerik tabanlı sistemlere karşı test edildi ve RECON, 2010'dan bir RRS ve işbirlikçi filtreleme algoritmaları RCF (flört profillerinin metin içeriğine dayalı 2015 tarihli bir RRS) ve LFRR (2019'dan benzer bir proje).

Tüm durumlarda TIRR, LFRR ile karşılaştırıldığında yalnızca marjinal düzeyde olsa da üstün bir doğruluk sunabilmiştir; bu durum muhtemelen profil metni içeriği ile deneklerin profil fotoğraflarının algılanan çekicilik düzeyi arasında ilişki olduğunu göstermektedir.

Resim tabanlı TIRR ile daha metin tabanlı LFRR arasındaki neredeyse eşitlik, en azından iki olasılığa olanak tanır: Kullanıcıların görsel çekiciliğe ilişkin algısının profillerin metin içeriğinden etkilenmesi; veya metin içeriğinin, ilişkili resim çekici olarak algılanmasaydı elde edilebilecek olandan daha fazla dikkat ve onay alması.

Açık nedenlerden dolayı, araştırma ekibi TIRR için veri kümesini veya kaynak kodunu yayınlayamıyor, ancak diğer ekipleri yaklaşımlarını kopyalamaya ve onaylamaya teşvik ediyor.

 

nb Ana resimde kullanılan resimler thispersondoesnotexist.com'dan alınmıştır.

Makine öğrenimi yazarı, insan görüntü sentezi alanında uzman. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel sitesi: martinanderson.ai
İletişim [e-posta korumalı]
Twitter: @manders_ai