Вештачка интелигенција

Систем за препораки за сродна душа со вештачка интелигенција заснован само на слики

Ажурирани on Август 27, 2021

Истражувачите од ОК користеле невронски мрежи за да развијат систем за препораки за онлајн состаноци базиран на целосно слики, кој само зема предвид дали двајца корисници се привлекуваат еден од друг кон фотографиите (наместо информациите за профилот како работа, возраст итн.). ), и откриле дека ги надминува помалку „плитките“ системи во однос на добивањето прецизно совпаѓање.

Резултирачкиот систем се нарекува Временски реципрочен препорач заснован на слика (TIRR) и користи рекурентни невронски мрежи (RNN) за да ја протолкува историската наклонетост на корисникот за лицата со кои тој или таа се среќава додека прелистува за потенцијални совпаѓања.

на хартија има право - можеби обесхрабрувачки - Фотографиите се сè што ви треба за реципрочна препорака во онлајн запознавањеи доаѓа од двајца истражувачи од Универзитетот во Бристол, значително подобрување на сличен систем (наречен ImRec) објавен од истиот тим во 2020 година.

Во тестовите, системот доби најсовремена точност во неговата способност да предвидува реципрочен совпаѓања меѓу корисниците, подобрувајќи не само на работата на истражувачите во 2020 година, туку и на другите системи за реципрочни препораки за запознавање базирани на содржина кои земаат предвид подетални информации засновани на текст во профилите за запознавање.

Збир на податоци за запознавање во реалниот свет

TIRR беше обучен за кориснички информации обезбедени од неименувана „популарна“ услуга за онлајн состаноци со „неколку милиони регистрирани корисници“, која им овозможува на корисниците да комуницираат меѓу себе само откако секој ќе го „лајкне“ профилот на другиот. Подмножеството користени податоци опфати 200,000 субјекти, рамномерно поделени меѓу мажи и жени и приближно 800,000 претпочитања изразени од страна на корисниците на сите профили за запознавање.

Бидејќи анонимната услуга за запознавање што ги обезбедува податоците поддржува само хетеросексуални совпаѓања, во истражувањето беа опфатени само совпаѓања од машки/женски.

TIRR ги подобрува претходните дизајни на системи за реципрочни препораки (RRS) во ова поле со директно пресметување на веројатноста за совпаѓање помеѓу два профила, само врз основа на сликите на профилот. Претходните системи наместо тоа предвидуваа две еднонасочни преференции и потоа ги собраа за да добијат предвидување.

Истражувачите ги исклучија корисниците кои беа отстранети од услугата за запознавање (од која било причина, вклучително и доброволно напуштање), и ги исклучија профилите кои не вклучуваат фотографии засновани на лице.

Корисничките истории беа ограничени на една година наназад, со цел да се избегнат потенцијални аномалии што би можеле да се појават бидејќи страницата за состаноци ги изменила своите алгоритми со текот на времето. Тие, исто така, беа ограничени на максимум 15 преференции на корисникот, бидејќи тие беа демонстрирани како доволни за докажување на дизајнот на моделот, додека пообемната употреба на преференции ги деградираше перформансите и го зголеми времето за обука.

Дополнително, некои од постраствените или долгорочните корисници имале историја со илјадници на преференции, кои би можеле да ризикуваат да ја искриват тежината на добиените карактеристики и дополнително да го продолжат времето на обука.

Сијамска мрежа

TIRR се формулира со користење на a Сијамска мрежа, обично се користи за учење „еднократно“..

Шаблонска сијамска мрежа, каде што паралелните конволуциони невронски мрежи (CNN) споделуваат тежина, но не и податоци. Тие, исто така, делат функција на загуба, изведена од излезите на секој CNN, и ознака за заземјување на вистината. Извор: https://arxiv.org/pdf/2108.11714.pdf

Мрежата беше обучена со користење на бинарна кросентропија, вообичаена функција на загуба во невронските мрежи, и онаа за која истражувачите открија дека дава супериорни резултати во споредба со контрастна загуба. Последново е најефективно во системите кои го оценуваат паритетот помеѓу две лица, но бидејќи тоа не е целта на TIRR, тоа е пристап што слабо функционира во овој контекст.

Неопходно е системот да ги задржи и надгради информациите што ги развива додека обуката се повторува многу пати преку истите податоци, а сијамската мрежа во TIRR користи LSTM (Долгорочна краткорочна меморија) мрежа за да се донесат овие одлуки и да се осигура дека функциите што се сметаат за релевантни не се отфрлаат ад хок додека рамката ги гради своите увиди.

Специфичната сијамска мрежна архитектура за TIRR.

Истражувачите открија дека мрежата тренира многу бавно кога се внесуваат сите податоци, и последователно ја подели обуката во три фази користејќи три различни подмножества на податоци. Има дополнителна предност во ова, бидејќи експериментите на истражувачите од 2020 година веќе покажаа дека обуката на машките и женските сетови на податоци одделно ги подобрува перформансите на системот за реципрочни препораки.

Разделување на одделни тренинзи за сијамската мрежа на TIRR.

Тестирање

За да ги проценат перформансите на TIRR, истражувачите задржаа дел од добиените податоци на едната страна и го поминаа низ целосно конвергираниот систем. Меѓутоа, бидејќи системот е сосема нов, не постојат директно аналогни претходни системи со кои би можел да се спореди.

Затоа, истражувачите најпрво воспоставија крива на карактеристика на ресиверот (ROC(UMAP) да ги намали 128-димензионалните вектори за лесна визуелизација, со цел да се воспостави кохерентен проток на допаѓања и недопаѓања.

Лево, ROC на сијамската мрежа како основен индикатор за перформансите; на десната страна, визуелизацијата UMAP покажува „допаѓања“ во црвено, „не ми се допаѓа“ во црно.

TIRR беше тестиран против колаборативно филтрирање и системи засновани на содржина со слична амбиција, вклучувајќи ја и претходната работа на истражувачите ImRec (види погоре), и РЕКОН, RRS од 2010 година, како и колаборативните алгоритми за филтрирање RCF (РРС за запознавање од 2015 година врз основа на текстуална содржина на профили за запознавање) и LFRR (сличен проект од 2019 година).

Во сите случаи, TIRR можеше да понуди супериорна прецизност, иако само маргинално во споредба со LFRR, што веројатно укажува на корелирани фактори помеѓу содржината на текстот на профилот и вооченото ниво на привлечност на профилните фотографии на субјектите.

Речиси паритетот помеѓу TIRR базиран на слики и LFRR базиран на повеќе текст дозволува најмалку две можности: перцепцијата на корисниците за визуелната привлечност да биде под влијание на текстуалната содржина на профилите; или дека содржината на текст добива поголемо внимание и одобрување отколку што би можело да се случи ако поврзаната слика не се сметаше за привлечна.

Од очигледни причини, истражувачкиот тим не може да ги објави податоците или изворниот код за TIRR, но ги охрабрува другите тимови да го дуплираат и да го потврдат својот пристап.

nb Сликите користени во главната илустрација се од thispersondoesnotexist.com.

Следно

Обединувачка синтеза на говор и гест

Не ја пропуштајте

Софтвер за детектори за бебиња ги следи отчукувањата на срцето и дишењето

Мартин Андерсон

Писател за машинско учење, вештачка интелигенција и големи податоци.
Лична страница: martinanderson.ai
Контакт: [заштитена по е-пошта]
Твитер: @manders_ai

Обединете се.AI

Систем за препораки за сродна душа со вештачка интелигенција заснован само на слики

Вештачка интелигенција

Систем за препораки за сродна душа со вештачка интелигенција заснован само на слики

Содржина

Збир на податоци за запознавање во реалниот свет

Сијамска мрежа

Тестирање

Последни пораки

Обединете се.AI

Систем за препораки за сродна душа со вештачка интелигенција заснован само на слики

Содржина

Збир на податоци за запознавање во реалниот свет

Сијамска мрежа

Тестирање

Можеби ви се допаѓа

Последни пораки