სტუბი სქესის განსაზღვრა სიარულის სტილების მეშვეობით მანქანათმცოდნეობით - Unite.AI
დაკავშირება ჩვენთან ერთად

ხელოვნური ინტელექტი

სქესის განსაზღვრა სიარულის სტილების მეშვეობით მანქანათმცოდნეობით

mm
განახლებულია on

რუმინელმა მკვლევარებმა შეიმუშავეს მანქანათმცოდნეობის სისტემა, რომელსაც შეუძლია ამოიცნოს ადამიანის სქესი სიარულის გზაზე, სახის კომპონენტების ანალიზის საჭიროების გარეშე (რომელიც შეიძლება იყოს დამალული ან დაფარული) და სილუეტის ანალიზზე ან სხვა სახის ტანზე დაცვით. მინიშნებები სქესის შესახებ (რომელიც შეიძლება სხვა სქესის წარმომადგენლებმა გააყალბონ).

პირიქით, ახალი სისტემა იყენებს არსებულ ეტიკეტირების სისტემებს, რომლებიც დაფუძნებულია ამ ეფემერულ (და ცვალებადი) სიგნალებზე, რათა გამოავლინოს ძირითადი მახასიათებლები, რომლებიც განასხვავებენ მამაკაცისა და ქალის სიარულის სისტემას, რაც იწვევს სისტემას, რომელიც ეფექტურად განსაზღვრავს სქესს მხოლოდ პიროვნების "ჩონჩხის" მოძრაობებიდან. სიარული.

ფაქტობრივად, ეს ახალი მიდგომა რაოდენობრივად განსაზღვრავს იმ განსხვავებულ გზებს, რომლითაც მამაკაცები და ქალები დადიან სხვა სიგნალების გამოყენების გარეშე; მაგრამ ვინაიდან იგი იყენებს სხვა მახასიათებლებს (როგორიცაა სახის ინფორმაცია) სიარულის სტილის თავდაპირველად ეტიკეტირების მიზნით, კვლევა ღიად ტოვებს კითხვას, თუ რომელი კონკრეტული თვისებები განასხვავებს სქესს სიარულის დროს.

ახალი მეთოდი იღებს გენდერულ იდენტობას სახის ანალიზის მოდელებიდან, რომლებიც მოქმედებენ შეზღუდვების ქვეშ (როგორიცაა შეზღუდული გამოსაყენებელი კუთხე და მონაცემთა დამუშავების საჭიროება). შემდეგ სისტემა ანიჭებს ჩონჩხის მოძრაობის მახასიათებლებს, როგორც მამრობითი ან მდედრობითი სქესის, და გამოხდის დამახასიათებელ სიარულის ხელმოწერებს თითოეულისთვის, სახის, ტანსაცმლისა და სხვა არასანდო წყაროების იგნორირებას. წყარო: https://arxiv.org/pdf/2111.00538.pdf

ახალი მეთოდი იღებს გენდერულ იდენტობას სახის ანალიზის მოდელებიდან, რომლებიც მოქმედებენ შეზღუდვების ქვეშ (როგორიცაა შეზღუდული გამოსაყენებელი კუთხე და მონაცემთა დამუშავების საჭიროება). შემდეგ სისტემა ანიჭებს ჩონჩხის მოძრაობის მახასიათებლებს, როგორც მამრობითი ან მდედრობითი სქესის, და გამოხდის დამახასიათებელ სიარულის ხელმოწერებს თითოეულისთვის, სახის, ტანსაცმლისა და სხვა არასანდო წყაროების იგნორირებას. წყარო: https://arxiv.org/pdf/2111.00538.pdf

ახალი ქაღალდი სათაურია From Face to Gait: სუსტად ზედამხედველობითი სწავლება გენდერული ინფორმაციის სწავლა საფეხმავლო ნიმუშებიდან, და მოდის ბუქარესტის Politehnica უნივერსიტეტის მკვლევარებისგან.

სისტემა ასრულებს სახის ანალიზის მოდელებს და ხშირად აღემატება ამ სტანდარტებს F1 ანგარიში 91%-მდე და გთავაზობთ ახალი სცენარების განზოგადების მაღალ დონეს, მათ შორის სხვადასხვა თვალსაზრისისა და გარემოების ჩათვლით, რომლებიც, როგორც წესი, დაბლოკავს სახეზე დაფუძნებული ან მსგავსი გენდერული ამოცნობის სისტემების ეფექტურობას. ეს მოიცავს სახის დაჩრდილულ ხედებს, არაფრონტალურ კუთხეებს და დაბალი გარჩევადობის გამოსახულების ძალიან ტიპურ სცენარს, ან იმ ადამიანების ზედამხედველობას, რომლებიც შორს არიან გამოსახულების შიგნით, სადაც მხოლოდ მოძრაობის სტილი რჩება სქესის პოტენციურ საიმედო ინდიკატორად.

გენდერული უფსკრული

როგორც მკვლევარები ასკვნიან, ასეთ სისტემას აქვს დიდი პოტენციალი დემოგრაფიული შეგროვების ჩარჩოებისთვის, რომლებიც ამჟამად ხელს უშლის არა მხოლოდ ნიღბის მიღებას COVID-ის პირობებში, არამედ მოდის და შემთხვევითობის ექსცენტრიულობით, რაც ქმნის ტანსაცმელს და სილუეტის ანალიზი სათვალთვალო კადრებიდან სქესის იდენტიფიცირების არასანდო მეთოდი.

მეთვალყურეობის თვალსაზრისით, ყველა პოტენციური სამიზნის დაკლების შესაძლებლობამ, რომელიც არ შეესაბამება სამიზნე სუბიექტის სქესს, შეიძლება შეამციროს წინასწარი დამუშავება და ადამიანისა და მანქანების ყურადღების საჭიროება განახევრებით – რადგან ამჟამინდელი საიდენტიფიკაციო სისტემები ხშირად უჭირთ სწორად მინიჭებას. სქესი მეთვალყურეობის ქვეშ მყოფი პირისთვის.

ახალი ნაშრომიდან: სხვადასხვა მაგალითები, სადაც გენდერული აღიარების სისტემები ვერ ხერხდება. ზემოთ მოცემულ სტრიქონში ჩვენ ვხედავთ მკვლევართა ახალი სიარულის ანალიზის სისტემას, რომელიც სწორად ემთხვევა გამოსახულების ნამდვილ ეტიკეტს (M ან F), ხოლო სახის ანალიზი იმავე შემთხვევაში ვერ მოხერხდა. ქვემოთ მოცემულ სტრიქონში ჩვენ ვხედავთ შემთხვევებს, როდესაც მკვლევარების მიერ გამოყენებული მარკირების ინსტრუმენტები წარმოადგენდნენ „ხმაურიანი“ (ანუ არასწორი) გენდერული იარლიყებს. ამის საპირისპიროდ, მკვლევარებმა სხვა მეთოდებთან ერთად გამოიყენეს PENCIL („ხმაური ხმაურის ალბათური კორექტირება ბოლოდან ბოლომდე სწავლისთვის ხმაურიანი ეტიკეტებით“).

ახალი ნაშრომიდან: სხვადასხვა მაგალითები, სადაც გენდერული აღიარების სისტემები ვერ ხერხდება. ზემოთ მოცემულ სტრიქონში ჩვენ ვხედავთ მკვლევართა ახალი სიარულის ანალიზის სისტემას, რომელიც სწორად ემთხვევა გამოსახულების ნამდვილ ეტიკეტს (M ან F), ხოლო სახის ანალიზი იმავე შემთხვევაში ვერ მოხერხდა. ქვემოთ მოცემულ სტრიქონში ჩვენ ვხედავთ შემთხვევებს, როდესაც მკვლევარების მიერ გამოყენებული ეტიკეტირების ინსტრუმენტები წარმოადგენდნენ „ხმაურიანი“ (ანუ არასწორი) გენდერული ეტიკეტებით. ამის საწინააღმდეგოდ მკვლევარებმა გამოიყენეს პენკილი ('სავარაუდო ხმაურის ბოლოდან ბოლომდე კორექტირება ხმაურიანი ეტიკეტებით სწავლისთვის'), სხვა მეთოდებთან ერთად.

ბუნებრივია, სიარულის ანალიზის საშუალებით სქესის საიმედო ამოცნობის შესაძლებლობა სავარაუდოდ გაიზრდება მიმდინარე ინტერესი სიარულის გაყალბების მიდგომების მიმართ.

სქესის განსაზღვრა პროქსით

თეორიულად შესაძლებელია მივაღწიოთ იმავე ფუნქციონირებას, რომელიც მიღწეულია ახალი პროექტის მიერ ხელით დამუშავებული ჩონჩხის მოძრაობის მონაცემების მკაცრი ანალიზით. ეს რომ გაკეთებულიყო, სავარაუდოა, რომ ახალ პროექტს შეიძლება ჰქონდეს უფრო ღრმა ხედვა იმის შესახებ, თუ რომელი მოძრაობის მახასიათებლები საუკეთესოდ განსაზღვრავს გენდერს. თუმცა, ასეთი მიდგომა ნიშნავს რესურსების დიდ ვალდებულებას და მკვლევარებმა სანაცვლოდ გამოიყენეს არსებული (ნაკლებად გამძლე) სისტემები საჭირო ეტიკეტების შესაქმნელად.

ეს „ფსევდო-ეტიკეტები“ არ გვთავაზობს გენდერზე დაფუძნებული სიარულის ნიშან-თვისებებს, მაგრამ შესაძლებელს ხდის სიარულის ნიმუშების გაფილტვრას სქესის მიხედვით უაღრესად განზოგადებული გზით, რაც შეიძლება მიღწეული იყოს რესურსების შეზღუდვის ფარგლებში.

თავდაპირველად მკვლევარებმა გამოიყენეს 2019წ წინა ხედის სიარული (FVG) მონაცემთა ნაკრები, რომელიც მიმართავს სიარულის ამოცნობის გამოწვევას შუბლის კუთხიდან, რომელიც გვთავაზობს ნაკლებ მინიშნებებს, ვიდრე გვერდითი ხედები. მონაცემთა ნაკრები შეიცავს სასეირნო ნიმუშებს მრავალი დაბრკოლებით, როგორიცაა სიარულის სიჩქარის განსხვავებული სისწრაფე, არეულ-დარეული ფონი, განსხვავებული გარჩევადობა და ტანსაცმლის განსხვავება.

2019 წლის FVG ქაღალდიდან GaitNet ავტომატურად სწავლობს სიარულის აუცილებელ მახასიათებლებს „სიარული ვიდეოდან“, წინა ხედვის კადრებზე დაყრდნობით, ხშირი ნახვის სცენარი საჯარო კამერებში. წყარო: https://arxiv.org/pdf/1904.04925.pdf

2019 წლის FVG ქაღალდიდან GaitNet ავტომატურად სწავლობს სიარულის აუცილებელ მახასიათებლებს „სიარული ვიდეოდან“, წინა ხედვის კადრებზე დაყრდნობით, ხშირი ნახვის სცენარი საჯარო კამერებში. წყარო: https://arxiv.org/pdf/1904.04925.pdf

ვინაიდან FVG არ არის ორიენტირებული გენდერულ იდენტიფიკაციაზე, ავტორებმა ხელით მოახდინეს ანოტირება მონაცემთა ნაკრებში 226 სუბიექტის გენდერული ინფორმაციით, რათა განევითარებინათ საფუძვლიანი სიმართლე ჩარჩოსთვის.

სახის ამოცნობას ხელი შეუწყო MTCNN-ის საშუალებით და დემოგრაფიული ატრიბუტები განისაზღვრა IMDB-WIKI-ით მონაცემთა ბაზა. ვინაიდან სიარულის ანალიზი პოტენციურად ბევრად უფრო ეფექტურია შორ მანძილზე, ვიდრე სახეზე დაფუძნებული დასკვნა, საბოლოო ეტიკეტები მიღებულ იქნა გენდერული ნდობის საშუალო შეწონილით, რომელიც მიღებული იყო სახის შემოსაზღვრული ყუთის ფართობიდან ჩარჩოს ზომებთან მიმართებაში. ჩონჩხები ამოიღეს AlphaPose, რომელიც შლის ნებისმიერ პოტენციურ „გაჩუქებას“, როგორიცაა სუბიექტის ობიექტური სიმაღლე (რომელიც არ შეიძლება შეფასდეს კონკრეტულად ad hoc საჯარო კამერის სცენარებში).

ტესტირება

სისტემა გამოცდილი იყო წინააღმდეგ CASIA-B სიარულის მონაცემთა ბაზა, მონაცემთა ნაკრებში ზედმეტად წარმოდგენილი მამრობითი სქესის ნიმუშების შერჩევა, რათა უზრუნველყოფილი იყოს ტესტირების თანასწორობა, მონაცემების გაყოფა 80% ტრენინგისთვის და 20% ვალიდაციისთვის.

მკვლევარებმა გამოიყენეს საკუთარი წინა სამუშაო, ა WildGait ქსელი (იხილეთ სურათი ქვემოთ), რათა გამოვთვალოთ მსგავსება სიარულის თანმიმდევრობებს შორის. გენდერული პირადობის მოწმობები, რომლებიც უკვე შეიქმნა, ახლა უკვე ეფექტიანად არის გადაყვანილი ჩარჩო პროცესის ამ ეტაპზე.

WildGait არის სივრცე-დროებითი გრაფიკის კონვოლუციური ქსელი, რომელიც გაწვრთნილია მაღალი მოცულობის, ავტომატურად ანოტირებული ჩონჩხის თანმიმდევრობებზე, რომლებიც მიღებულია რეალური სამყაროს, სათვალთვალო ნაკადებიდან. წყარო: https://arxiv.org/pdf/2105.05528.pdf

WildGait არის სივრცე-დროებითი გრაფიკის კონვოლუციური ქსელი, რომელიც გაწვრთნილია მაღალი მოცულობის, ავტომატურად ანოტირებული ჩონჩხის თანმიმდევრობებზე, რომლებიც მიღებულია რეალური სამყაროს, სათვალთვალო ნაკადებიდან. წყარო: https://arxiv.org/pdf/2105.05528.pdf

დასასრულს, ავტორები აცხადებენ, რომ სისტემა ემთხვევა თანამედროვე სახეზე დაფუძნებულ სისტემებს სქესის განსაზღვრის სიზუსტით. იმის გამო, რომ ამდენი შესაძლო კუთხეა, რაც შეიძლება გამოჩნდეს წყაროზე სიარულის ვიდეოში, შედეგები ნაწილდება ამ შესაძლო ხედვის დიაპაზონში: