Kontakt z nami

Robotyka

Badania wykazały, że ludzie wolą wchodzić w interakcję z robotami przypominającymi ludzi

Opublikowany

 on

Naukowcy z Tokijskiego Instytutu Technologii i Riken w Japonii uzyskali nowy wgląd w to, jak postrzegamy głos różnych maszyn i wchodzimy w interakcję z nimi. Zespół przeprowadził metasyntezę i ich wyniki Ustalenia dostarczają nowych informacji na temat ludzkich preferencji, które inżynierowie i projektanci mogą wykorzystać do opracowania przyszłych technologii głosowych. 

Ludzie komunikują się przede wszystkim głosem i słuchem, przekazując wszystko, od informacji językowych po stany emocjonalne i osobowości. Postrzeganie naszego głosu w dużej mierze zależy od tonu, rytmu i wysokości.

Łączenie różnych pól w celu utworzenia struktury

Dzięki postępowi technologii sztucznej inteligencji nasze interakcje rozszerzają się obecnie na agentów komputerowych, interfejsy i środowiska. Badania często prowadzone są w dziedzinach interakcji człowiek-agent (HAI), interakcji człowiek-robot (HRI), interakcji człowiek-komputer (HCI) i komunikacji człowiek-maszyna (HMC). 

Zespół naukowców starał się porównać wyniki kilku badań z różnych dziedzin, chcąc stworzyć ramy, które będą wyznaczać kierunki przyszłego projektowania i badań nad głosem komputerowym. 

Głównym badaczem była profesor nadzwyczajna Katie Seaborn z Tokyo Tech. 

„Asystenci głosowi, inteligentne głośniki, pojazdy, które mogą z nami rozmawiać, i roboty społeczne już tu są” – mówi prof. Seaborn. „Musimy wiedzieć, jak najlepiej zaprojektować te technologie, aby z nami współpracowały, żyły z nami i odpowiadały naszym potrzebom i pragnieniom. Musimy także wiedzieć, jak wpłynęły one na nasze postawy i zachowania, zwłaszcza w subtelny i niezauważalny sposób”.

W ankiecie przeprowadzonej przez zespół uwzględniono recenzowane artykuły w czasopismach naukowych oraz artykuły konferencyjne oparte na materiałach konferencyjnych, ze szczególnym uwzględnieniem postrzegania głosu agenta przez użytkownika. Materiały źródłowe obejmowały różnorodne typy i technologie agentów, interfejsów i środowisk, z których większość to „bezcielesne” głosy komputerowe, agenci komputerowi i roboty społeczne. 

Większość użytkowników stanowili studenci i dorośli, a badacze byli w stanie obserwować i mapować wzorce, zanim wyciągnęli wnioski na temat postrzegania głosu agenta w różnych kontekstach interakcji. 

Ustalenia zespołu

Wyniki badania wykazały, że użytkownicy antropomorfizowali agentów, z którymi wchodzili w interakcję, i preferowali interakcje z agentami podobnymi do ich osobowości i stylu mówienia. Badanie wykazało również, że preferowano głosy ludzkie od syntetycznych, a interakcję poprawiono poprzez dodanie wypełniaczy wokalnych. 

Z badania wynika, że ​​ludzie preferowali ludzkie, radosne i empatyczne głosy o wyższej tonacji. Jednak niektóre preferencje użytkowników zmieniły się z biegiem czasu. Na przykład preferencje użytkownika dotyczące płci głosu zostały zmienione z głosów męskich na głosy żeńskie. 

Naukowcy wykorzystali te ustalenia i stworzyli ogólne ramy umożliwiające klasyfikację różnych typów interakcji w technologiach komputerowych. 

Kolejnym odkryciem było to, że użytkownicy często lepiej postrzegali agentów, gdy agenci byli wcieleni, a głos „pasował” do ciała agencji. 

Ankieta przeprowadzona przez zespół może zostać wykorzystana do stworzenia nowych i istniejących technologii opartych na głosie interakcji człowiek-agent (vHAI). 

„Oczekuje się, że program badawczy powstały w wyniku tych prac wytyczy kierunki rozwoju i badania agentów głosowych, interfejsów, systemów, przestrzeni i doświadczeń w nadchodzących latach” – mówi prof. Seaborn.

 

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją badającym najnowsze osiągnięcia w dziedzinie sztucznej inteligencji. Współpracował z wieloma startupami i publikacjami AI na całym świecie.