Connect with us

Jak Googleův AI odemyká tajemství komunikace delfínů

Umělá inteligence

Jak Googleův AI odemyká tajemství komunikace delfínů

mm

Delfíni jsou známí svou inteligencí, složitým sociálním chováním a intrikátními komunikačními systémy. Během let byli vědci a milovníci zvířat fascinováni myšlenkou, zda delfíni mají jazyk podobný lidskému. V posledních letech umělá inteligence (AI) otevřela nové možnosti pro zkoumání této otázky. Jedním z nejvíce inovativních vývojů v tomto oboru je spolupráce mezi Google a Wild Dolphin Project (WDP) na vytvoření DolphinGemma, modelu AI navrženého pro analýzu delfíních vokalizací. Tento průlom by mohl nejen pomoci dešifrovat delfínovu komunikaci, ale také potenciálně otevřít cestu pro dvoucestné interakce s těmito pozoruhodnými tvory.

Role AI při porozumění delfíním zvukům

Delfíni komunikují pomocí kombinace kliknutí, pískání a pohybů těla. Tyto zvuky se liší v frekvenci a intenzitě, které mohou signalizovat různé zprávy v závislosti na sociálním kontextu, jako je hledání potravy, páření nebo interakce s ostatními. Navzdory letům studia se ukázalo, že porozumění plnému rozsahu těchto signálů je obtížné. Tradiční metody pozorování a analýzy se potýkají s obrovským množstvím dat generovaných delfínovými vokalizacemi, což činí obtížné získat přehled.

AI pomáhá překonat tuto výzvu pomocí algoritmů strojového učení a zpracování přirozeného jazyka (NLP) pro analýzu velkých objemů dat o delfíních zvucích. Tyto modely mohou identifikovat vzory a spojení ve vokalizacích, které jsou za hranicemi lidského sluchu. AI může rozlišovat mezi různými typy delfíních zvuků, klasifikovat je na základě charakteristik a spojovat určité zvuky s konkrétními chováním nebo emocionálními stavy. Například výzkumníci si všimli, že určitá pískání se zdají být spojena se sociálními interakcemi, zatímco kliknutí jsou obvykle spojena s navigací nebo echolokací.

Zatímco AI má velký potenciál v dešifrování delfíních zvuků, sběr a zpracování velkých objemů dat z delfíních skupin a školení modelů AI na takovém velkém datasetu zůstávají významnými výzvami. Aby se tyto výzvy řešily, Google a WDP vyvinuli DolphinGemma, model AI speciálně navržen pro analýzu delfínové komunikace. Model je školen na rozsáhlých datech a může detekovat komplexní vzory v delfínových vokalizacích.

Porozumění DolphinGemma

DolphinGemma je postaven na Google’s Gemma, open-source generativních modelů AI s kolem 400 miliony parametrů. DolphinGemma je navržen tak, aby se naučil strukturu delfínových vokalizací a generoval nové, delfínové zvukové sekvence. Vyvinut ve spolupráci s WDP a Georgia Tech, model používá dataset atlantských skvrnitých delfínů, který byl shromážděn od roku 1985. Model využívá Google’s SoundStream technologii k tokenizaci těchto zvuků, což mu umožňuje předpovědět další zvuk v sekvenci. Stejně jako jazykové modely generují text, DolphinGemma předpovídá zvuky, které by delfíni mohli udělat, což mu pomáhá identifikovat vzory, které by mohly reprezentovat gramatiku nebo syntaxi v delfínové komunikaci.

Tento model může dokonce generovat nové, delfínové zvuky, podobně jako prediktivní text navrhuje další slovo ve větě. Tato schopnost by mohla pomoci identifikovat pravidla, která řídí delfínovu komunikaci, a poskytnout přehled o porozumění, zda jejich vokalizace tvoří strukturovaný jazyk.

DolphinGemma v akci

To, co dělá DolphinGemma zvláště účinným, je jeho schopnost běžet na zařízeních, jako jsou telefony Google Pixel, v reálném čase. Díky své lehké architektuře může model fungovat bez potřeby drahého, specializovaného vybavení. Výzkumníci mohou zaznamenat delfínové zvuky přímo na svých telefonech a okamžitě je analyzovat pomocí DolphinGemma. To činí technologii více přístupnou a pomáhá snižovat náklady na výzkum.

Kromě toho je DolphinGemma integrován do CHAT (Cetacean Hearing Augmentation Telemetry) systému, který umožňuje výzkumníkům přehrávat syntetické, delfínové zvuky a pozorovat reakce. To by mohlo vést k vývoji sdílené slovní zásoby tím, že umožní dvoucestnou komunikaci mezi delfíny a lidmi.

Širší implikace a Googleův budoucí plán

Vývoj DolphinGemma je významný nejen pro porozumění delfínové komunikaci, ale také pro rozvoj studia zvířecí kognice a komunikace. Dekódováním delfínových vokalizací mohou výzkumníci získat hlubší přehled o delfínových sociálních strukturách, prioritách a myšlenkových procesech. To by mohlo nejen zlepšit úsilí o konzervaci tím, že by se porozumělo potřebám a obavám delfínů, ale také má potenciál rozšířit naše znalosti o zvířecí inteligenci a vědomí.

DolphinGemma je součástí širšího hnutí, které využívá AI k prozkoumání zvířecí komunikace, s podobnými úsilími, která jsou na cestě pro druhy, jako jsou havrani, velryby a surikaty. Google plánuje uvolnit DolphinGemma jako otevřený model pro výzkumnou komunitu v létě 2025, s cílem rozšířit jeho aplikaci na další druhy cetaceánů, jako jsou delfíni nebo delfíni skokani, prostřednictvím dalšího jemného ladění. Tento otevřený přístup bude podporovat globální spolupráci ve výzkumu zvířecí komunikace. Google také plánuje otestovat model v terénu během nadcházející sezóny, což by mohlo dále rozšířit naše porozumění atlantským delfínům.

Výzvy a vědecká skepse

Navzdory svému potenciálu DolphinGemma také čelí několika výzvám. Oceánské záznamy jsou často ovlivněny pozadím, což činí analýzu zvuku obtížnou. Thad Starner z Georgia Tech, výzkumník zapojený do tohoto projektu, upozorňuje, že většina dat zahrnuje okolní oceánské zvuky, vyžadující pokročilé filtrační techniky. Někteří výzkumníci také zpochybňují, zda delfínová komunikace může být skutečně považována za jazyk. Například Arik Kershenbaum, zoolog, naznačuje, že na rozdíl od komplexní povahy lidského jazyka mohou delfínové vokalizace být jednodušší systémem signálů. Thea Taylor, ředitelka Sussex Dolphin Project, vyjadřuje obavy o riziko neúmyslného trénování delfínů, aby napodobovali zvuky. Tyto perspektivy zdůrazňují potřebu přísné validace a pečlivého výkladu AI-generovaných přehledů.

Závěrečné shrnutí

Googleův výzkum AI v oblasti delfínové komunikace je průlomovým úsilím, které nás přivádí blíže k porozumění složitým způsobům, jakými delfíni interagují s ostatními a se svým okolím. Díky umělé inteligenci výzkumníci detekují skryté vzory v delfínových zvucích, nabízejí nové přehledy do jejich komunikačních systémů. Zatímco výzvy zůstávají, pokrok, kterého bylo dosaženo, zdůrazňuje potenciál AI ve studiích zvířecího chování. Jak se tento výzkum vyvíjí, mohl by otevřít dveře k novým příležitostem v oblasti konzervace, studií zvířecí kognice a interakce mezi lidmi a zvířaty.

Dr. Tehseen Zia je docent s trvalým úvazkem na COMSATS University Islamabad, držitel titulu PhD v oblasti AI z Vienna University of Technology, Rakousko. Specializuje se na umělou inteligenci, strojové učení, datové vědy a počítačové vidění, a významně přispěl publikacemi v renomovaných vědeckých časopisech. Dr. Tehseen také vedl různé průmyslové projekty jako hlavní výzkumník a působil jako konzultant pro umělou inteligenci.