Kočky mají co říct: Jak daleko jsme od skutečného překladače z kočičí řeči?
Díky umělé inteligenci začínáme rozumět nejen kočičímu mňoukání, ale i tomu, co se nám naši chlupatí společníci snaží říct. Dočkáme se někdy skutečného kočičího překladače?
Mňoukání, vrnění, vrčení, syčení... Kočičí jazyk je bohatší, než jsme si kdy mysleli. A právě díky umělé inteligenci se vědci začínají přibližovat překladu této dávné, 12 000 let trvající konverzace mezi kočkami a lidmi.
Když kočky mluví
Domácí kočka (Felis catus) je daleko „upovídanější“ než její divocí příbuzní. Etologové (vědci zabývající se chováním zvířat) rozdělili kočičí zvuky do více než 20 kategorií – od známého mňoukání přes vrnění, syčení, trylkování až po kvílení a kňourání. Pochopitelně ani mňoukání není univerzální – spadá pod něj celá škála různých významů a emocí.
Kromě zvuků mluví kočky i svým tělem – zvednutý ocas značí radost, přimhouřené oči klid a pomalé mrknutí mírumilovné gesto. V průběhu domestikace si kočky vytvořily unikátní „slovník“ speciálně určený k tomu, aby mohly komunikovat s lidmi. A jak se ukazuje, je mnohem bohatší, než jsme si dosud mysleli.
Čínská firma Baidu v roce 2023 přihlásila patent na systém, který by dokázal převést zvířecí zvuky do lidského jazyka. Nejde ale jen o samotné zvuky – systém má analyzovat i pohyby (například mávnutí ocasem), tělesné znaky jako srdeční tep či teplotu, a vše sloučit do srozumitelné věty jako „Naplň misku, prosím.“
Zákoutí kočičštiny
Myšlenka „kočičího překladače“ rozhodně není nová. Už v 70. letech se britský vědec John Bradshaw zabýval tím, jak kočky používají mňoukání k ovlivnění lidí. Zjistil například, že dospělé kočky mňoukají především na člověka, nikoliv na sebe navzájem – jako by to byl komunikační nástroj vyhrazený pro mezidruhový kontakt.
První zlom přišel v roce 2018, kdy vědec Yagya Raj Pandeya vytvořil databázi 3 000 nahrávek kočičích zvuků rozdělených do deseti kategorií. Pomocí softwaru, který analyzuje hudbu, se mu podařilo přiřadit jednotlivým zvukům „akustický otisk“. Výsledek? Systém dokázal správně rozpoznat typ zvuku v 91 % případů.
V roce 2019 pak italští vědci rozlišili tři typy mňoukání podle situace: před krmením, v cizím prostředí a při česání. Zjistili, že zvuk „dejte mi najíst“ má odlišný tvar od „kde jsi?“ nebo „česej mě“. Výzkum dosáhl úspěšnosti až 96 % při rozpoznávání významu, a stal se základem pro vznik mobilní aplikace MeowTalk.
Aplikace MeowTalk, kterou vyvinula společnost Akvelon, využívá strojové učení a tisíce uživatelských nahrávek. Umožňuje přeložit mňoukání na fráze jako „mám hlad“, „je mi dobře“, „něco mě bolí“ nebo „pozor, útočím“. Přesnost podle vývojářů dosahuje kolem 90 %, z uživatelských reakcí je ale patrné, že systém má ještě značné mezery. Vše funguje na principu spektrogramu – vizuálního záznamu zvuku. Umělá inteligence s ním pracuje podobně jako s fotografiemi: rozpoznává tvary, vzorce a barvy, podobně jako třeba programy pro rozpoznávání tváří. Snadno tak může dojít k tomu, že vzorec sice přesně odpovídá, samotné sdělení může být ale zcela odlišné.
Letos v květnu publikoval vývojář Vlad Reznikov systém Feline Glossary Classification 2.3, který rozlišuje až 40 typů zvuků rozdělených do pěti skupin podle chování (např. bolest, radost, hlad). Model dosáhl více než 95% úspěšnosti v reálném čase, byť zatím neprošel nezávislým recenzním řízením. Pokud v něm obstojí, mohl by přinést kýžený průlom v kočičí komunikaci.