Podle nové studie mají všechny indoevropské jazyky svůj původ v dnešním Turecku

Podle nové studie, založené na výpočetní fylogenetice, pochází všechny dnešní indoevropské jazyky z jednoho prastarého jazyka, kterým mluvili dávní zemědělci před 8 000 až 9 000 lety v turecké Anatolii

24.02.2024 - Martin Reichman



Přibližně polovina všech lidí na světě dnes mluví některým z rodiny indoevropských jazyků, jehož původ sahá tisíce let do minulosti. Z původního mateřského prajazyka se postupem času vyvinula angličtina, ruština, hindština, latina nebo třeba sanskrt.

Během posledních několika set let lingvisté o tomto prvním indoevropském jazyce zjistili mnohé, podařilo se jim identifikovat mnoho slov, která používal, a odhalili i některá gramatická pravidla, jimiž se řídil. Zároveň přišli s řadou teorií, kdo byli jeho původní mluvčí, kde a jak žili a jak se jejich jazyk rozšířil.

Ukrajinští pastevci, nebo turečtí zemědělci?

Většina lingvistů se dnes domnívá, že prvními mluvčími tohoto praindoevropaského jazyka byli kočovní pastevci, kteří žili ve stepích Ukrajiny a jihozápadního Ruska před zhruba 6 000 lety. Podle alternativní teorie sahá jeho původ o 2 000 až 3 000 let hlouběji do minulosti do komunity zemědělců v Anatolii, v oblasti dnešního Turecka.

Podle lingvistů se původní jazyk, označovaný jako protoindoevropština, rozdělil na 10 nebo 11 hlavních větví, z nichž dvě později zanikly. Z italické větve tak vznikla latina a románské jazyky, jako je francouzština, španělština a italština; z germánské větve se vyvinuly němčina, nizozemština a angličtina a z indoíránské větve vznikly hindština, bengálština, perština a kurdština.

Nová analýza, která využívá techniky vypůjčené z evoluční biologie, se přiklání spíše k teorii „anatolských zemědělců“, i když i prostředí ukrajinských stepí hrálo podle vědců důležitou roli.

Ve studii, publikované v odborném časopisu Annual Review of Linguistics, se vědci pokusili o kvantitativnější přístup k rekonstrukci historie indoevropštiny. Vypůjčili si techniku, která se často používá v biologii k sestavování evolučních stromů na základě měřitelných znaků. Jejich přístup, nazývaný výpočetní fylogenetika, považuje jazyky za vyvíjející se systémy podobné biologickým organismům. Místo sledování změn v DNA, jak to dělá výpočetní fylogenetika v biologii, se vědci zaměřili na změny slov.

Radiokarbonové datování jazyka

Většina analýz se zaměřuje na vzorce slov, která v různých jazycích znamenají totéž a která lze vysledovat ke stejnému praindoevropskému kořenu. Čím více jsou si tyto vzory podobné, tím více jsou si jazyky obecně považovány za příbuzné. Výsledkem podobných analýz jsou známé jazykové stromy.

Také výpočetní fylogenetika pracuje s jazykovými stromy, metoda se ale řídí přísnými algoritmy a explicitně stanovenými pravidly. Počítačový program v podstatě pracuje tak, že nakreslí jazykový strom a odhadne pravděpodobnost jeho přesnosti vzhledem ke všem údajům a předpokladům. Poté program provede v tomto stromu jednu změnu a porovná výsledky, přičemž zachová jen strom s nejvyšší mírou přesnosti. Tento proces se opakuje, někdy i milionkrát, a výsledkem je soubor jazykového stromu (či stromů) s nejvyšší mírou příbuzenské přesnosti.

Aby bylo možné odhadnout časový průběh – kdy konkrétní jazyky vznikly a kdy se od sebe oddělily, poskytují vědci počítačovému programu také data, kdy podle nich různé jazyky existovaly, a to na základě nejlepších odhadů odborníků. Například latina existovala asi před 2 050 lety, staroislandština asi před 800 lety a mykénská řečtina asi před 3 350 lety. Počítačový program používá tato data jako kotvy k vytvoření svých časových odhadů, včetně data konečného vzniku indoevropštiny. Výsledky lze zkombinovat s historickými záznamy o místech, kde se danými jazyky mluvilo, a určit tak pravděpodobnou mapu jejich geografického rozšíření. Výsledná data lze dále kombinovat s archeologickými nálezy nebo studiem starověké lidské DNA.

Přesné výpočty z nepřesných dat

Hlavním problémem podobných – na první pohled poměrně sofistikovaných analýz – jsou vstupní data. Dvě studie z let 2012 a 2015 například dospěly na základě výpočetní fylogenetiky k velmi odlišným výsledkům. V prvním případě výsledky naznačovaly, že původ indoevropštiny sahá zhruba 9 000 let do Anatolie, v druhém případě 6 000 let do minulosti v ukrajinských stepích. Jak mohly podobně koncipované výpočty dojít k tak rozdílným závěrům?

Podle peruánského lingvisty a historika Paula Heggartyho byly v jednom případě do analýzy zahrnuty i synonyma, což výsledky nepřiměřeně zkreslovalo. Pro svůj výzkum proto sestavil zcela novou sadu vstupních dat. Společně se svými kolegy vybral 170 základních významů, které chtěl sledovat. Šlo o základní slova, jako jsou výrazy pro počítání čísel, části těla, barvy, nebo třeba označení pro dům, horu, smích a noc, která by si podle jeho názoru měly jazyky uchovat.

Výsledný seznam poté předložili více než 80 lingvistům a nechali je určit pro každý ze 161 indoevropských jazyků základní slovo pro každý pojem. Do analýzy bylo zahrnuto pouze toto slovo, a nikoliv jeho případná synonyma.

Když Heggartyho tým znovu prohnal nový seznam počítačovou analýzou, potvrdily se dřívější závěry „zemědělského původu“ praindoevropského jazyka, které udávaly jeho původ do Anatolie před přibližně 8 000 lety. Odtud se některé větve jazyka přesunuly na východ a daly vzniknout perštině a hindštině, jiné větve se posunuly na západ, kde se z nich postupem času vyvinula řečtina nebo albánština.

Analýza ale přiznává, že ukrajinské a ruské stepi hrály důležitou roli coby sekundární domovina většiny evropských jazyků: Na cestě jedné větve z Anatolie na sever se právě odtud praindoevropština měla rozšířit do severní Evropy a dát vzniknout germánským, italickým, galským a dalším evropským jazykům.

Tradiční anglické sushi

Ne všichni odborníci se ale se závěry Paula Heggartyho ztotožňují a velké výhrady zaznívají také k samotné výpočetní fylogenetice. Studie podle nich staví na slovní zásobě a ignoruje zvukovou stránku slov, jejich strukturu, kmeny, předpony a přípony, z nichž se slovo skládá. Podle řady kritiků neposkytují významy slov samy o sobě dostatek informací pro vyvození pevných závěrů, bez ohledu na to, o jak sofistikovaný výpočet jde.

Thomas Olander, historický lingvista z Kodaňské univerzity, například poukazuje na skutečnost, že jazyky si neustále půjčují slova jeden od druhého. Samotný fakt, že dva jazyky mají společná slova, tedy podle něj neznamená, že tyto jazyky mají stejný původ. Skutečnost, že Angličané dnes používají slovo „sushi“, přece podle Olandera neznamená, že angličtina a japonština jsou příbuzné jazyky.

Heggartyho jazykový strom má podle Olandera i další sporná místa. Ukazuje například keltské jazyky jako blízce příbuzné germánským jazykům. Většina historických lingvistů se ale domnívá, že keltské jazyky jsou mnohem blíže příbuzné s italickými jazyky než s těmi germánskými. Podle dánského lingvisty je mnohem pravděpodobnější, že keltská a germánská větev spolu dlouho úzce koexistovaly a vzájemně si půjčovaly slova. Analýza založená pouze na společných významech slov je podle něj nesprávně vykresluje jako příbuznější, než ve skutečnosti jsou.

Minimálně v jedné věci se ale zastánci i odpůrci výpočetní fylogenetiky vzácně shodují. Podle vědců přináší tato metoda zajímavé informace, které mohou významně přispět k poznání historie jazyků. Otevřenou otázkou ale je, zda má být jediným a nezpochybnitelným argumentem.


Další články v sekci