K latině a k matice se musí dozrát

Kolik mají společného prezidentští kandidáti, matematika, latina a český jazyk? Michal Místecký z katedry českého jazyka tvrdí, že mnoho. Patří k těm lidem, kteří vidí souvislosti mezi zdánlivě neslučitelnými obory. On sám se zabývá kvantitativní lingvistikou, která je založená jak na znalosti jazyků, tak matematiky. Dokáže do detailu rozebrat traktáty středověkých filozofů, texty skupiny Kryštof nebo projevy prezidentských kandidátů. Sám o sobě totiž mluví jako o žoldákovi, který nabízí vědeckou metodu aplikovatelnou téměř na cokoli.

Kde všude lze kvantitativní lingvistiku uplatnit?

Na základě kvantitativní analýzy lze vysledovat mnoho jevů – slovní bohatství, využívání sloves, žánrové rozdíly, ornamentalitu, analýzou lze určit autorství, věrnost překladu a další. Kvantitativní lingvistika je metoda, která má podle mého názoru využití v mnoha oblastech, ideální je například pedagogika, nově se ukazuje, že by se dala využít také v lékařství. Pro mě se jeví jako nejzajímavější výzkum týkající se mezí jazyka, například u lidí trpících schizofrenií nebo Alzheimerovou chorobou. My víme, že u projevů Alzheimerovy nemoci se u lidí snižuje slovní zásoba, díky naší metodě lze už velmi brzy zjistit, že křivka slovního bohatství klesá. Něco podobného lze vysledovat u projevů schizofrenie, kdy pacient postupně začne používat takzvaný „slovní salát“. To je terminus technicus, který laicky řečeno znamená, že člověk už plácá nesmysly, ale neví o tom, a to je právě ten okamžik, kdy přestává vnímat. Bohužel v tuto chvíli se ale pohybujeme ve velmi teoretické rovině, protože nemáme k dispozici vzorky, s nimiž bychom mohli pracovat. Je obtížné dostat se k pacientům a jejich textům, neboť se jedná o citlivou oblast. Je to ale jedna z možností výzkumu.

Ještě mě napadá, že by mohla být přínosná třeba pro marketing nebo public relations?

Samozřejmě pro veškerý marketing, kde se pracuje s jazykem. Prezidentští kandidáti mají své poradce, ale ti jim poradí spíše obecné věci. Ve spolupráci s kvantitativním lingvistou jim však mohou přesně říct, která slova jsou hůře přijímána veřejností nebo jaká témata se nejčastěji vyskytují u vybraných osob či skupin. Uvedu příklad prezidentských kandidátů, kdy je Český rozhlas požádal, aby napsali návrh novoročního projevu, jako by už byli prezidenty. Od kandidátů dostali texty, které lze krásně porovnat. Například Michal Horáček neměl jediné tematické slovo, stále se točil kolem různých témat, ale velmi nekonkrétně, zatímco Topolánek byl velmi konkrétní, hodně hovořil o sněmovně a volbách. Z toho lze krásně vysledovat, na co a na koho kandidáti cílili, popřípadě, že necílili na nic a na nikoho. Dokážeme také zkoumat kolokace, což je docela atraktivní pro veřejnost, protože zkoumáme, s čím se spojují (tzv. kolokují) různá slova. Například slovo „prezident“ nejvíce kolokuje se spojkou „i“. To znamená, že věta „jsem slušný a dobrý člověk a budu jím i jako prezident“ nám predikuje, že kandidát má za sebou nějakou důvěryhodnou minulost a bude důvěryhodný i nadále ve funkci prezidenta.

Není to spíše o zkušenosti? Zkušený marketér, posluchač či čtenář pozná slabiny a nedostatky textu.

Něco pozná a něco ne. Záleží na množství textu. Ve velkém objemu to už nepoznáte, opíráte se spíše o představu, dohad. Román je natolik rozsáhlý, že lidský mozek ho nedokáže kvantitativně obsáhnout a nelze vynášet soudy na základě intuice. Například i Macharova báseň Sonet o lásce není o lásce, ale je o očním kontaktu. Po analýze zjistíme, že oko exponuje, neustále se tam nějakým způsobem objevuje. Při kvantitativní analýze se dá ale například poměřit i věrnost a přesnost překladu, a to i u básnických forem. Během jednoho mého výzkumu se ukázalo, že některé české překlady často ani rámcově nedodržují formu. Kdekoli, kde se objevují nějaké texty, můžete použít tuto metodu, ale pak nastupuje matematika a interpretace, která je na celé metodě nejobtížnější. Musíte chápat, co počítáte a co sledujete, a nikdy nesmíte ztratit kontakt s původním textem.

Kde metodu kvantitativní lingvistiky nejvíce uplatňujete?

Já se nazývám žoldákem. Umím metodu, kterou propůjčuji do služeb různých vědeckých oborů a v podstatě jsem velmi často v něčích službách. Většinou vytvářím literárněvědné analýzy, které mě i nejvíce baví, zejména poezie, ale zabývám se i autorstvím, což je někdy doslova peklo, jedná-li se o středověké autory, kteří od sebe běžně opisovali, plagiátorství nebyl v minulosti problém, spíše projev vzdělanosti. V 19. století je už situace naprosto odlišná, zde se nám už krásně shlukují Nerudovy spisy, Němcové spisy a třeba Sládkovy, tito autoři tvoří naprosto samostatné větve, použiju-li odbornou terminologii. U středověkých autorů se musíte velmi snažit, abyste vůbec tyto shluky nalezli.

Podle čeho poznáte autora nějakého textu a jakou máte jistotu?

Díky naší metodě se ukazuje jedna důležitá věc, která je pro literární vědu poměrně šokantní, a to že náš styl stojí na synsémantických slovech. To znamená na předložkách a spojkách, jejichž užívání nedovedeme příliš ovlivnit, podobně jako v mluveném projevu se nám velmi těžko kontrolují slova „jako“, „vlastně“, „takže“ a další. A právě tato slova nás určují. Autorství se určuje podle sta nejčastějších slov, která jsou pro každého autora poměrně typická.

Proč jste si vybral pro svou seminární práci zrovna analýzu textů skupiny Kryštof?

Vybral jsem si je, protože je mám rád a chtěl jsem vědět, proč si fanoušci stěžují na poslední alba. Tvrdí, že jsou plytká, jiná, já jsem se chtěl dopátrat proč. Věděl jsem, že pokud se změna stala v textu, tak to zjistím. Pokud se stala v hudbě, tak to nezjistím. Jejich poezie je založená na přívlastcích a právě ty v posledních albech velmi ustupují do pozadí a prosazuje se dějovost. A to je jev, který posluchači vnímají, ale nedokáží ho pojmenovat a já ho pojmenuju.

Má to smysl, kvantitativně hodnotit či analyzovat umělecký text?

Jde o to, že já nabízím metodu, a lidé s ní nějak nakládají. Sledujeme různé cíle. Určujeme autorství u literatury, nebo se snažíme prokázat, že něco není tak, jak se celou dobu tvrdilo. Zkoumáme ale jenom věci, které jsou měřitelné, to znamená, že nezkoumáme, jestli se to líbí nebo ne, ale proč například čtenáři tvrdí, že se něco změnilo a už se jim to nelíbí. Hledám příčiny změny. Nelze vyzkoumat například, kdo psal lépe. Jak lépe? Já mohu spočítat ornamentalitu, slovní bohatost, ale „jak lépe“, to opravdu nelze.

Literáti také těžko přijímají fakt, že my pracujeme s množstvím. Zatímco literáti označují za erbovní slovo to podstatné, byť se v textu vyskytuje jen jednou, my pracujeme s četností. Pro nás je erbovní slovo to nejčetnější, plnovýznamové. My jsme ale lingvisté, nikoli kulturní vědci. V našem případě je to opodstatnitelné. Já potřebuji množství textů, abych z toho něco validního vyvodil. Jeden náš oponent nazval naši metodu fyzikalismem, a to není špatný pojem. Máte nějaký jev, což je v našem případě text, a rozdělíme ho na různé veličiny – slovní bohatství, slabiky atd., zkrátka vezmeme veličinu a zkoumáme ji. Z toho důvodu máme s literáty někdy spory, jim se naše metoda nelíbí a já to do jisté míry chápu, protože máme odlišný způsob uvažování. Literát říká: Já si nespočítám, že Macharova báseň je o oku. Ona je symbolická. Já mám ale nějakou metodu, která je exaktní, a je pak na interpretaci, jak a pro co ji použiju. Nemůžu ale stavět jen na intuici.

A tady začíná prostor pro matematiku?

My pracujeme s poměrně jednoduchou matematikou. Stále se mi však stává, že dělám numerické chyby při počítání, ale dnes využíváme převážně software, který toho hodně spočítá za nás. My však musíme chápat, co, jak a proč chceme počítat, a to je na celé metodě vlastně to nejtěžší. Je pravdou, že v humanitních vědách se jedná o velmi neobvyklý způsob práce. Většinou je obecná představa, že vědec v oboru humanitních věd tráví čas zahloubaný v archivu. Mnohé naše studenty právě matematika odrazuje, nemáme zatím mnoho těch, kteří by se kvantitativní lingvistice chtěli věnovat.

Je to ještě vůbec humanitní věda?

Problém je v tom, co se od nás vlastně očekává. Exaktnost je jedna věc, ale přírodní vědy nemají větší validitu než humanitní, oni mají jen perfektně propracované metrické nástroje. Můj názor je ten, že my nejsme schopni poznat do detailu svět, my jen nadhazujeme síťovinu našeho vnímání, kdy básník ji nahodí jinak než vědec, podle nějakých vlastních pravidel. Básník má pravidla nastavená naprosto odlišně než vědec. U vědce platí, že je lepší si vše propočítat. V okamžiku, kdy jsem vědec z Hongkongu a použiju stejnou metriku jako vědec z Ostravy, vyjde nám stejný výsledek. Ale propočtem nemohu zjistit podstatu světa. Já tím kupříkladu pouze zjišťuji, proč je někdo více nemocný než druhý nebo proč se někomu může líbit ten nebo onen.

Nemám rád otázky typu: Co to je, ta poezie? To je naprosto špatně položená otázka. My spíše zjišťujeme různé odlišnosti. A právě vědy, které staví jen na interpretaci nebo zkoumání nepřímých pramenů, jsou často chápány jako méně důvěryhodné. V angličtině se proto označují jako humanities, nikoli science. Science je prostě přírodní věda a humanities je chápáno jako věda založená na interpretacích.

K jaké oblasti výzkumu se chcete dostat vy sám?

My vlastně vůbec nevíme, jak funguje lidský mozek, proč jsou pro nás právě ta synsémantika tak důležitá. Bylo by úžasné mít společný výzkum například s neurology a zjistit právě toto. Nestor metod kvantitativní lingvistiky Gabriel Altmann například přišel na zajímavou skutečnost, že čím delší je věta, tím kratší slova se v ní vyskytují. Tato zákonitost platí i naopak, a to že čím delší slova použijete, tím je věta kratší. Vědomě to nikdo nedělá, to dělá automaticky náš mozek, aby se neuhnal. Nevyčerpal. Statisticky se ukazuje, že tato zákonitost platí ve všech jazycích, napříč generacemi, pohlavím, vzděláním. Také platí, že čím delší slovo, tím kratší má slabiky, obecně se tomu říká Menzerathův–Altmannův zákon. Tento jev je asi jazykovou univerzálií, protože funguje ve všech jazycích, ale to se už pohybujeme v obecné lingvistice.

Kromě toho, že působíte na katedře českého jazyka Filozofické fakulty OU, učíte také latinský a anglický jazyk na gymnáziu. Má ještě výuka latiny v dnešní době význam?

Spousta studentů nechápe, k čemu jim latina bude, ale jsou i tací, kteří už začínají chápat, že jazyky jsou neuvěřitelně propojené, že latina vám například okamžitě vysvětlí, proč jsou ve slově „accommodation“ dvě „c“ a dvě „m“. Latina vám zkrátka dodá souvislosti a mám už několik studentů, kteří toto objevili, a zajímá je to. Čtení a učení jazyků vám dává řadu kontextů, vynikajícím způsobem trénuje mozek a dodává jazykový cit. Můj kamarád byl skvělý matematik, ale nešikovný na jazyky. A já si tehdy myslel, že to je jen záležitost memorování slovíček, ale po čase jsem pochopil, že každý člověk má nějaké limity, a to i v jazyce. Dnes doučuji latinu mnoho lidí, kteří ji potřebují ke své profesi, a skutečně vidím, že existuje určitá hranice, kterou třeba nedokáží někteří překročit. Já osobně vnímám latinu jako naprostý základ. Tak jako je základ matematika. Latina totiž funguje hodně podobně, a proto ji lidi nemají rádi. Latinu se stejně jako matematiku nenaučíte bez znalosti základů, kdy v hlavě musíte držet obrovské penzum znalostí a pravidel. K matematice a latině se musí dozrát.

Mgr. Mgr. Bc. Michal Místecký, Ph.D., (29 let) vystudoval anglický, francouzský, latinský a český jazyk na Filozofické fakultě Ostravské univerzity. V současné době pracuje jako vědecký pracovník na katedře českého jazyka FF OU. Odborně se zabývá kvantitativní lingvistikou, která je propojením lingvistiky a matematiky. Jak sám říká, pro humanitní vědy dosti neobvyklá kombinace. Kromě působení na vysoké škole vyučuje latinský a anglický jazyk na ostravském Jazykovém gymnáziu Pavla Tigrida a tvrdí, že učení ho opravdu velmi baví. Důkazem jeho tvrzení je fakt, že vyučuje i soukromě latinský jazyk, který pokládá za naprostý základ. Michal Místecký rozhodně patří k nejzajímavějším a nejtalentovanějším mladým vědcům na Filozofické fakultě OU.

Další články o lidech a dění na Filozofické fakultě OU čtěte v magazínu OFFline.


Zveřejněno / aktualizováno: 16. 10. 2019