Projekty a granty




Kvantitativní analýza textů žákovského korpusu CzeSL-SGT
Id projektuSGS06/FF/2022
Hlavní řešitelMgr. Miroslav Kubát, Ph.D.
Období1/2022 - 12/2022
PoskytovatelSpecifický VŠ výzkum
Stavukončený
AnotaceV rámci projektu se zaměříme na kvantitativní analýzu textů žákovského korpusu CzeSL-SGT s cílem získat základní data o textech jednotlivých jazykových úrovní, modelovat vývoj těchto textů a sledovat tak proces učení se češtiny jako cizího jazyka. Tento korpus obsahuje přes 8000 textů psaných studenty češtiny jako cizího jazyka na všech jazykových úrovních. Texty budeme analyzovat pomocí softwarů QuitaUP či UDPipe, které umožňují sledovat různé vlastnosti textů. Bude nás zajímat zejména průměrná délka tokenů, deskriptivita textu, vzdálenost mezi slovesy, délka vět, slovní bohatství, počet klauzí ve větě, syntaktické vlastnosti dependenčních stromů. Tento projekt je první fází výzkumu k dizertační práci M. Hanuškové zaměřené na analýzu textů nerodilých mluvčích češtiny. Zároveň budou aplikovány metody uplatněné v diplomových pracích M. Nogolové a M. Guńkové. Výsledky výzkumu budou prezentovány na lingvistických konferencích a v odborných článcích.