Projektas LIEPA3Technologijų specialistai pabrėžia, kad ChatGPT ir kiti dirbtinio intelekto (DI) modeliai vis dar tiksliau bei efektyviau veikia užduotis pateikus anglų kalba, o sugeneruotuose lietuvių kalbos tekstuose vis dar galima pastebėti klaidų net ir nesant šios srities specialistu. Siekiant pokyčių Vilniaus universiteto (VU) Matematikos ir informatikos bei Filologijos fakultetų mokslininkai jau beveik dešimtmetį įgyvendina VU informatikų inicijuotą projektą LIEPA. Šiuo metu vykdomame projekto etape, kurio tikslas – surinkti 5 000 valandų įrašų skaitytinės šnekos stiliumi, aktyviai dalyvauja ir VU Kauno fakulteto filologės: bakalauro studijų programos Lietuvių filologija ir reklama trečiakursė Austėja Simonaitytė, magistrantūros programos Viešojo diskurso lingvistika absolventės Karolina Vyšniauskaitė, Ligita Čeponytė ir Aura Naimavičiūtė bei Kalbų, literatūros ir vertimo studijų instituto doktorantė Monika Stankienė.

Projekte įdarbintos ekspertėmis jos kasdien klausosi įrašytų sakinių ir, vadovaudamosi parengtomis gairėmis, sprendžia, ar įrašai tinkami garsynui. Filologėms didžiausią džiaugsmą kelia tai, kad projekte siekiama kuo platesnės įvairovės – nuo skirtingų balsų tembro iki įvairių regionų atstovų kalbos. Pasak jų, toks darbas reikalauja atidumo ir susikaupimo, tačiau motyvuoja įvairovė ir, svarbiausia, veiklos prasmingumas.

VU KnF Kalbų literatūros ir vertimo studijų instituto doktorantė Monika Stankienė

 

 

 

„Gal skamba kaip monotoniška veikla, tačiau darbas man labai įdomus. Kaip mokslininkei, žiūrint iš sociolingvistinės pusės, galima atpažinti tam tikrus žmonių kalbinius portretus, pati šneka yra dinamiška. Manau, būtent tame gyvume ir slypi lietuvių kalbos žavesys. Malonu prisidėti prie prasmingos veiklos, kad mūsų kalba būtų suprantama technologijų pasaulyje, žmonės turėtų platesnes galimybes naudotis įvairiomis skaitmeninėmis paslaugomis lietuvių kalba“, – sako doktorantė Monika Stankienė.

 

 

 

Austeja Simonaityte VU KNF SA Foto Andrius Lindzius„Neįkainojama patirtis dar studijuojant dalyvauti tokios apimties projekte. Dėl savo kompetencijų tapome dalimi tarpinės grandies tarp įrašus pateikiančių žmonių ir realų rezultatą žadančio mokslinio darbo. Belieka didžiuotis, kad kuriame pokytį savotiškai kovodami už lietuvių kalbos išskirtinumo išsaugojimą“, – sako bakalauro studijų programos Lietuvių filologija ir reklama trečiakursė Austėja Simonaitytė.

 

 

 

VU KnF Ligita Ceponyte„Man ypač svarbu, kad projektas prisideda prie gimtosios lietuvių kalbos gyvybingumo išsaugojimo skaitmeninant, jos integravimo į šiuolaikines ir ateities technologijas. Džiaugiuosi galėdama būti viso to dalimi ir prisidėti, kad lietuvių kalba užtikrintais žingsniais žengtų pirmyn moderniųjų technologijų pasaulyje“, – sako studijų programos Viešojo diskurso lingvistika magistrė Ligita Čeponytė.

 

 

 

„Svarstau, kad sukaupti duomenys taip pat galėtų padėti kurti balso pagalbininkus žmonėms su negalia ar skatinti mokslinius tyrimus apie lietuvių kalbos įvairovę, galbūt net išsaugoti šiuolaikinių tarmių skambesį ateities kartoms“, – dalijasi mintimis studijų programos Viešojo diskurso lingvistika magistrė Aura Naimavičiūtė.Antro kurso Viešojo diskurso lingvistikos magistrantė Aura Naimavičiūtė 2

 

 

 

Antro kurso Viešojo diskurso lingvistikos magistrantė Karolina Vyšniauskaitė„Darbas projekte prasmingas, nes padeda užtikrinti, kad lietuvių kalba būtų suprantama ir naudojama moderniausiose technologijose. Tai itin svarbu mūsų kalbos išlikimui, gyvybingumui, tobulėjimui ir ateičiai“, –mano studijų programos Viešojo diskurso lingvistika magistrė Karolina Vyšniauskaitė.

 

 

 

Kadangi prie šio projekto įrašų įgarsinimo gali prisidėti visi norintys, K. Vyšniauskaitė pati pabandė įrašyti sakinį platformoje https://kurkgarsyna.lt/. Patvirtinti balso įrašai bus naudojami rengiant nemokamai prieinamą anotuotą lietuvių kalbos garsyną, kuris pasitarnaus šnekos atpažinimo, dirbtinio intelekto (DI) ir inovatyvių technologijų plėtrai. Nuo 2026 m. gegužės, projektui pasibaigus, garsynas bus prieinamas įmonėms ir organizacijoms, kuriančioms DI sprendimus bei kitas technologijas.

Pasak projekto autorių, iš viso norima surinkti 10 000 valandų lietuvių kalbos įrašų, kurie taps didžiausiu garsynu Lietuvos istorijoje, net 10 kartų didesniu už šiuo metu naudojamus garsynus. Svarbu ir tai, kad garsynas bus išskirtinis ne tik savo apimtimi, bet ir fonetine, geografine, demografine ir kalbine įvairove, nes padės DI suprasti ne tik bendrinę kalbą, bet ir tarmes, žargoną, kitus kalbos variantus. Būtent tokie duomenys gali pagerinti bendradarbiavimą su DI lietuvių kalba, o ateities filologams žada platesnes galimybes tarpdalykinėms studijoms.

APIE PROJEKTĄ 

LIEPA-3 – tai lietuvių kalbos išsaugojimo ir įgalinimo projektas, kurio tikslas parengti nemokamai prieinamą lietuvių kalbos garsyną – balso įrašų rinkinį, skirtą šnekos atpažinimo, dirbtinio intelekto, skaitmeninių sprendimų ir inovacijų vystymui naudojant lietuvių kalbą.

Projektas „Didžiojo lietuvių kalbos garsyno sukūrimas (LIEPA-3)“ yra skirtas sudaryti sąlygas spartesnei valstybės skaitmeninimo plėtrai, pasiūlant viešai prieinamus skaitmeninius kalbinius išteklius – anotuotą lietuvių kalbos garsyną, skirtą ir tinkamą šnekos atpažinimo, dirbtinio intelekto (DI) ir kitoms inovatyvioms kalbos technologijoms plėtoti. Projektą vykdo Vilniaus universitetas su partneriais – Vytauto Didžiojo universitetu ir Lietuvių kalbos institutu. Projekto vadovė: Dr. Gražina Korvel.

 

Kai dirbtinis intelektas prabyla lietuviškai: VU projektas LIEPA, atveriantis galimybes filologams

Lietuvių kalba ir technologijos: VU mokslininkų projektas LIEPA-3 atvers naujas galimybes