Skaitmeninė mįslių kartoteka

Skaitmeninė mįslių kartoteka yra sudedamoji Lietuvių tautosakos elektroninių išteklių dalis ir kartu su liaudiškųjų tikėjimų bei Pokario partizanų dainų kartotekomis sudaro bendrą Tautosakos skaitmeninių kartotekų posistemę. Mįslių skaitmeninė kartoteka kuriama kortelinės lietuvių mįslių sisteminės kartotekos pagrindu. Ji yra Lietuvių literatūros ir tautosakos institute (toliau – LLTI) ir apima apie 100 000 mįslių, ir dar turima netvarkytų 40 000 išrašytų į korteles mįslių. Kartotekos kūrimą maždaug prieš 30 metų sumanė ir pradėjo akademikas prof. habil. dr. Leonardas Sauka. Jo vadovaujami studentai iš LLTI Lietuvių tautosakos archyvo rankraščių išrašė mįsles į korteles, kurios pagal įminimus (atsakymus) buvo suskirstytos abėcėlės tvarka. Šis pirminis skirstymas buvo mechaniškas: tarmiškus, sinonimiškus atsakymus arba vienodus tekstus, bet kitokius atsakymus turinčios mįslės atsidurdavo skirtingose kartotekos vietose, niekaip nebuvo susietos (neretai į tą patį užminimą pateikiami keli skirtingi įminimai, ir visi jie laikomi teisingais. Pavyzdžiui, mįslės užminimas Įkiši – marma, ištrauki – varva turi tokius įminimus: svirtis, kibiras, rūbas, samtis, sruoga, skalbti, sviestą mušti, šulinys, vanduo). Kurį laiką kartoteką tvarkė Gintaras Plytnikas. Paskui gana ilgą laiką mįslės nebuvo sisteminamos arba sisteminamos tik kartkartėmis. Nuo 1997 m. pabaigos (su trejų metų pertrauka) kartoteką tvarko Aelita Kensminienė. Gana ilgą laiką nuosekliau sisteminamos buvo tik vadinamosios objektų, arba tikrosios, mįslės. 2006 m. buvo susistemintos objektų ir tikrosios minklės. Kartoteka dar nėra visiškai užbaigta, jos kūrimas tęsiamas. Mįslių užminimai ir ypač įminimai yra labai skirtingos apimties ir struktūros, todėl sisteminant mįslių žanras skirstomas į žanro skyrius. Kai kurių tekstų požymiai peržengia skyrių ribas. Mįslių žanrą sudaro tokie skyriai: objektų mįslės, mįslės apie konkretų atsitikimą, mįslės apie raides, garsus ir žodžius, objektų minklės, tikrosios minklės, anekdotinės minklės, galvosūkiai. Didžiąją lietuvių mįslių masyvo, o taip pat ir Skaitmeninės kartotekos dalį sudaro objektų mįslės, žymiai mažiau turime objektų ir tikrųjų minklių, ir visai nedaug kitų šio žanro skyrių tautosakos vienetų. Skirstant objektų mįsles laikomasi pradinio sisteminimo principo (pagal atsakymus), bet nuorodomis suvedami vienodi ir panašūs mįslių tekstai (iš kurių suformuojamos tam tikros grupės) – taip pripažįstama užminimo svarba, nors formaliai pirminis sisteminimo kriterijus tebėra atsakymas.

Kitas naujosios skaitmeninės kartotekos pagrindas – anksčiau sukurta mįslių duomenų bazė: tai 2006–2011 metais LLTI vykdytas Valstybinės lietuvių kalbos komisijos (VLKK) remtas projektas Elektroninės LLTI sukauptų lietuvių mįslių duomenų bazės kūrimas pagal Valstybinės kalbos norminimo, vartojimo, ugdymo ir sklaidos 2006–2015 m. programą. Projektui vadovavo, kūrė bazės struktūros principus, atrinkinėjo ir klasifikavo mįsles, įvesdavo tipų ir versijų pavadinimus į duomenų bazę Aelita Kensminienė, duomenų bazę sukūrė ir jos veikimą užtikrino IT specialistas Arūnas Ciesiūnas. Mįslių duomenis į bazę įvedinėjo rinkėjos, kurios per tuos šešerius metus ne kartą keitėsi: čia padirbėjo Edmunda Janavičienė (dab. Vengrytė-Drumstė), Dangirutė Giedraitytė, Giedrė Bufienė, Jurgita Ūsaitytė, Vilma Daugirdaitė, Jurgita Dambrauskaitė.

Senoji duomenų bazė buvo sukurta atvirojo kodo MySQL pagrindu, duomenų manipuliavimui sąsaja sukurta taip pat atvirojo kodo skriptų kalba – PHP. Visi tekstai priklausė tam tikrai hierarchinei žanro klasifikacijos ir tipologinei sistemai – tarsi „tipų tinkleliui". Šią sistemą sudarė žanro skyriai, tipai su versijomis ir atsakymai – visa tai buvo pagrindiniai paieškos parametrai (pagalbiniai  parametrai – informacinio vieneto šaltinis, bet koks žodis mįslės tekste, pateikėjas, užrašytojas ir kt.). Šio projekto metu per šešerius metus į informacinę sistemą suvesta didžioji dalis (80 125 – ~80 proc.) lietuvių mįslių masyvo. Buvo užtikrintos rankraščiuose saugomų mįslių ir fiziškai netvariõs, kortelėse bei dėžutėse egzistuojančios, pradėtos kurti tipų sistemos apsaugos sąlygos – sukurta elektroninė mįslių tipų rodyklė. Šiame projekte vartotojo prieigos sukūrimo darbai nebuvo numatyti. Projekto finansavimas buvo labai kuklus, o darbo tempas milžiniškas, tad tik labai mažas iš kortelių (kurios yra išrašai iš rinkinių) įvedamos informacijos kiekis buvo tikrinamas pagal originalus, atsisakyta papildomos mokslinės analizės. Vis dėlto bazės pagrindas  sukurtas, į ją įvesta 76000 objektų mįslių (likusius 4000 sudarė kiti žanro skyriai). Dalis jų įvesta iš tokių kartotekos kortelių, kurios išrašytos iš rinkinių, esančių ne LLTI, arba iš periodinių leidinių.

Džiugu, kad šie darbai buvo pratęsti Lietuvos mokslo tarybos (LMT) 2012–2014 m. vykdomame projekte IRT sprendimų bei turinio, padedančių išsaugoti lietuvių kalbą viešojoje erdvėje, kūrimas bei galimybių jais naudotis sudarymas. Šio projekto vadovė LLTI dr. Daiva Vaitkevičienė, programinius sprendimus kūrė UAB „Atvirasis kodas", (vadovas Justinas Jaronis, programuotojai Ignas Bačius, Gediminas Zlatkus, Jelena Kutalovskaja), mįslių kartotekos grupei vadovavo dr. Aelita Kensminienė, mįslių duomenis tikrino ir tvirtino Jurgita Dambrauskaitė, Rasa Kašėtienė, Milda Kuncaitė, Živilė Kuncaitė, Jolanta Sadauskaitė. Projekto metu buvo perkelti mįslių duomenys iš senosios duomenų bazės, kartu išplėsta jos struktūra (sukurti reliaciniai ryšiai tarp atskirų duomenų bazių dalių, verifikuoti esami klasifikatoriai, įvesti papildomi mokslinės analizės įrankiai), mįslių įrašai papildyti informacija iš Lietuvių tautosakos rankraštyno bei tipologiniais žymenimis, patikslinta įrašų tekstų transkripcija ir metaduomenų informacijos kokybė, bazės prototipas susietas su universalesne informacine sistema, sukurta vartotojo prieiga. Vartotojui prieinama Skaitmeninė mįslių kartoteka – 60 000 mįslių duomenų bazė, apimanti visus išskirtus tipus ir jų versijas, atspindinti daugelį dešimtmečių Lietuvių literatūros ir tautosakos instituto kaupto mįslių masyvo sudėtį, turtingumą ir įvairovę (kol kas tik mįslių medžiaga iš LLTI saugomų Lietuvių mokslo draugijos ir Lietuvių tautosakos rankraštyno rinkinių). Vienoje vietoje  pateikiama laisvai prieinama susisteminta didžioji dalis lietuvių objektų mįslių masyvo. Skaitmeninė kartoteka atspindi kortelinės kartotekos tipologinę sistemą. Į ją iš anksčiau kurtos Lietuvių mįslių bazės yra perkelta daugiau kaip 900 tipų su jiems priklausiančiomis daugiau kaip 6000 versijų.

Tipas yra mįslių grupė, sudaryta iš vienos ar keleto panašių versijų. Čia pagrindinis organizuojantis lygmuo yra semantinis mįslės branduolys  ir bendras loginis-semantinis laukas.

Versija yra mįslių grupė, kurią sudaro analogiškos ar labai panašios sintaksinės struktūros ir iš tos pačios reikšmės leksikos sudaryti užminimų tekstai. Kiekviena versija priklauso kokiam nors tipui. A1 versija yra daugiausia vienodų ar panašių mįslių turinti versija ir dažniausiai sutampa su tipo pavadinimu. Tas pats tipas ir versija jungia panašius užminimus turinčias mįsles, kurios gali turėti labai skirtingus atsakymus. Mįslių tipai gali būti panašūs meniniu vaizdu ar susiję per kontaminuotas versijas. Kai panašumas labai artimas, stengiamasi tokias mįsles jungti į vieną tipą, tačiau kartais tai neįmanoma dėl to, kad vaizdas gali būti labai išplėtotas, panašus skirtingais fragmentais, o sujungus visas panašių vaizdų versijas į vieną tipą, šis taptų itin didelis, išplaukusiomis  ribomis. Todėl elgiamasi lanksčiai – sudaromi atskiri tipai, o jų panašumas parodomas sąsajomis.

Pagrindiniai skaitmeninės Mįslių kartotekos elementai yra objektas su jo fiksacija, jie susieti su aukštesniais hierarchiniais lygmenimis versijomis, o per jas – su tipais. Objektas yra apibrėžiamas kaip tam tikro folkloro vieneto apibendrinta informacija ir užima aukštesnį hierarchinį lygmenį nei fiksacija. Apskritai objektas gali turėti keletą fiksacijų (bet mįslių atveju vienas objektas turi vieną fiksaciją, bent kol kas).  Kiekvienas mįslės objektas priklauso kokiai nors tipo versijai. Prie kiekvienos versijos yra komanda rodyti objektus, kurią spustelėjus išskleidžiamas tai versijai priskirtų objektų sąrašas. Fiksacija yra apibrėžiama kaip konkretus folkloro vieneto, galinčio turėti ne vieną versiją, užrašymas, pvz., teksto originalas, redaguota / adaptuota versija ir kt. Tekstinė fiksacija – tai tokia informacijos perteikimo forma, kuri kartotekos objektą fiksuoja teksto rašmenimis.