Slovenščina je nedavno postala bogatejša za še eno digitalno orodje – orodje za samodejno postavljanje vejic. Na spletu gostuje poleg drugih (korpus Gigafida, kolokacijski slovar, slovar sopomenk in oblikoslovni leksikon Sloleks) na portalu Centra za jezikovne vire in tehnologije (CJVT) na Univerzi v Ljubljani in je, tako kot druga orodja, na voljo brezplačno. Predstavitev orodja je potekala 1. aprila (brez šale) na spletu (povezava), avtorji so izkoristili priložnost za predstavitev delovanja tega in podobnih orodij, na koncu pa je bil tudi čas za razpravo.
Nevronske mreže
Orodje za samodejno postavljanje vejic je bilo razvito v okviru diplomskega dela Martina Božiča pod mentorstvom prof. Marka Robnika Šikonje na Fakulteti za računalništvo in informatiko UL in za delovanje uporablja globoke nevronske mreže.
Globoke nevronske mreže so oblika umetne inteligence, ki se v svoji zgradbi okvirno zgleduje po nevronskih mrežah v človeških možganih. Cilj takšne umetne inteligence je prepoznati vzorce iz velike količine podatkov za priučitev »pravil«, ki jih prepozna med temi podatki. Za orodje so avtorji uporabili jezikovni model BERT, ki je prilagojen za strojno učenje na področju obdelave naravnega jezika. Model so z več poskusnimi nizi podatkov prilagodili tako, da deluje karseda natančno.
Kako deluje?
Spletno orodje deluje tako, da v levo polje vpišemo ali prilepimo besedilo, ki ga želimo preveriti. S klikom na puščico orodje zažene pregled in rezultat izpiše v desnem polju. Manjkajoče vejice so označene s sivo barvo, odvečne pa z modro. Popravke lahko nato označimo s palcem navzgor ali palcem navzdol glede na to, ali smo bili z rezultatom zadovoljni. Besedilo lahko tudi z enim klikom kopiramo, pred kopiranjem pa ga lahko po želji še uredimo.
Postavljanje vejic z orodjem je bilo v poskusih razvijalcev uspešno v 94 odstotkih primerov. Pripomniti velja, da gre še vedno zgolj za avtomatiziran pregled, ki vsebine ne razume, temveč vejice postavlja glede na prepoznana pravila iz primerov, s katerimi je bil priučen.
Hramba besedil
Upoštevati velja tudi to, da z uporabo orodja svoje besedilo pošljemo na strežnik, kjer se besedilo hrani in obdeluje za izboljšavo in razvoj orodja za postavljanje vejic. Če imate opravka z občutljivimi podatki ali zaupnim besedilom, spletna orodja niso najboljša rešitev. V tem primeru si lahko to orodje prenesete z repozitorija projekta na GitHubu in ga zaženete lokalno na svojem računalniku. Resda to zahteva nekaj več tehnološkega znanja in nekaj dodatnih knjižnic programskega jezika Python, a morda vam prav to odpre nova obzorja in postane vaš nov prostočasen projekt. Predvsem pa boste na tak način ohranili zaupnost dokumenta in zaščitili avtorja.
Debata za konec
Orodje za samodejno postavljanje vejic je izvrsten nov digitalni jezikovni vir, ki dopolnjuje že tako obsežno zbirko virov CJVT, portala Fran, portala slovenščina.eu in drugih. Slovenščina ima svoji majhnosti navkljub ogromno zbirko prosto dostopnih digitalnih jezikovnih virov.
Za konec naj povzamem še vprašanje iz spletne predstavitve: A zdaj ljudje niti vejic več ne bodo sposobni postavljati sami? Resda se v neformalni spletni komunikaciji marsikatero pravopisno pravilo opušča, a za formalna besedila bo znanje pravopisa še naprej pomembno. Tako kot črkovalniki niso izpodrinili znanja pravopisa in spletni prevajalniki znanja tujih jezikov, tudi to orodje ne bo izbrisalo sposobnosti postavljanja vejic. Nas pa lahko obvaruje pred kakšno neprijetno manjkajočo (ali odvečno) vejico. Za večje in pomembnejše projekte, kjer pa ne želite tvegati, vseeno priporočamo uporabo storitev usposobljenega lektorja.
Jernej Lorber je konferenčni tolmač in prevajalec za slovenski, nemški in angleški jezik ter tehnološki navdušenec. Je član ZKTS, dejaven na področju tolmačenja na daljavo in sodelavec Filozofske fakultete Univerze v Mariboru.