{"id":8483,"date":"2025-09-04T06:10:29","date_gmt":"2025-09-04T06:10:29","guid":{"rendered":"https:\/\/mokslosriuba.lt\/kartumesgalime\/?p=8483"},"modified":"2025-09-04T06:15:39","modified_gmt":"2025-09-04T06:15:39","slug":"proverzis-lietuviskame-di-pristatyta-atvira-didziojo-kalbos-modelio-pamatine-versija-lietuviu-kalbai","status":"publish","type":"post","link":"https:\/\/mokslosriuba.lt\/kartumesgalime\/2025\/09\/04\/proverzis-lietuviskame-di-pristatyta-atvira-didziojo-kalbos-modelio-pamatine-versija-lietuviu-kalbai\/","title":{"rendered":"Prover\u017eis lietuvi\u0161kame DI: pristatyta atvira did\u017eiojo kalbos modelio pamatin\u0117 versija lietuvi\u0173 kalbai"},"content":{"rendered":"\n<p><strong>Baltijos \u0161ali\u0173 kalbos technologij\u0173 bendrov\u0117 \u201eTilde\u201c pristat\u0117<\/strong><strong>&nbsp;<\/strong><strong>prie\u0161 metus&nbsp;<\/strong><strong>prad\u0117t\u0105 kurti did\u017eiojo kalbos modelio lietuvi\u0173 kalbai pamatin\u0119 versij\u0105 \u201eTildeOpen\u201c.&nbsp;<\/strong><strong>Modelis yra atviras visiems, juo naudodamiesi technologij\u0173 profesionalai gali kurti specializuotus, konkre\u010dioms u\u017eduotims pritaikytus ir lietuvi\u0173 kalba veikian\u010dius DI sprendimus. Tai didins DI pritaikymo pl\u0117tr\u0105 ir valstybiniame, ir privataus verslo sektoriuose.<\/strong><\/p>\n\n\n\n<p>\u201eTai yra negin\u010dytinas prover\u017eis vystant dirbtinio intelekto (DI) sprendimus Lietuvoje ir kitose Baltijos \u0161alyse. Iki \u0161iol visi didieji kalbos modeliai (angl. Large Language Model, LLM) buvo mokomi daugiausia angl\u0173 ir kit\u0173 did\u017ei\u0173j\u0173 kalb\u0173 tekstais, kas l\u0117m\u0117 \u017eymiai prastesn\u012f veikim\u0105 naudojant ma\u017e\u0105sias kalbas, tarp j\u0173 \u2013 ir lietuvi\u0173. Negana to, pla\u010diausiai naudojami LLM yra patalpinti ne Europos S\u0105jungoje esan\u010diuose serveriuose, o tai stabdo DI pl\u0117tr\u0105 bei naudojim\u0105 ir priva\u010diame, ir valstybiniame sektoriuje, kur grie\u017etai reglamentuotas duomen\u0173 tvarkymas ir apsauga.\u00a0<\/p>\n\n\n\n<p>\u0160iandien m\u016bs\u0173 mokslinink\u0173 komanda po&nbsp;metus trukusio proceso publikavo ma\u017e\u0173j\u0173 kalb\u0173 tekstynais apmokyt\u0105 did\u017eiojo kalbos modelio pamatin\u0119 versij\u0105. Kod\u0117l tai svarbu? \u0160is LLM yra atviras visiems, rei\u0161kia, kad ir priva\u010dios, ir valstybin\u0117s organizacijos, ir individual\u016bs specialistai, mokslininkai, studentai naudodami m\u016bs\u0173 model\u012f gali kuri DI sprendimus specializuotoms u\u017eduotims. \u0160ie sprendimai ne tik veiks kokybi\u0161kiau lietuvi\u0173 kalba, bet ir panaikins iki \u0161iol egzistavusias saugumo rizikas: m\u016bs\u0173 modelis gali b\u016bti talpinamas organizacij\u0173 vidin\u0117se sistemose\u201c, \u2013 sako Renata \u0160pukien\u0117, \u201eTilde IT\u201c vadov\u0117.&nbsp;<\/p>\n\n\n\n<p><strong>Galimyb\u0117 DI sprendimus naudoti ir strategi\u0161kai svarbiose organizacijose<\/strong><\/p>\n\n\n\n<p>Daugiau nei 30 mlrd. parametr\u0173 turintis ir neuronini\u0173 tinkl\u0173 technologijos pagrindu veikiantis pamatinis didysis kalbos modelis buvo mokomas naudojant gausyb\u0119 i\u0161 \u012fvairi\u0173 \u0161altini\u0173 gautos bendrosios informacijos lietuvi\u0173 ir kitomis ma\u017eosiomis kalbomis.&nbsp;<\/p>\n\n\n\n<p>Modelio architekt\u016bra, specialiai sukurta Europos kalboms, u\u017etikrina reik\u0161ming\u0105 efektyvumo prieaug\u012f, palyginus su kitais modeliais: lietuvi\u0173 kalba jis veikia 37 % efektyviau nei \u201eLLaMA-3\u201c ir 18 % nei \u201eGPT-4o\u201c.<\/p>\n\n\n\n<p>\u201e\u0160is efektyvumo prieaugis rei\u0161kia, kad \u201eTildeOpen\u201c yra ma\u017eesnis, efektyvesnis ir gerokai labiau patenkinantis Europos daugiakalbius poreikius. Greta to, kad \u0161is pamatinis modelis yra specialiai apmokytas lietuvi\u0173 kalba, svarbus ir jo saugumo aspektas. K\u016br\u0117jai gali j\u012f \u012fdiegti organizacijos serveriuose, taip u\u017etikrindami, kad visa LLM pateikta informacija likt\u0173 j\u0173 infrastrukt\u016broje. Populiarieji komerciniai kalbos modeliai da\u017eniausiai laikomi JAV arba Azijoje esan\u010diuose duomen\u0173 centruose ir ne visada atitinka ES duomen\u0173 apsaugos ir duomen\u0173 privatumo politikos standartus. Tad \u201eTildeOpen\u201c kaip pamatinio LLM naudojimas pilnai u\u017ekirs keli\u0105 bet kokioms duomen\u0173 nutek\u0117jimo rizikoms\u201c, \u2013 komentuoja Giedrius Karauskas, \u201eTilde IT\u201c Technologij\u0173 skyriaus vadovas.<\/p>\n\n\n\n<p>Pasak jo, b\u016btent saugumo aspektas atveria kelius platesniam DI naudojimui valstybin\u0117se institucijose: \u201eM\u016bs\u0173 pamatinis didysis kalbos modelis yra pirmas \u017eingsnis didesnei DI pritaikymo pl\u0117trai valstybiniame sektoriuje. Iki \u0161iol strategi\u0161kai svarbios \u0161alies institucijos, dirban\u010dios su jautria informacija, susijusia su asmens duomenimis, \u0161alies saugumu, negal\u0117jo naudotis jokiais DI sprendimais, veikian\u010diais ne ES teritorijoje ar vidin\u0117je organizacijos infrastrukt\u016broje. \u0160iandien \u017eengiame \u012f kit\u0105 DI naudojimo etap\u0105: turime savo lietuvi\u0161k\u0105 pamatin\u012f did\u012fj\u012f kalbos model\u012f, kur\u012f organizacijos gali saugiai talpinti vidiniuose serveriuose ir i\u0161naudoti DI galimybes veiklos efektyvumui didinti. O galimyb\u0117s neribotos: tai ir kokybi\u0161kas jautri\u0173 dokument\u0173, dideli\u0173 apim\u010di\u0173 turinio ma\u0161ininis vertimas, ir duomen\u0173 apdorojimas, analiz\u0117, santrauk\u0173 generavimas, DI asistentai ir kt.\u201c.&nbsp;<\/p>\n\n\n\n<p><strong>Kurtas naudojantis galingiausius superkompiuterius Europoje<\/strong><\/p>\n\n\n\n<p>Modelis buvo sukurtas pasitelkiant galingiausius Europos superkompiuterius \u201eLUMI\u201c ir nauj\u0105j\u012f \u201eJUPITER\u201c. Galimyb\u0119 naudotis \u0161i\u0173 kompiuteri\u0173 procesori\u0173 (GPU) valandomis \u201eTilde\u201c laim\u0117jo Europos Komisijos rengtame konkurse \u201eDirbtinio intelekto didysis i\u0161\u0161\u016bkis\u201c (angl. Large AI Grand Challenge). Dirbant su \u0161iais galingais \u012frenginiais pirmoji \u201eTildeOpen\u201c versija sukurta ma\u017edaug per metus.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"683\" src=\"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-1024x683.jpeg\" alt=\"\" class=\"wp-image-8485\" srcset=\"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-1024x683.jpeg 1024w, https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-300x200.jpeg 300w, https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-768x512.jpeg 768w, https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-1536x1024.jpeg 1536w, https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-2048x1365.jpeg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Superkompiuteris \u201eJUPITER\u201c. Autoryst\u0117: Forschungszentrum J\u00fclich \/ Sascha Kreklau.<\/figcaption><\/figure>\n\n\n\n<p>G. Karausko teigimu, tai tarsi pamato pastatymas namui: \u201eSvarbu suprasti, kad tai yra pamatinis, arba kitaip \u201efoundational\u201c, didysis kalbos modelis lietuvi\u0173 kalbai. Norint efektyviai i\u0161naudoti \u0161io modelio galimybes, turime j\u012f pritaikyti konkre\u010di\u0173 u\u017eduo\u010di\u0173 atlikimui, taip pat tikim\u0117s ir kit\u0173 organizacij\u0173, versl\u0173, mokslinink\u0173 ir specialist\u0173 \u012fsitraukimo \u012f \u0161\u012f proces\u0105.&nbsp;<\/p>\n\n\n\n<p>Modelis<em>&nbsp;<\/em>yra atvirojo kodo sprendimas, laisvai pasiekiamas valstybin\u0117ms \u012fstaigoms, \u012fmon\u0117ms, mokslininkams, studentams, medicinos \u012fstaigoms, finans\u0173 ir draudimo sektoriams, ir \u0161\u012f model\u012f galima naudoti pagal sektoriaus poreikius.&nbsp;<\/p>\n\n\n\n<p>\u201eTildeOpen\u201c<em>&nbsp;<\/em>galima saugiai diegti vietiniame serveryje ir debesyje, jis specialiai pritaikytas toms Europos kalboms, kurioms da\u017enai n\u0117ra tinkamai reprezentuojamos populiariausiuose sprendimuose ir palaiko visas 24 oficiali\u0105sias ES kalbas, taip pat ukrainie\u010di\u0173 bei kit\u0173 \u0161ali\u0173 kandida\u010di\u0173 kalbas.&nbsp;<\/p>\n\n\n\n<p>Pirmoji versija skelbiama platformoje&nbsp;<a href=\"https:\/\/huggingface.co\/\" target=\"_blank\" rel=\"noreferrer noopener\"><em>Hugging Face<\/em><\/a>.&nbsp;<\/p>\n\n\n\n<p>Modelis buvo sukurtas laikantis ES dirbtinio intelekto akto reikalavim\u0173.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Baltijos \u0161ali\u0173 kalbos technologij\u0173 bendrov\u0117 \u201eTilde\u201c pristat\u0117&nbsp;prie\u0161 metus&nbsp;prad\u0117t\u0105 kurti did\u017eiojo kalbos modelio lietuvi\u0173 kalbai pamatin\u0119 versij\u0105 \u201eTildeOpen\u201c.&nbsp;Modelis yra atviras visiems, juo naudodamiesi technologij\u0173 profesionalai gali kurti specializuotus, konkre\u010dioms u\u017eduotims pritaikytus [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":8486,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_themeisle_gutenberg_block_has_review":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-8483","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized","pb-post","pb-item","pb-col-xl-4 pb-col-m-6 pb-col-s-12","pb-animate pb-animated "],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-content\/uploads\/2025\/09\/Europos-superkompiuteris-Jupiter-Forschungszentrum-Julich-Sascha-Kreklau-scaled.jpeg","_links":{"self":[{"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/posts\/8483","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/comments?post=8483"}],"version-history":[{"count":2,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/posts\/8483\/revisions"}],"predecessor-version":[{"id":8488,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/posts\/8483\/revisions\/8488"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/media\/8486"}],"wp:attachment":[{"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/media?parent=8483"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/categories?post=8483"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mokslosriuba.lt\/kartumesgalime\/wp-json\/wp\/v2\/tags?post=8483"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}