Ís­lenska mál­tækni­fyrir­tækið Mið­eind hefur að undan­förnu verið í sam­starfi við banda­ríska gervi­greindar­fyrir­tækið OpenAI. Mark­mið verk­efnisins er að styðja betur við ís­lensku í næstu kyn­slóð gervi­greindar­líkana frá fyrir­tækinu, GPT-4, sem kynnt var á heims­vísu rétt í þessu og er fjallað um ítar­lega á vef New York Times.

Katla Ás­geirs­dóttir við­skipta­þróunar­stjóri hjá Mið­eind segir verk­efnið marka tíma­mót í sögu risa­mállík­ana OpenAI þar sem þetta er í fyrsta skipti sem gerð eru til­raun með sér­staka þjálfun líkans á öðru tungu­máli en ensku.

Svona getur forritið svarað þér.
Mynd/Miðeind

Kann ýmislegt í íslensku

Hún segir að flestir sem þekki til kannist við OpenAI og þeirra gervi­greindar­lausna sem fyrir­tækið hefur kynnt til sögunnar síðustu misseri. Þar er helst að nefna DALL·E og Chat­GPT sem hafa slegið í gegn hjá milljónum not­enda um allan heim, þar á meðal á Ís­landi.

„Glöggir not­endur gætu hafa tekið eftir því að spjall­mennið Chat­GPT kann ýmis­legt fyrir sér í ís­lensku þrátt fyrir að hafa að­eins verið mark­visst þjálfað í ensku hingað til,“ segir Katla og að við þróun nýjustu af­urðar sinnar, GPT-4, sem kynnt er í dag, hafi OpenAI í fyrsta skipti gert til­raunir með sér­staka þjálfun risa­mállík­ans síns á öðru tungu­máli en ensku, og þar varð ís­lenska fyrir valinu.

„Við erum auð­vitað í skýjunum með þetta sam­starf og það ó­trú­lega tæki­færi sem ís­lenskan hefur fengið fyrst allra tungu­mála í heiminum, utan ensku. Það er bæði heiður og á­byrgðar­hlut­verk að sinna þessu verk­efni. Eðli­lega á ís­lenskan nokkuð í land í saman­burði við ensku og önnur stærri tungu­mál, enda er hlut­falls­lega lítið til af staf­rænum texta á ís­lensku til að þjálfa líkanið á. Það er engu að síður stór­kost­legt að sjá hvað GPT-4 mállík­anið skilur ís­lenskuna vel, þó að það eigi stundum í erfið­leikum með að mynda mál­fræði­lega hefð­bundnar eða réttar setningar á henni. Þessi veg­ferð er rétt að hefjast og við megum svo sannar­lega vera þakk­lát fyrir þetta ein­staka tæki­færi til að bæta stöðu ís­lenskunnar í staf­rænu um­hverfi,“ segir Katla.

Vilhjálmur Þorsteinsson framkvæmdastjóri Miðeindar.
Fréttablaðið/Aðsend

Hófst með heimsókn

Hún segir að sam­starf fyrir­tækjanna hafi hafist í kjöl­far heim­sóknar for­seta Ís­lands í Kísil­dal [e. Silicon Vall­ey] í maí í fyrra þar sem höfuð­stöðvar OpenAI voru meðal annars heim­sóttar. Þá funduðu þau með Sam Alt­man, for­stjóra fyrir­tækisins. Með for­setanum í för var sendi­nefnd skipuð Lilju D. Al­freðs­dóttur, menningar- og við­skipta­ráð­herra, Vil­hjálmi Þor­steins­syni, fram­kvæmda­stjóra Mið­eindar, og fleiri full­trúum mál­tækni­sam­fé­lagsins á Ís­landi.

„Það hefur verið af­skap­lega skemmti­legt að vinna með OpenAI í þessu spennandi verk­efni. Maður hefur eigin­lega þurft að klípa sig í hand­legginn nokkrum sinnum til að minna sig á að við séum raun­veru­lega að þjálfa næstu kyn­slóð gervi­greindar­líkansins GPT-4 fyrir ís­lensku, eitt tungu­mála utan ensku. Gervi­greindar­tækni hefur tekið stór­stígum fram­förum undan­farið og á eftir að hafa mikil á­hrif. Þess vegna skiptir miklu máli að minni tungu­mál á borð við ís­lenskuna séu með í þróuninni og að hægt verði að njóta þeirra tæki­færa sem þarna eru að skapast, á okkar eigin tungu­máli“, segir Vil­hjálmur Þor­steins­son, fram­kvæmda­stjóri Mið­eindar.