Íslenska máltæknifyrirtækið Miðeind hefur að undanförnu verið í samstarfi við bandaríska gervigreindarfyrirtækið OpenAI. Markmið verkefnisins er að styðja betur við íslensku í næstu kynslóð gervigreindarlíkana frá fyrirtækinu, GPT-4, sem kynnt var á heimsvísu rétt í þessu og er fjallað um ítarlega á vef New York Times.
Katla Ásgeirsdóttir viðskiptaþróunarstjóri hjá Miðeind segir verkefnið marka tímamót í sögu risamállíkana OpenAI þar sem þetta er í fyrsta skipti sem gerð eru tilraun með sérstaka þjálfun líkans á öðru tungumáli en ensku.

Kann ýmislegt í íslensku
Hún segir að flestir sem þekki til kannist við OpenAI og þeirra gervigreindarlausna sem fyrirtækið hefur kynnt til sögunnar síðustu misseri. Þar er helst að nefna DALL·E og ChatGPT sem hafa slegið í gegn hjá milljónum notenda um allan heim, þar á meðal á Íslandi.
„Glöggir notendur gætu hafa tekið eftir því að spjallmennið ChatGPT kann ýmislegt fyrir sér í íslensku þrátt fyrir að hafa aðeins verið markvisst þjálfað í ensku hingað til,“ segir Katla og að við þróun nýjustu afurðar sinnar, GPT-4, sem kynnt er í dag, hafi OpenAI í fyrsta skipti gert tilraunir með sérstaka þjálfun risamállíkans síns á öðru tungumáli en ensku, og þar varð íslenska fyrir valinu.
„Við erum auðvitað í skýjunum með þetta samstarf og það ótrúlega tækifæri sem íslenskan hefur fengið fyrst allra tungumála í heiminum, utan ensku. Það er bæði heiður og ábyrgðarhlutverk að sinna þessu verkefni. Eðlilega á íslenskan nokkuð í land í samanburði við ensku og önnur stærri tungumál, enda er hlutfallslega lítið til af stafrænum texta á íslensku til að þjálfa líkanið á. Það er engu að síður stórkostlegt að sjá hvað GPT-4 mállíkanið skilur íslenskuna vel, þó að það eigi stundum í erfiðleikum með að mynda málfræðilega hefðbundnar eða réttar setningar á henni. Þessi vegferð er rétt að hefjast og við megum svo sannarlega vera þakklát fyrir þetta einstaka tækifæri til að bæta stöðu íslenskunnar í stafrænu umhverfi,“ segir Katla.

Hófst með heimsókn
Hún segir að samstarf fyrirtækjanna hafi hafist í kjölfar heimsóknar forseta Íslands í Kísildal [e. Silicon Valley] í maí í fyrra þar sem höfuðstöðvar OpenAI voru meðal annars heimsóttar. Þá funduðu þau með Sam Altman, forstjóra fyrirtækisins. Með forsetanum í för var sendinefnd skipuð Lilju D. Alfreðsdóttur, menningar- og viðskiptaráðherra, Vilhjálmi Þorsteinssyni, framkvæmdastjóra Miðeindar, og fleiri fulltrúum máltæknisamfélagsins á Íslandi.
„Það hefur verið afskaplega skemmtilegt að vinna með OpenAI í þessu spennandi verkefni. Maður hefur eiginlega þurft að klípa sig í handlegginn nokkrum sinnum til að minna sig á að við séum raunverulega að þjálfa næstu kynslóð gervigreindarlíkansins GPT-4 fyrir íslensku, eitt tungumála utan ensku. Gervigreindartækni hefur tekið stórstígum framförum undanfarið og á eftir að hafa mikil áhrif. Þess vegna skiptir miklu máli að minni tungumál á borð við íslenskuna séu með í þróuninni og að hægt verði að njóta þeirra tækifæra sem þarna eru að skapast, á okkar eigin tungumáli“, segir Vilhjálmur Þorsteinsson, framkvæmdastjóri Miðeindar.