16.3.2023 10:39

Spjallmennið lærir íslensku

Sögulegur áfangi hefur náðst skref fyrir skref fyrir íslenskuna í stafræna heiminum. Í Morgunblaðinu í morgun (16. mars) ræðir Guðmundur Magnússon við spjallmennið ChatGPT sem segist spennt að læra íslensku

Haustið 1998 var verkefni í tungutækni hrundið af stað og Rögnvaldur Ólafsson eðlisfræðingur ráðinn af menntamálaráðuneytinu til að kanna stöðu tungunnar með tilliti til upplýsingatækninnar. Hann fékk Eirík Rögnvaldsson, íslenskuprófessor við Háskóla Íslands, og Þorgeir Sigurðsson, rafmagnsverkfræðing og íslenskufræðing, hjá Staðlaráði Íslands til liðs við sig. Sömdu þeir skýrslu, sem menntamálaráðuneytið gaf út í apríl 1999.

OIP-2-

30. nóvember 2004 var efnt til ráðstefnu um framvindu þessa verkefnis, en því lauk þá um áramótin. Þar gerði Rögnvaldur meðal annars grein fyrir því, hvernig að málum hefði verið staðið. Hann sagði á grundvelli skýrslunnar frá 1999 hefði verið ráðist í tungutækniátak til þess að tryggja stöðu íslenskrar tungu í upplýsingaþjóðfélaginu. Það var á fjórum sviðum: (1) lagður var grunnur að sameiginlegum gagnasöfnum, málsöfnum, sem gætu nýst fyrirtækjum sem hráefni í afurðir; (2) hagnýtar rannsóknir á sviði tungutækni voru styrktar; (3) einkafyrirtæki yrðu styrkt til þess að þróa afurðir tungutækni og (4) menntun á sviði tungutækni og málvísinda var efld. Var veitt fé úr ríkissjóði í þessu skyni.

Rögnvaldur sagði 30. nóvember 2004 að tilgangur tungutækniverkefnisins væri í stuttu máli að leggja grunn að þessari tækni hér á landi með þekkingu á viðfangsefninu og gagnagrunnum til þess að að nýta mætti íslenskt mál, bæði ritað og mælt í nýjustu samskipta- og tölvutækni. Árið 1998 hefði verið lítil sem engin þekking hér en í lok árs 2004 hefði ákveðnum áföngum verið náð og ætti tungutæknin þá að verða sjálfbær án sérstaks stuðnings en gæti sótt um styrki í almenna styrkjakerfið til rannsókna og þróunar.

Um aldamótin skipaði menntamálaráðuneytið verkefnisstjórn til þess að koma með tillögur að ráðstöfun fjár til tungutækniverkefna undir formennsku Ara Arnalds verkfræðings. Að tillögu hennar varð til meistaranám í tungutækni við Háskóla Íslands og lögð áhersla á stuðning við fyrirtæki og stofnanir vegna þróunar tungutækni, það er við uppbyggingu texta- og talmálsgrunna, og hagnýt verkefni sem ætla má að skili sér í markaðshæfri vöru.

Allt þetta starf nýtist nú um 20 til 25 árum síðar þegar íslenska máltæknifyrirtækið Miðeind gegnir lykilhlutverki í samstarfi við bandaríska fyrirtækið Open A1, útgefanda spjallmennisins ChatGPT, sem slegið hefur í gegn hjá milljónum notenda um allan heim.

Sem notandi Bing.com leitarkerfisins sem styðst við ChatGPT veit ég að það talar góða íslensku og svarar spurningum á íslensku. Fyrir nokkru lagði ég spurningu á íslensku fyrir Bing um mjög sérgreint viðgangsefni og svarið barst á íslensku á innan við 10 sekúndum. Sparaði það leitartíma eftir „gömlu Google-aðferðinni“.

Sögulegur áfangi hefur náðst skref fyrir skref fyrir íslenskuna í stafræna heiminum. Í Morgunblaðinu í morgun (16. mars) ræðir Guðmundur Magnússon við spjallmennið ChatGPT sem segist spennt að læra íslensku. Er unnt að fagna meiru fyrir íslenskunnar hönd á fyrstu lífvikum spjallmennis sem slær í gegn af meiri þunga en nokkur önnur nýjung á þessu sviði?