16.11.2023 9:45

Tæknivæðing íslenskunnar

Ritað íslenskt mál er eitt og virðing við notkun þess. Það þyrfti að finna leið til að gefið sé hljóðmerki þegar slett er ensku í talmáli útvarpsstöðvanna. 

Um nokkurt skeið hefur höfundur þessarar vefsíðu stuðst við ai.yfirlestur.is, sjálfvirka textaleiðréttingu frá Miðeind, við frágang texta á síðuna. Villum hefur vafalaust stórfækkað frá því sem áður var. Gervigreind Miðeindar nýtir sér ekki aðeins ritvillur heldur bendir hún á margt annað sem má betur fara. Nær undantekningarlaust er það til bóta og skerpir samtímis athygli höfundar og hvetur hann til nákvæmni.

Hér er lagt til að í tilefni af degi íslenskrar tungu, 16. nóvember 2023, skyldi ritstjórar vefsíðna starfsmenn sína til að láta þetta forrit renna yfir texta áður en þeir birtast á netinu. Betri afmælisgjöf fyrir höfunda og lesendur er vandfundin.

AI, skammstöfunin yfir gervigreind, hefur unnið sér alþjóðlegan sess. Skammstafanir verða stundum einfaldlega tákn fyrir eitthvað sem erfitt er að skýra og þarf í raun ekki að skýra heldur aðeins að nota. Íslenska orðið gervigreind er vissulega gagnsætt en segir í raun ekki neitt um fjölnota verkfærið sem tæknin hefur fært okkur með vaxandi þunga á þessu ári.

Download-3-_1700127885494

Í tilefni af 16. nóvember 2023 sendi Miðeind frá sér tilkynningu þar sem segir:

„Í síðustu viku rúlluðu vinir okkar hjá OpenAI út nýrri, spennandi virkni fyrir GPT-líkön þeirra – Assistant API. Eins og OpenAI sjáum við hjá Miðeind mikla möguleika í sérsniðnum samtalsþjónum sem nálgast upplýsingar úr fyrirliggjandi gagnagrunnum og nota þær til að mynda greinargóð svör á náttúrulegu máli. Þess vegna höfum við unnið síðustu misseri að okkar eigin spennandi lausn sem hlotið hefur nafnið Svarkur og er sérstaklega sniðin að íslensku máli, sérkennum þess og áskorunum. Svarkur notar sérþjálfað greypingalíkan (e. embeddings model) Miðeindar fyrir íslensku til að finna þær upplýsingar í gagnagrunni sem best svara spurningu notanda, og skila þeim á samandregnu og skýru formi. Svarkur er í boði í gegnum forritaskil (e. API) eða sem viðbót við öfluga leitar- og spurningasvörunarlausn samstarfsaðila okkar Cludo, sem jafnframt státar af aðlaðandi viðmóti og háþróuðum greiningartólum.

Í tilefni af Degi íslenskrar tungu höfum við sett saman stutt myndband, byggt á innanhússútgáfu Svarks, til að sýna getu verkfærisins og gefa innsýn í það sem koma skal.“

Allt er þetta á íslensku en lýst er tækni sem kunnáttu þarf til að skilja og þjálfun til að nýta. Svarkur er íslensk „leitar- og spurningasvörunarlausn“ sem virðist sambærileg við Bard hjá Google eða Bing hjá Microsoft, sé þetta rétt skilið. Íslenskan öðlast með öðrum orðum enn traustari sess í þessum nýja heimi.

Ritað íslenskt mál er eitt og virðing við notkun þess. Það þyrfti að finna leið til að gefið sé hljóðmerki þegar slett er ensku í talmáli útvarpsstöðvanna. Þá heyrðist örugglega oft píp í menningar-samtalsþáttum ríkissjónvarpsins og Rásar 1 sem hafa sérstökum lögbundnum skyldum að gegna í þágu íslenskunnar. Pípið yrði áminning um vandaðra málfar og skrá mætti tíðni þess og birta.