DEBATT:
Norge må satse på egne språkmodeller
Nasjonale løsninger må til for å sikre innbyggernes rettigheter i møte med kunstig intelligens.
Generativ kunstig intelligens kan automatisere og effektivisere ensformig skrivearbeid, og mange arbeidsoppgaver vil bli endret. Dette vil også få konsekvenser for den norske språksituasjonen. Premissene for hvordan tekst skal se ut, flyttes fra dem som skriver, til dem som leverer de generative KI-produktene vi bruker. Flernasjonale selskaper som OpenAI og Meta utfordrer den demokratiske kontrollen over det norske språket og samtidig den enkeltes frihet til å uttrykke seg slik hen ønsker.
En uholdbar utvikling
Selv om tekstrobotene skriver tilsynelatende god hverdagsnorsk, er det flere problematiske sider ved produktene de internasjonale storselskapene tilbyr, slik som ChatGPT, Claude og NotebookLM. Utfordringene med personvern, nasjonal digital autonomi, opphavsrett, lukkede modeller som ikke er etterrettelige, og kulturelle skjevheter (bias) er etter hvert velkjente. I tillegg kommer språklige utfordringer når vi overlater språklige valg og beslutninger til internasjonale storselskaper med modeller som er trent i hovedsak på engelskspråklig tekst:
• Modellene verken forstår eller produserer korrekt og oppdatert fagterminologi på mange fagfelt.
• Modellene velger ofte de statistisk vanligste ordformene, og for brukerne av tekstroboter blir den reelle muligheten til å velge mindre vanlige former (boka/boken, fram/frem osv.) utfordret.
• Teknologikjempene tar ikke hensyn til oppdaterte, demokratisk fastsatte rettskrivingsregler og standarder for god språklig kvalitet.
• De store internasjonale aktørene nedprioriterer nynorsk i utviklingen av produktene sine. Slik diskrimineres alle som foretrekker det ene av våre to likestilte norske skriftspråk.
Slik blir kontrollen over og eierskapet til det norske språket utfordret. Når språket som brukes, blir «smalere» og mer ensrettet, og engelsk fagspråk stadig mer tar over for norsk, vil færre innbyggere oppleve å få møte og bruke språket sitt. Vi mener at summen av dagens språklige og ikke-språklige utfordringer er uholdbar.
Hurtig satsing på nasjonale løsninger
Staten har en ambisjon om at 80 prosent av offentlige virksomheter skal benytte KI innen 2025. Om dette målet skal nås på en god måte, må KI-produktene som brukes oppfylle grunnleggende kvalitetskrav til språk og innhold.
Det gjør ikke modellene fra de internasjonale teknologiselskapene i dag. Derfor må satsingen på nasjonale alternative løsninger komme i gang raskt. Det har allerede dukket opp initiativer for å bygge en helhetlig infrastruktur for språkteknologi i miljøer som NORA.ai og NorwAI, men disse initiativene hviler enn så lenge på engasjerte forskningsmiljøer. I fremtiden bør slik infrastruktur være sterkere forankret i fellesskapet. Teknologirådet anbefaler i sin ferske rapport om generativ KI i Norge blant annet at
• det må sikres tilgang til gode norske treningsdata, slik også Riksrevisjonen anbefaler i sin rapport om Bruk av kunstig intelligens i staten
• norske språkmodeller bør tilbys som en nasjonal fellestjeneste
• det må stilles kvalitetskrav til norske språkmodeller
Språkrådet stiller seg bak disse anbefalingene. Språklige kvalitetskrav og kvalitetskontroll må bli en sentral del av satsingen på språkmodeller, slik at vi sikrer et språkteknologisk økosystem der offentlig sektor enkelt kan følge den vedtatte språkpolitikken og bruke norsk språk på en god måte. Hvis vi ikke har tillitvekkende norsk språkteknologi som dekker behovene til språkbrukerne, risikerer vi et skifte til engelsk i flere situasjoner.
KI-toget ruller
Samtidig som vi satser på nasjonale initiativer, må vi på kort sikt ta inn over oss at KI-toget allerede durer av gårde i en rasende fart. Teknologikjempenes produkter er såpass imponerende at nordmenn kommer til å bruke dem. Vi må ha en opplyst debatt om hva disse modellene kan og ikke kan, hvilke språklige begrensninger de har, og hvilke risikoer virksomheter som har språklige plikter, løper ved å bruke dem.
Det viktigste vi kan gjøre, er likevel å komme i gang med en storsatsing på en nasjonal infrastruktur for språkmodeller og språkteknologi så raskt som mulig. Vi har ikke tid til å vente og håpe at det ordner seg. Det kan føre til at vi mister kontrollen – også over språket vårt.