DEBATT:

DATARESSURSER: Det å investere i dataressurser skiller klinten fra hveten, da det er det som er nøkkelen til AI-suksess, skriver Sven Sunde i AWS. (Illustrasjon: Istock)

Data er nøkkelen til den generative AI-revolusjonen

Generativ kunstig intelligens er det mest spennende som har skjedd innen teknologi på lang tid. Avanserte modeller skaper tekst, bilder, koder og mye mer. Men bak de imponerende prestasjonene ligger en solid datagrunnmur. Det er denne muren som gjør generativ kunstig intelligens i det hele tatt mulig.

Publisert Sist oppdatert

Selv om det er generativ kunstig intelligens som stjeler overskriftene, er det de store mengdene nøye selektert og organisert data som driver teknologien fremover. Data som er helt avgjørende for at modellene skal kunne lære, forstå og skape nytt innhold. Akkurat som den synlige delen av et isfjell bare er en liten del av totalvolumet, er dataressursene og infrastrukturen som støtter kunstig intelligens nødvendig for å realisere potensialet i kunstig intelligens. Altså det du ikke ser.

En undersøkelse gjennomført av Thomas H. Davenport, Randy Bean og Richard Wang i samarbeid med Amazon Web Services, viser at 93 prosent av it-ansvarlige mener datastrategi er avgjørende for å få verdi ut av generativ kunstig intelligens. Samtidig viser den samme undersøkelsen at 57 prosent faktisk mangler en slik strategi. Bedrifter og organisasjoner som ikke investerer i omfattende og godt kuraterte dataressurser, vil raskt sakke akterut. De som derimot har dette på plass vil kunne utvikle kraftige AI-systemer som forbedrer og åpner opp for nye forretningsmodeller.

Ledere må forstå at datakvalitet, mangfold og styring er alfa og omega for vellykkede AI-initiativer. Det å investere i robuste dataprosesser er ikke lenger et valg, men en nødvendighet. Men for å utnytte data som en strategisk ressurs, må den behandles som et produkt. Ikke minst må det fremmes en kultur for etisk og ansvarlig databehandling.

I praksis betyr det å ha på plass klare styringsstrukturer og dedikerte ressurser for å sikre at data blir relevant og verdifull over tid. Mangfoldige datasett er også nødvendig. Det for å skape rettferdige og inkluderende AI-systemer for å motvirke skjevheter og ikke minst for å reflektere mangfoldet i dataene de er trent på.

Selv om det er generativ kunstig intelligens som stjeler overskriftene, er det det store mengdene nøye selektert og organisert data som driver teknologien fremover.

Effektiv datastyring balanserer mellom å beskytte dataressursene og produktiv bruk av dem. Fremfor restriktive prosesser bør moderne datastyring fokusere på tilgjengelighet i kombinasjon med at sikkerhet og personvern opprettholdes. Omfattende og tilgjengelig dokumentasjon er viktig for å gi brukerne tydelig informasjon om dataenes egenskaper og begrensninger.

For er det en ting som er sikkert, så er det at datakvalitet er kritisk for generativ kunstig intelligens. Feil eller inkonsekvenser kan påvirke ytelsen betraktelig. Robuste datavalideringsprosesser, menneskelig gjennomgang og kontinuerlig overvåking er nødvendig for sikre høy datakvalitet. Ikke minst må forskrifter overholdes, og konfidensiell informasjon må beskyttes.

Den generative AI-reisen krever en godt utformet datastrategi. Ved å prioritere datarelevans, bygge fleksible arkitekturer og sikre høy datakvalitet, kan teknologiens potensial utnyttes. Det å investere i dataressurser skiller klinten fra hveten, da det er det som er nøkkelen til AI-suksess.