Møter Big Data med regler fra '95
Datatilsynet er ikke mot trenden Big Data, men mener den snart 20 år gamle personvernloven fortsatt holder koken.
I går kom Datatilsynet med en rapport om Big Data. «Personvernprinsipper under press», er undertittelen.
- Som så mange andre er vi opptatte av Big Data og hva fenomenet gjør med personvernet, sier Bjørn Erik Thon, direktør i tilsynet.
Han ser særlig to motsetninger. Det mest åpenbare er at personvern handler om registrering av minst mulig data, mens Big Data handler om registrering av mest mulig data. Det andre er at personvern handler om å ikke bruke data til andre formål enn de er samlet inn til, mens Big Data handler om å bruke gamle data til nye formål.
- Vi er enige i at det er mange gode ting man kan bruke Big Data til, både samfunnsmessig og samfunnsnyttig. Da handler det om å finne ut hvordan man skal håndtere dette her, sier Thon.
- Ikke utdatert
Han fremhever at personopplysninger først blir problematisk hvis de kan knyttes til enkeltpersoner.
- Det er sånn vi må tenke i Big Data-verdenen, vi må jobbe mye mer med anonymisering. Der er vi ikke i mål ennå, mener han.
Han fremhever også at folk har eiendomsrett til sine data, at de kan kreve innsyn, kreve dataene slettet og be om at dataene flyttes.
Det er en del som argumenterer med at dagens norske personvernregler, som er laget ut fra et EØS-direktiv i 1995, er utdatert og må oppdateres. Datatilsynet er uenig, og mener prinsippene i regelverket kan stå som de er.
- Vi mener vi har et godt regelverk med gode prinsipper, sier Thon.
«I en tid der stadig flere opplysninger om oss samles inn er det viktigere enn noen gagn å verne om grunnleggende personvernprinsipper. Prinsipppene er vår garanti mot å bli gjort til gjenstand for profilering i stadig nye og flere sammenhenger,» heter det i rapportens oppsummering.
Forstår argumentasjonen, men ...
Jørgen Skorstad fra tilsynet, som har vært med på å skrive rapportens fjerde kapittel, utdyper:
- I 1995 var situasjonen en ganske annen enn i dag sett fra et teknologisk perspektiv. Derfor vil reglene som regulerer elektronisk behandling av personopplysninger kunne hevdes å være for gammel - internett var jo ikke så langt fremme i tankene da direktivet ble laget, begynner han.
At de som vil drive med Big Data-analyse eller innsamling av data til dette formålet derfor mener dagens regelverk er utdatert, er en argumentasjon han kan forstå.
- Jeg tror mange av kritikerne som etterlyser endringer i lovverket nok er amerikanske selskaper som ser at europeiske regelverk oppstiller noen hindre de ikke er vant til å forholde seg til, ettersom de tar utgangspunkt i amerikanske regler, sier Skorstad.
- Vi mener regelverket vi har gir uttrykk for en del sentrale prinsipper som fremdeles har gyldighet, og det snakker vi en del om i rapporten. Slik som formålsbegrensningsrinsippet og prinsippet om gjennomsiktighet og åpenhet.
Anonymiseres skikkelig
Ettersom Datatilsynet samtidig erkjenner at Big Data kan ha en samfunnsnyttig oppside, er de innstilt på å bidra til å løse noen av problemene lovens strenge rammer gir i sammenhengen. Skorstad fremhever nettopp anonymisering som en nyttig metode.
- Anonymiserer man dataene, har man et friere spillerom. Da er man utenfor regelverket som skal beskytte personopplysninger, og over i et område som ikke er lovregulert i samme grad, påpeker han.
Samtidig er det viktig at saker og ting anonymiseres på riktig vis. For etter hvert som verktøyene blir bedre, vil det åpne seg muligheter for å reidentifisere individer basert på mønstrene som analysesystemene finner.
- Men om dataene anonymiseres på ordentlig måte, får man friere hender.
Ti sentrale personvernutfordringer:
Her er rapportens oppsummerte sentrale personvernutfordinger knyttet til Big Data:
1. Bruk av data til nye formål: Big Data handler i stor grad om gjenbruk av data. Dette utfordrer personvernprinsippet om formålsbegrensning. I henhold til dette prinsippet må virksomheter som benytter innsamlede personopplysninger som grunnlag for prediktiv analyse, forsikre seg om at prediksjonsanalysen ikke er uforenlig med det opprinnelige innsamlingsformålet. Dette kan innebære en betydelig utfordring for kommersiell Big Data-analyse.
2. Datamaksimalisering: Big data innebærer et nytt syn på data, der data får en verdi i seg selv. Verdien ligger i dataenes fremtidige bruksmuligheter Et slikt syn på data påvirker virksomhetenes ønske om og motivasjon til å slette data. Verken private eller offentlige virksomheter vil ønske å slette data som på et senere tidspunkt, og sammenstilt med andre datasett, kan vise seg å bringe ny innsikt og penger.
3. Mangel på åpenhet: Mangel på åpenhet og informasjon om hvordan data benyttes og sammenstilles kan føre til at vi blir offer for beslutninger vi ikke forstår og ikke har kontroll over. Den alminnelige internettbruker har for eksempel liten innsikt i hvordan personopplysninger samles inn og utnyttes av kommers ielle interesser. Flere av aktørene som opererer i dette markedet er i tillegg ukjente for folk flest.
4. Sammenstilling kan frembringe sensitiv informasjon: En utfordring ved Big Data-analyse er at innsamlede opplysninger som hver for seg ikke er sensitive, gjennom sammenstilling kan gi et sensitivt resultat. Det er viktig at virksomheter som benytter Big Data er kjent med denne problemstillingen, og ikke utvikler algoritmer som kan komme til å avsløre vitale personverninteresser.
5. Risiko for reidentifisering: En av de virkelig store utfordringene ved Big Data-analyse er risikoen for reidentifisering. Gjennom sammenstilling av data fra flere kilder kan det oppstå risiko for at enkeltindivider kan identifiseres fra i utgangspunktet anonyme datasett. Dette gjør anonymisering som metode for å hindre personvernulemper ved profilering og annen dataanalyse mindre virkningsfull.
6. Ubalanse virksomhet – individ: Big Data øker ubalansen mellom de store virksomhetene på den ene side og enkeltindividet på den andre. Det er virksomhetene som samler inn personopplysninger som henter ut den stadig voksende merverdien som ligger i analyse og bearbeiding av disse opplysningene, og ikke vi som avgir opplysningene. Snarere kan denne transaksjonen være til vår ulempe i den forstand at den kan utsette oss for fremtidig sårbarhet.
7. Feil faktagrunnlag: Det er et viktig personvernprinsipp at beslutninger som får konsekvenser for den enkelte skal være basert på korrekte opplysninger. En svakhet ved Big Data-analyse er at den ofte ikke tar hensyn til kontekst. Å basere beslutninger på opplysninger som er tiltenkt andre formål kan gi resultater som ikke samsvarer med den faktiske situasjonen.
8. Datadeterminisme: Utstrakt bruk av automatiserte avgjørelser og prediksjonsanalyse kan befeste eksisterende fordommer og forsterke sosial ekskludering og lagdeling. En utvikling der stadig flere beslutninger i samfunnet blir tatt basert på algoritmer, kan lede til et ”dataenes diktatur”; vi blir ikke vurdert ut fra hva vi faktisk foretar oss, men på basis av hva alle dataene om oss sier at vi sannsynligvis kan komme til å gjøre.
9. Nedkjølingseffekt: Hvis alle sporene vi etterlater oss, på Internett og andre steder, blir brukt til stadig nye og for oss ukjente formål, kan dette legge bånd på hvordan vi deltar i samfunnet. Uklarhet og usikkerhet knyttet til myndighetenes bruk av Big Data kan true tillitt en vi har til myndighetene. Utstrakt bruk av Big Data, kan i verste fall ha en nedkjølende effekt på ytringsfriheten hvis premissene rundt bruken er holdt skjult og ikke er etterprøvbar.
10. ”Ekkokamre”: Med økt personalisering av nettet vil den enkelte i stadig mindre grad bli eksponert for meninger som avviker fra deres egne. Dette vil kunne påvirke rammebetingelsene for offentlig debatt og meningsbryting. Dette er ikke i første rekke en personvernutfordring, men en samfunnsutfordring.
Råd fra tilsynet
Videre heter det i rapporten: «Selv om Big Data reiser flere personvernutfordringer, er det mulig å benytte denne analyseformen og samtidig respektere personvernet til den enkelte. I rapporten gir vi blant annet følgende anbefalinger:
- Behandling av personopplysninger skal som hovedregel baseres på samtykke. Hvis det ikke er mulig eller ønskelig å benytte samtykke, bør opplysningene anonymiseres.
- Gode rutiner for anonymisering og avidentifisering av opplysningene er av stor betydning. Dette vil bidra til å redusere faren for reidentifisering.
- Big Data bør brukes etter prinsippene for innebygd personvern.(Red.anm.: Les også
- Vi må tenke innebygget personvern) - Virksomheter som benytter Big Data må være åpne om hvordan de behandler personopplysningene de samler inn. Dette innebærer blant annet å gi den enkelte innsyn i hvilke beslutningskriterier (algoritmer) som ligger til grunn for utvikling av profiler, og fra hvilke kilder opplysningene er hentet
- Den enkelte bør gis mulighet til å få utlevert alle data virksomheten besitter om en i et brukervennlig format. Dataportabilitet vil hindre at kunder låses til tjenester som har uakseptable vilkår.
Les hele rapporten her.