Guide
Vurder behovet for KI
Denne veilederen tar deg gjennom stegene teamet bør vurdere for å kunne si ja eller nei til å bruke KI.
Denne veilederen er ment for produktteam i Nav som har et ønske å ta i bruk Kunstig Intelligens (KI) for å løse en utfordring teamet har støtt på.
Før man går i gang med å vurdere personvernkonsekvenser eller velger modell må man først gjøre en ordentlig vurdering om at KI er det riktige verktøyet for å løse problemet.
Kjennetegn for problemer som egner seg for KI
I Nav opererer vi med 5 kjennetegn for problemer/utfordringer som egner seg for KI:
Hvis svaret er Ja til alle disse kjennetegnene burde teamet gå videre med å undersøke bruken av KI. Hvis svaret er Nei til en eller flere anbefaler vi at dere prøver å løse problemet på andre måter enn å benytte KI.
1. Det er vanskelig å løse med regelbaserte systemer
Regelbaserte systemer fungerer godt til å løse problemer vi vet nøyaktig hvordan skal løses. Men det finnes problemer der en sannsynlighetsbasert tilnærming kan være riktig, for eksempel det å skulle vekte flere ulike faktorer og gi en anbefaling basert på dette.
2. Så store volum at det er for krevende å behandle manuelt
Hvis problemet som skal løses oppstår ofte så kan det være mer hensiktsmessig å automatisere/effektivisere problemløsninga. Et annet eksempel kan være hvis manuel behandling vil kreve så mye tid at automatisering vil kunne være en stor besparelse.
Hvis problemet som skal løses kan behandles av et lite antall mennesker i et begrenset tidsrom uten at det gjentar seg for ofte vil dette ofte være mer hensiktsmessig å løse ved hjelp av manuel behandling.
3. Relativt isolert
KI-modeller fungerer best på problemer som er tydelig definerte, dette gjelder også generativ KI (GKI). For at KI-modeller skal bli best mulige så må de ha et tydelig mål, som kan være det å være best mulig på å predikere overgang til arbeid. Ulempen er at modellen ikke er brukbar til noe annet, f.eks. å predikere sannsynlighet for sykefravær. For GKI-tjenester ser vi at de blir mye bedre hvis de blir spesialisert til å løse konkrete oppgaver.
4. Historikk som representerer dagens situasjon
For å kunne trene KI-modeller trenger man data slik at modellen kan tilpasses. For at behandlingen av bruker skal være rettferdig må data som legges til grunn representere dagens situasjon. Hvis dette ikke er tilfellet vil modellen kunne få slagside som i ytterste konsekvens kan lede til diskriminering og feilbehandling.
5. Det går bra å predikere feil
Ved å benytte KI på isolerte områder er det ofte akseptabelt at utfallet av modellen kan gi feil utslag i et begrenset antall. Hvis dette ikke er tilfellet anbefales det på det sterkeste å ikke bruke KI.
Ved vurdering om rett til ytelse eller annen beregning som får direkte konsekvenser for ytelse til bruker vil det være lite handlingsrom for å benytte KI.
Kartlegge data
Det første steget man må gjennom før man kan si noe om man har behandlingsgrunnlag for å bruke KI er å kartlegge tilgjengelig data. Dette må gjøres slik at du kan si noe om hvilken type data (inneholder data personopplysninger for eksempel) du må ha behandlingsgrunnlag for.
Tilgjengelig data kan bety så mangt, men i de fleste tilfeller så vil man være interessert i data som teamet ditt allerede samler inn i forbindelse med vurdering av rett til ytelse eller annen utøvelse av Nav sin myndighet.
Første steg
Vi anbefaler at dere kartlegger tilgjengelige dataelementer, f.eks. kolonner i databaser, og lager en oversikt både for dere og for etterlevelse. Oversikten burde inneholde litt informasjon om hvor data kommer fra, referanse til eksisterende behandlingsgrunnlag og hvilken nytte man ser for seg i en KI modell.
Basert på de kartlagte elementene så kan man samle metadata direkte fra databasen (f.eks. ved SELECT COUNT(*) FROM <tabell navn>
). Grovt sagt så kan man gjøre en del SQL operasjoner for å hente metadata, men hvis det er behov for å “laste ned til Pandas” så må man dokumentere dette, som beskrevet i neste seksjon.
Eksempler på SQL operasjoner man kan gjøre uten videre:
Hvis operasjonen du ønsker å utføre krever å koble sammen flere tabeller og gjøre større analyser anbefaler vi at man følger neste skritt.
Innsikt i data
Før man går i gang med å vurdere behandlingsgrunnlag for å trene KI modeller på data anbefaler vi at dere først skaffer en oversikt over dataene. For dette innsiktarbeidet er det de samme kravene som gjelder ellers i Nav. Man må fylle ut etterlevelseskrav, behandlinger i behandlingskatalogen og PVK.
I de fleste tilfeller så burde man ha behandlingsgrunnlag for å lage deskriptive analyser. Det er fordi vi antar at teamet ditt har behandlingsgrunnlag for å innhente opplysningene. Og dermed har teamet også behandlingsgrunnlag for å gjøre deskriptive analyser for å forstå egne data.
§ Det vanligste behandlingsgrunnlaget i denne fasen
Hva kan vi typisk gjøre uten noe større forarbeid?
Hva kan vi ikke uten videre gjøre?
Eksempler i Nav
Når det kommer å dokumentere behandlingsgrunnlag for innsiktarbeid er det heldigvis flere flotte eksempler i Nav.
Eksempel på behandlinger:
Eksempel på etterlevelseskrav:
Eksempel på PVK:
Medvirkende