Gå til innhold

2. Hva vi snakker om når vi snakker om kunstig intelligens⚓︎

Litt bredt defineres kunstig intelligens som «smarte maskiner som kan lære av erfaring og utføre menneskeliknende oppgaver» (Marconi, 2020).

KI var involvert da Aftenposten avslørte at noen av Norges rikeste bedrifter fikk unntak fra karantenebestemmelsene i 2020, at Europower kontinuerlig overvåker energiprisene med en liten algoritme, at Buzzfeed avslørte ulovlige overvåkingsfly ved å laste ned store mengder flydata og så maskinelt analysere flymønstre, fart og høyde, at avsløring av leger dømt for seksuell misbruk ble gjort ved å analysere over 100.000 dokumenter med disiplinærsaker, og at avsløring av ulovlige miner i Ukraina kom som følge av maskinell analyse av 450.000 satellittbilder. I 2021 fikk Boston Globe Pulitzer-prisen for gravejournalistikk for å finne og peke på ulykkessteder i trafikken som enkelt kunne rettes på. Sakene var basert på et KI- basert program, Pinpoint, fra Google. Programmet er laget for å hjelpe gravejournalister til å finne mønstre i data.

Kunstig intelligens er kunstig, men foreløpig ikke særlig intelligent. Intelligens krever noe mer enn å kunne gjenta, kopiere og rydde i store datamengder. Intelligens krever forståelse som kan brukes til anvendelse av kunnskapen og som starter kreative prosesser. Kunstig intelligens er derfor en overdrivelse og en sammenblanding av vår menneskelige hang til å tro at den som kan håndtere ufattelige mengder fakta også kan anvende dem og forstå dem på en intelligent måte. Like fullt er KI intelligent nok til at IBM planlegger å bytte ut 7800 kontor- arbeidsplasser og IBM sluttet å ansette folk i administrative stillinger i 2023.

KI-bilde generert med DALL-E.

KI-bilde generert med DALL-E.

Mye av det som omtales som KI er egentlig automatisering. Det gjelder og redaksjonelt arbeid. Mange redaksjoner har jobbet datastøttet i lang tid, uten at det strengt talt er snakk om KI.

Ingeborg Volan, Dagens Næringsliv

«Automatisering er når du bruker teknologi til å gjøre en oppgave som er den samme hele tiden. Tjenesten er gjerne basert på gamle rutiner der reportere har slått opp i et register en gang i uken, og nå får en maskin til å gjøre det. For eksempel å gi et varsel hver gang det kommer en ny dom på domstol.no på bestemte navn eller en bestemt paragraf. Det er en ren automatisk oppgave. Den utvikler seg ikke, men den effektiviserer våre interne prosesser himla mye».

Ikke trenger KI å være spesielt gunstige heller. Et hovedproblem for KI er at algoritmene ofte krever enorme mengder tekster eller bilder for å lære. Og de lærer av det de leser.

Algoritmene lærer dermed alle underliggende menneskelige fobier og skjevheter innbakt i dataene. GPT-3 (Generative Pre-trained Transformer 3. OpenAI lanserte GPT-3 i 2020. I 2021 lanserte «Deep Mind», eid av Google, et kraftigere verktøy for automatisk tekst. I mars 2023 kom GPT-4) – et system for produksjon av syntetiske tekster – er for eksempel basert på tekster som utgjør over 500 milliarder ord eller 570 GB-data (Simonite, 2021, Bender, 2021). Bruk av GPT har ført til mange historier om diskriminering som følge av bestemmelser eller anbefalinger basert på KI. Og det har ført til KI-basert informasjon som er nær umulig å etterprøve og kontrollere. Og det har ført til kritikk om at KI er miljømessig krevende å utvikle.

Regjeringen.no definerer kunstig intelligens som systemer eller programmer som «utfører handlinger, fysisk eller digitalt, basert på tolkning og behandling av strukturerte eller ustrukturerte data, i den hensikt å oppnå et gitt mål». Poenget er datasystemer som kan lære av egne erfaringer og slik løse sammensatte problemer.

Programmet må altså lære av egne erfaringer. Det kalles maskinlæring og dreier seg om at algoritmene utledes fra eksempeldata systemet trenes på, i stedet for at reglene er gitt på forhånd. Altså, sett at du våknet en morgen og det lå en minnepinne i snailmailboksen din med 100000 dokumenter lekket fra Petroleumstilsynet. Store og bort imot uoverkommelige mengder ustrukturerte data med andre ord. Men også en mulig gullgruve av saker og innsikt i hemmeligheter fra norsk petroleumsvirksomhet. Da kunne du ha lagt alle dokumentene inn i en database, søkt fulltekst etter dokumenter som inneholdt ord eller fraser som «brudd på petroleumsloven», «ulykker», «uhell», «utblåsing», «lekkasje», «kjemikaler», etc. Så bruker du dokumentene du har funnet og som du mener er de mest interessante til å vise GPT-3, eller en nyere norsk versjon, hva du er på jakt etter. Deretter lar du maskinen jobbe hele natten utrettelig for å finne liknende dokumenter. Det kalles veiledet læring.

Robot holding presentation for group of robots in newsroom - painted as oil painting

Bildet er KI-generert ved hjelp av Adobe Firefly med beskjeden “Robot holding presentation for group of robots in newsroom - painted as oil painting”.

Det finnes og ikke-veiledet læring, der algoritmen må lete etter mønstre i datasettet selv. Det følges gjerne opp med forsterket læring der du ser på resultatet og gir tilbakemelding om du synes algoritmen har lyktes i å finne gode og brukbare mønstre. Deep Learning er en metode for maskinlæring der en bruker et komplekst nauralt nettverk for å trene algoritmer. Resultatet av Deep Learning er i beste fall Deep data, altså særlig relevante data.

Det er fullt mulig å bruke maskinlæring til KI-baserte falsknerier. Det har så langt ikke plaget norske redaksjoner og norske medier i stor grad, men utenlandske tv seere har sett Storbritannias dronning med en «alternativ juletale» der hun tilsynelatende forteller vitser om familien og har pyntet seg med en Korona-virus brosje. Men KI-basert spredning av falsk kunnskap er årsaken til at Geoffrey Hinton, omtalt som KI-pioner og KIs bestefar, sluttet i Google i mai 2023 og advarte mot videre utvikling av programvaren.

KI er mye jobb (prosessering) og mye data, men særlig menneskelig intelligent er det ikke. Vi snakker derfor om sterk og svak intelligens. Men kanskje bred og smal intelligens hadde vært riktigere. Intelligens som likner på den menneskelige og som kan brukes bredt kalles sterk, mens dagens KI bedriver svak eller smal intelligens. Mens vi mennesker kan flytte erfaring og kunnskap fra en problemløsning til et annet felt og dermed bruke vår generelle og brede intelligens, så ligger KI langt etter. KI er så langt i stand til å løse oppgaver på ett smalt område om gangen. Du ville for eksempel bruke et system til å ordne de ustrukturerte dataene i eksempelet fra Petroleumstilsynet, et annet system for bildegjenkjenning og et tredje som skriver korte innholdsreferater fra hvert dokument.

På den annen side er det nyttig med relativt smale programmer som kan arbeide utrettelig med å analysere ufattelig store datamengder. IDC (International Data Corporation overvåker global teknologiutvikling) spår at det i 2025 vil bli generert 163 zettabyte data årlig i verden. En zettabyte tilsvarer 1000 milliarder gigabytes. 163 zettabytes er fire millioner ganger mer enn all informasjon i databasene til Amazon.com og 2,5 ganger mer informasjon enn i Google Earth-databasen ifølge nettstedet The Measure of things.

Ole Petter Pedersen, redaktør for Teknisk Ukeblad

«Maskinlæring, om vi skreller det litt av, er bare noen litt avanserte regnestykker som er satt inn i en datamaskin. Det er klart at det er veldig fascinerende når vi gir datamaskinen reglene til sjakk, og så bruker den fire timer til å bli verdens sterkeste sjakkcomputer. Men det er bare fordi at den har spilt ganske mange millioner ganger mot seg selv og så har gjort seg noen refleksjoner om hvorfor man vant det ene partiet versus det andre. Det er kjempespennende, og da er det lett å glorifisere selve teknologien.»