Hvordan GPT-4 fant 155.000 overflødige årsverk i norsk offentlig sektor

Den norske staten lover å satse voldsomt på kunstig intelligens (KI). Men hva vet vi egentlig om hvorvidt KI faktisk kan løse oppgavene som visjonene tillegger teknologien? Vi stiller oss undrende til beregningene som underbygger disse visjonene. Vår påstand er at det ikke er samsvar mellom ambisjonenes størrelse og hvor fort de skal innfris på den ene siden, og kunnskapsgrunnlaget for det hele på den andre.

1. februar 2026 kl. 05:00

Ståle Grut, Alexander Moltubakk Kempton og Hilde Reinertsen

Denne artikkelen ble først publisert i utgave 3/2025 av Stat & Styring, utgitt på Scandinavian University Press. For kilder og fotnoter, se originalartikkel. Lenke nederst i teksten.

Digitaliserings- og forvaltningsminister Karianne Tung har presentert en mye omtalt målsetting om at «80 prosent av offentlig sektor» skal ta i bruk kunstig intelligens innen 2025, med et videre mål for 2030 om at «alle statlige virksomheter bruker KI i sin oppgaveløsning». Ifølge Tung er KI «et av kjerneverktøyene for å fornye og forbedre offentlig sektor».

I «Ny nasjonal digitaliseringsstrategi» for Norge befester regjeringen de to milepælene – 80 % innen 2050 og 100 % innen 2030. I strategien beskrives KI som en mulig «gamechanger» og «en banebrytende teknologi som har potensial til å løse store samfunnsutfordringer, øke produktiviteten og forbedre velferdssamfunnet».

Slike uttalelser om KI er ikke regjeringen alene om. I digitaliseringsstrategien peker de på «en rekke utredninger som viser at utviklingen innenfor KI, og særlig generativ KI, har et stort verdiskapingspotensial». Lignende uttalelser finner vi blant i rapporter fra internasjonale forskningsinstitusjoner, i artikler i dette tidsskriftet og i en rapport fra Riksrevisjonen fra 2024. Riksrevisoren selv uttaler at «[d]igitalisering og bruk av kunstig intelligens vil være helt avgjørende for å lykkes med å opprettholde den norske velferdsstaten». Til sammen er det etterlatte inntrykket at KI er det som vil redde velferdsstaten; det vil føre til en betydelig produktivitetsøkning blant de ansatte og automatisering av arbeidsoppgaver som vil komme oss alle til gode.

Men hva vet vi egentlig om hvorvidt KI faktisk kan løse oppgavene som visjonene tillegger teknologien? Vi stiller oss undrende til beregningene som underbygger disse visjonene. Vår påstand er at det ikke er samsvar mellom ambisjonenes størrelse og hvor fort de skal innfris på den ene siden, og kunnskapsgrunnlaget for det hele på den andre. For hva er egentlig bevisene for at KI så sikkert er løsningen?

Analysen vår tar utgangspunkt i et bestemt tallfestet effektiviseringspotensial som ved flere anledninger har blitt referert til i offentligheten: 155.000 årsverk i offentlig sektor. Dette tallet er blant annet gjengitt av Aftenposten, Dagens Næringsliv, Adresseavisen, Kommunal rapport og Altinget. Det gjengis også her i Stat og Styring i en omtale av de politiske partienes visjoner for effektivisering av offentlig sektor i forkant av stortingsvalget i september 2025: Her kan vi lese at Venstres stortingsrepresentant Alfred Bjørlo «peker på at Riksrevisjonen anslår at kunstig intelligens alene kan effektivisere arbeidsoppgaver tilsvarende 155.000 årsverk i offentlig sektor». Denne formuleringen finner vi også i Venstres partiprogram for perioden 2025–2029.

Som vi så innledningsvis, er det vanlig å lese generelle og vage spådommer om stort verdiskapingspotensial, økt effektivitet og store innsparinger som følge av KI. Det som skiller seg ut med tallet 155.000, er at en slik eksplisitt kvantifisering av effektiviseringspotensialet er heller sjelden. Fordi dette konkrete tallet er så hyppig gjengitt i offentligheten, blir vi nysgjerrig på hvor det stammer fra, og hvilke steg tallet har gått gjennom for å oppnå den statusen det har i dag som kunnskapsgrunnlag for politikkutforming om fremtidens Norge. I arbeidet har vi anvendt praksisorientert dokumentanalyse, prinsipper fra digital kildekritikk og programmering i Python for å spore og gjenskape tallet.

Fra Riksrevisjonsrapport til Menon-notat

Vi følger sporet først til Riksrevisjonen. Dette er en aktør med stor autoritet, som i kraft av sin funksjon som Stortingets kontrollorgan er med på å legge premisser for arbeidet i statlig sektor. Med Riksrevisjonens egne ord er undersøkelsene deres «uavhengige og objektive og skal gi Stortinget eit fagleg grunnlag for å utøve den kontrollfunksjonen dei har overfor regjeringa». Partiet Venstres henvisning til Riksrevisjonen dreier seg om rapporten «Bruk av kunstig intelligens i staten», som ble overlevert til Stortinget i september 2024. Denne ble behandlet av kontroll- og konstitusjonskomiteen samme høst. I innledningen til sin rapport skriver Riksrevisjonen: «Kunstig intelligens har potensial til å gjøre staten betydelig mer produktiv, og bidra til å endre statlig forvaltning på helt grunnleggende måter.» Videre heter det: «Ved full utnyttelse av dagens teknologi for kunstig intelligens, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155.000 årsverk, ifølge rapporten.» I Riksrevisjonens rapport refereres det altså til en annen rapport.

Som kilde for begge de foregående påstandene henviser Riksrevisjonen til et notat fra konsulentselskapet Menon Economics med tittelen «KI: Betydning for arbeidsstyrken, En analyse av potensialet for kunstig intelligens-drevet effektivisering i norsk næringsliv». Også ved lanseringen av Riksrevisjonens rapport trakk riksrevisoren frem Menons notat som en «rapport» som er kilden til følgende påstand: «[O]m dagens teknologi for KI blir utnyttet fullt ut, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155.000 årsverk.» Altså kan påstanden som i Stat & Styring og Venstres partiprogram belegges med henvisning til Riksrevisjonen, spores tilbake til et notat fra Menon Economics. Men hvordan kom Menon frem til tallet?

Fra Menons notat til OpenAIs prompt

La oss se nærmere på hvordan tallet 155.000 kommer til i Menon Economics’ notat «KI: Betydning for arbeidsstyrken». På i overkant av 30 sider er Menon åpne og detaljerte i hvordan de har kommet frem til dette tallet: I korte trekk benytter de både en metode og et «prompt» – en instruksjon til en språkmodell – som de har hentet fra et notat der tre av fire forfattere kommer fra OpenAI. Her bruker de OpenAIs GPT-4 til å vurdere hvor effektiv en språkmodell kan være for å løse gitte arbeidsoppgaver. GPT-4 er den samme språkmodellen som ble gjort tilgjengelig gjennom OpenAIs tjeneste ChatGPT i mars 2023. Menon oppgir at de gjorde noen manuelle evalueringer for å «identifisere viktige motsetninger mellom menneskers og GPT-4s valg». Dette gjorde de ved å sammenligne «resultatene av GPT-4s kategorisering» med «et mindre utvalg av manuelt kategoriserte oppgaver».

For å kunne spørre GPT-4 hvorvidt en arbeidsoppgave kan løses av en språkmodell, beskrives oppgavens innhold og kategoriseres per yrke. Eksempelvis inneholder prompten brukt av Menon, instruksjoner som dette:

Assume you are a worker with an average level of expertise in your role trying to complete the given task. You have access to the LLM as well as any other existing software or computer hardware tools mentioned in the task. You also have access to any commonly available technical tools accessible via a laptop (e.g. a microphone, speakers, etc.). You do not have access to any other physical tools or materials. Please label the given task according to the taxonomy below.

Deretter følger en detaljert oversikt (taksonomi) over ulike effektkategorier, som beskriver hvor effektiv en språkmodell vil være gitt oppgavebeskrivelsen. Når Menon her gjenskaper OpenAIs metode, oversettes det først mellom norsk og amerikansk yrkesklassifisering. Disse følger ulike standarder, så allerede her skjer det en forskyvning som vil få betydning for den senere beregningen. Ut ifra denne beskrivelsen spørres så GPT-4 om å klassifisere hvilken effekt språkmodellbruk vil ha på utførelsen av en arbeidsoppgave, der høyeste effektkategori vil være å minst halvere tiden det tar å utføre oppgaven. (Den fullstendige spørringen – prompten – er publisert som vedlegg i Menons notat.) Menon vektlegger at de har en mer konservativ tilnærming enn OpenAI selv, ved at de har spurt fem ganger kontra én, og deretter valgt det laveste anslaget. Om en arbeidsoppgave vurderes som å ha god effekt av språkmodellbruk, beregnes det en tidsbesparelse. Med det eksplisitte forbeholdet om at hver oppgave (med ulik vekting av kjerne- og tilleggsoppgaver) «opptar like mye tid i arbeidshverdagen i et yrke», summeres så tidsbesparelsene. Deretter regnes effekten ut på yrkesnivå i form av sparte timer, som summert utgjør 155.000 årsverk for hele offentlig sektor.

Det er flere iøynefallende aspekter ved denne metoden. Det første er totalen på 155.000 årsverk, som jo er et markant høyt tall. Det andre er at notatets sammendrag knytter dette tallet til effektiviseringspotensialet for bruk av «KI-verktøy» generelt, mens metoden er eksplisitt innsnevret til bruk av språkmodeller. (Dette er jo noe annet enn for eksempel de mye omtalte bildeanalyseverktøyene implementert innen helsefeltet.) Men det som var mest iøynefallende, var et deltall som inngår i beregningen, nemlig estimatet for effektiviseringspotensialet i yrkesgruppen «Barnehage- og skolefritidsassistenter mv.»: nærmere 15.000 årsverk, noe som utgjør et effektiviseringspotensial på 20 %. Som foreldre har vi selv hatt jevn kontakt med folk i denne yrkesgruppen. Er virkelig oppgavene de utfører, av en slik art at nærmere 15.000 årsverk i barnehager og skolefritidsordninger kan spares med bruk av språkmodeller? Gitt at dette ene tallet utgjør nesten 10 % av det totale 155.000, og dermed utgjør det tredje største effektiviseringspotensialet i Menons notat, zoomer vi videre inn.

For å forstå hvordan dette deltallet ble til, valgte vi å reprodusere metoden så godt det lot seg gjøre (noen detaljer er utelatt i Menons metodebeskrivelse). Det vil si at vi utviklet et enkelt Python-program, som lot oss programmatisk sendte forespørsler til OpenAIs GPT-4-modell, og som utførte deler av beregningene beskrevet i Menons notat. Andre steg i metoden, som å hente og legge inn oppgavebeskrivelser, gjorde vi manuelt. Vi kom frem til samme tall som Menon, men vi gjorde oss samtidig tre observasjoner av stor betydning for hvordan vi bør tolke og bruke tallet.

Tre observasjoner som rokker ved Menons tall

Den første observasjonen er at det er stor variasjon i hvilke tall GPT-4-språkmodellen produserer. Som Menon spurte vi GPT-4 fem ganger om vurderinger av yrkesgruppens arbeidsoppgaver. Deretter kalkulerte vi effektivitetspotensialet ut ifra svarene. Resultatene varierte mellom 20 % og 33 %. Hadde vi spurt flere ganger, ville vi trolig fått et større spenn i tallene. Det bør heller ikke overraske. En språkmodell som GPT-4 er stokastisk. Den kan skape naturlig tekst nettopp fordi det ligger en vilkårlighet i hvilken tekst som produseres. Dette påpeker Menon selv i notatet. Men det kan føre til en vilkårlighet i vurderingene og estimatene den produserer, noe vår spørring viste. Om det å velge laveste tall kan sikre oss mot vilkårlighet, er vi usikre på. Kunne ikke det riktige tallet like gjerne vært det høyeste? Eller det i midten? Ulike valg har store konsekvenser for utregningen og dermed for hva det endelige tallet blir.

Den andre observasjonen handler om hvordan yrker kategoriseres, og hvilke forutsetninger som tas i beregningene som presenteres. Statistisk sentralbyrås tall og klassifiseringer bruker en annen standard enn den amerikanske O*NET-databasen over oppgavebeskrivelser, som er den OpenAI-arbeidsnotatet er basert på. For å estimere tallene for kategorien «Barnehage- og skolefritidsassistenter» må man dermed finne den tilsvarende kategorien i den amerikanske standarden. Menon bruker et etablert kryssreferansesett for å gjøre denne konverteringen og finner kategorien «Childcare worker». Problemet er at denne kategorien i norsk standard, altså barnehage- og skolefritidsassistenter, svarer til to kategorier i amerikansk standard: både assistentene og deres personalledere. En leder har for eksempel oppgaven å «utføre generelle personaloppgaver, som veiledning, opplæring og arbeidsplanlegging», noe GPT-4 beskriver som å ha god effektiviseringseffekt med bruk av en språkmodell. Det kan stemme, men når alle arbeidsoppgaver antas å telle like mye, og denne arbeidsoppgaven brukes til å beregne effektiviseringspotensialet til samtlige barnehage- og skolefritidsassistenter, ikke bare lederne deres, blir det problematisk. Her kjenner vi ikke detaljene i Menons metode, så vi vet ikke hvordan kategoriseringen har foregått i praksis. Men i vår reprodusering måtte kategoriene slås sammen for å gjenskape samme tall som Menon.

Den tredje observasjonen er at det utgjør en stor forskjell om man spør GPT-4 om hver arbeidsoppgave hver for seg, eller om man samler arbeidsoppgavene i et langt prompt. Da vi spurte GPT-4 om å vurdere alle 24 oppgavene beskrevet i O*NET under kategorien «Childcare worker», endte vi opp med et effektiviseringspotensial på 12 %. Om vi sendte spørringer for hver oppgave, endte vi opp med et totalt potensial på 3 %. Det markant lavere tallet viser hvor viktig utformingen av prompten er for svaret man får. Et effektiviseringspotensial på 3 % vil åpenbart gi et langt lavere effektiviseringspotensial enn de nærmere 15.000 årsverkene Menon fant, som igjen ville gitt et totaltall langt lavere enn 155.000.

Hvilken betydning har disse tre observasjonene for hvordan vi skal tolke tallene som blir produsert? I alle fall for kategorien «Barnehage- og skolefritidsassistenter mv.» kan vi kanskje karakterisere dette første steget som en form for maskinell spekulasjon. Språkmodeller har vist seg å være veldig gode på å produsere velskreven tekst og bedre enn mennesker flest til å løse oppgaver som kan vurderes ut ifra objektive kriterier. Å beregne tall som sier noe om fremtiden, faller ikke under det samme.

Samme tall – ny betydning

Så langt har vi sett på produksjonen av tallet 155.000 i Menon-notatet: Det første steget er den GPT-4-baserte produksjonen av selve tallet, der vi gikk nærmere inn på beregningen av deltallet for én yrkesgruppe (barnehage- og skolefritidsassistenter). Dette presenteres mot slutten av notatets resultatkapittel. Det andre steget skjer når tallet løftes opp i sammendraget helt fremst i Menons notat. Her står det prominent plassert midt på første side med uthevet skrift, som gjør tallet og dets betydning, altså effektiviseringspotensialet, svært synlig:

Ved fullstendig utnyttelse av KI slik som teknologien står i dag, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155 000 årsverk i sektorer som helse, undervisning og offentlig administrasjon.

Her skjer det en viktig omskriving av hva effektiviseringspotensialet refererer til: fra bruk av «språkmodeller» spesifikt i resultatdelen til «KI» generelt i sammendraget. Dette poenget kan virke som flisespikkeri, men det er faktisk avgjørende fordi det er teksten fra sammendraget som hentes opp og refereres videre i pressen, av politikere og i andre dokumenter.

Det er denne formuleringen som nærmest ordrett brukes av Riksrevisjonen på tre ulike steder: i første avsnitt under punktet «Utdyping av konklusjoner» i selve dokumentet som oversendes Stortinget (formelt kalt Dokument 3:18). I selve rapporten, som følger som vedlegg til Dokument 3:18, kommer formuleringen i innledningens første avsnitt. I presentasjonen riksrevisoren ga til pressen ved overleveringen, kom formuleringen igjen som en del av hans avslutningspoeng: «Ved full utnyttelse av dagens teknologi for kunstig intelligens, kan offentlig sektor effektivisere arbeidsoppgaver som årlig vil tilsvare 155 000 årsverk.» Alle stedene tilskrives denne påstanden «det forskningsbaserte analyse- og rådgivningsselskapet Menon» – i selve rapporten allerede i åpningsavsnittet. I tillegg legger Menon-rapporten indirekte premissene for Riksrevisjonens rapport ved å være en av kildehenvisningene til den toneangivende setningen i innledningens første avsnitt: «Kunstig intelligens har potensial til å gjøre staten betydelig mer produktiv, og bidra til å endre statlig forvaltning på helt grunnleggende måter.» Når Riksrevisjonens rapport så behandles i Stortinget, flyttes hele teksten ordrett fra Dokument 3:18 inn i innstillingen fra kontroll- og konstitusjonskomiteen, med unntak av fotnoter og figurer. Dermed fremstår denne setningen som Riksrevisjonens, og også Stortingets, egen påstand. Tallet 155.000 flytter også med; det tilskrives fortsatt Menon, men uten den presise kildereferansen til Menons notat.

Verken tallet 155.000 eller Menon-notatet nevnes igjen i Riksrevisjonens rapport: Den befinner seg kun i rapportens innledning og stortingsdokumentets konklusjon. Tallet er altså ikke i seg selv beregnet av Riksrevisjonen. Det er ikke en del av deres egne metodiske prosess og er dermed ikke ettergått med samme presisjonsnivå som andre datakilder, som ikke kvalifiserer som «revisjonsbevis» uten grundig analyse. Likevel presenteres altså tallet under punktet «Utdyping av konklusjoner». Selve rapporten beskriver store uløste juridiske, etiske og praktiske utfordringer ved å ta i bruk KI i stor skala i statsforvaltningen. Riksrevisjonen gjør selv beregninger av hva slags oppgaver som eventuelt vil kunne egne seg for KI-bruk, men prøver seg ikke på en tallfesting av potensialet for effektivisering.

Selv om Riksrevisjonens rapport omhandler mange forhold ved KI-bruk i offentlig sektor, får tallet 155.000 altså en prominent plass i oppbyggingen av rapporten og Riksrevisjonens argument om at den norske staten «henger etter» i sin KI-bruk. Når Riksrevisjonens rapport og pressekonferanse refereres av ulike medier, følger referansen til Menon som oftest med, men tallet begynner også å tilskrives Riksrevisjonen selv, slik som i eksempelet her i Stat og Styring, der Venstre-politiker Alfred Bjørlo «peker på at Riksrevisjonen anslår at kunstig intelligens alene kan effektivisere arbeidsoppgaver tilsvarende 155.000 årsverk i offentlig sektor». Andre formuleringer er mer tvetydige, som at Riksrevisjonen «skriver i sin rapport», eller at riksrevisoren «viste til beregninger»; her forblir det tekstlig uavklart om tallet skal tilskrives Riksrevisjonen eller noen andre.

Slik ser vi at når tallet «155.000 årsverk» forflytter seg videre fra Menons notat og Riksrevisjonens rapport inn i offentligheten og politikken, så er det ikke Menons presise beregning som sprer seg, men en langt bredere fortolkning. I tillegg kan vi observere at selve formuleringene som omtaler tallet, gjennomgår små endringer på veien: På fascinerende vis blir det gradvis stadig sikrere, mindre usikkert. Hver gang det hentes videre inn i en ny tekstlig kontekst, får det mer tyngde. Mens Menon-notatet i sin resultatdel er utforskende og tentativ i sin arbeidsmetode, følger ikke disse forbeholdene og begrensingene med når tallet flyttes videre. Det er så vi kan spørre: Er det egentlig lenger det samme tallet?

Sikkert tall tross usikker metode

Interessant nok skjer forsterkningen også selv når usikkerhet ved tallet og metoden blir eksplisitt diskutert. Det er viktig å få med seg at notatforfatterne i Menon ikke prøver å skjule metodens natur, altså hvordan de kom frem til tallet, og usikkerhetene som er beheftet ved anslagene. Dette gjemmes ikke bare bort i notatets metodedel; det anerkjennes også videre. Dette skaper en iøynefallende kontrast mellom den eksplorative, eksplisitt usikre beregningsmetoden og graden av sikkerhet som tallet etter hvert antar i offentligheten. Menon påpeker selv denne dobbeltheten i forordet til sitt eget notat:

Mange har forsøkt før oss, men det unike med vår fremgangsmåte er at vi kobler etablert internasjonal forskningsmetodikk med norske data for å komme med anslag som er mer relevante for norske yrker, næringer og fylker. Selv om anslagene er beheftet med stor usikkerhet, gir de nyttig innsikt for alle som forsøker å planlegge for en usikker fremtid, eller forme den.

Selv om Menon-notatet her fremhever at metoden er «beheftet med stor usikkerhet» og i metodedelen redegjør for språkmodellenes «stokastiske egenskaper», fastslår de samtidig at deres fremgangsmåte er «unik» ved at de kobler «etablert internasjonal forskningsmetodikk» med norske data. Dette gjør at anslagene, tross usikkerheten, gir «nyttig innsikt for alle som forsøker å planlegge for en usikker fremtid, eller forme den». Også annen forskning har påpekt hvordan kunnskap frembragt av konsulentmetoder, har denne paradoksale kombinasjonen av fleksibilitet og sikkerhet – den kan være beheftet med store forbehold og antakelser, men samtidig fremsettes som et grunnlag for handling.

Samtidig fortsetter Menon å ta ytterligere forbehold ved OpenAIs metode. Året etter at notatet er utgitt, kommer det en tilføyelse til notatet når det publiseres i form av en «aktuell analyse» hos tidsskriftet Samfunnsøkonomen. Her introduserer forfatterne fra Menon noe som er fraværende i notatet fra året før, nemlig at OpenAI og deres ansatte kan ha økonomiske insentiver for å omtale språkmodellens egenskaper positivt:

Det er viktig å påpeke at denne studien ikke er fagfellevurdert og er utført av forskere ansatt i OpenAI, som er firmaet bak språkmodellen GPT-4 som brukes i både vår og deres analyse. Det betyr at forfatterne potensielt kan ha økonomisk insentiv for å omtale modellens egenskaper positivt.

Dette kan åpenbart potensielt ha stor betydning for hvordan metoden, og dermed tallet 155.000 årsverk, bør brukes. Men samtidig bekrefter tilføyelsen vårt poeng i denne artikkelen: Forbeholdene får ikke betydning for selve tallet – de frakobles eller, som her, knyttes faktisk aldri sammen med tallet. Forbeholdet får ikke konsekvenser for metodebruken. Tilføyelsen får ikke betydning for hvordan tallet på samme tid får et nytt oppsving i offentligheten og offentlige dokumenter gjennom Riksrevisjonens omtale.

Overdreven tillit til tall – eller overdrevent håp om effektivisering med KI?

I denne artikkelen har vi undersøkt hvordan et toneangivende tall blir skapt, og hvordan det sirkulerer i offentligheten. Vi har observert hvordan dette i utgangspunktet tentative, spekulative tallet får tyngden som trengs for å brukes som kunnskapsgrunnlag i offentlig debatt og politikkutforming. Dette skjer gjennom små, tilsynelatende ubetydelige tekstlige operasjoner: En formulering kopieres og flyttes. Litt andre ord velges. Formuleringen får en ny tekstlig kontekst, en ny forfatter og institusjonell avsender. Helt konkret blir forbeholdene, som jo er skrevet ut i originalteksten, liggende igjen der – de flytter ikke videre sammen med tallet. Dermed blir jo betydningen også en annen, og tallet fortolkes på en annen måte. Tallet er altså ikke bare et tall – det er en formulering, et potensial, en tallfesting av en mulighet, som igjen muliggjør handling. Denne effekten kan vi kalle «frakobling» – tallet kobles løs fra sin opprinnelige kontekst og reiser videre alene – med potensielt svært store konsekvenser. For som vi har sett i denne artikkelen, blir tallet da i kommende dokumenter fremstilt, fortolket og forstått som langt sikrere enn det er. Der usikkerheten anerkjennes, fører det ikke til stans, tvert imot. Vi ser altså en dynamikk der tallet blir stadig sikrere etter hvert som dokumentkjeden vokser.

Avslutningsvis vil vi peke på implikasjonene av at staten på denne måten potensielt fatter store beslutninger på et sviktende kunnskapsgrunnlag uten å vite at det er dette de gjør. Det er et påfallende fravær av problematisering omkring hva vi egentlig vet om potensialet for KI-bruk. Dette er per nå i hovedsak hypoteser og visjoner. Griper vi til KI som en potensiell løsning på samfunnsproblemer som egentlig er svært vanskelige å løse? Overvurderes mulighetene og besparelsene KI kan levere?

Vi skal heller ikke undervurdere de uoversiktlige konsekvensene av en overilt marsjordre. Når Riksrevisjonen anfører at Norge henger etter i KI-bruk, og ministeren ønsker at 80 % av offentlig sektor skal ta i bruk KI i inneværende år (2025), vil det nødvendigvis måtte få alvorlige utslag, slik vi så i Tromsø kommune, der kunnskapsgrunnlaget for en ny barnehage- og skolestruktur inneholdt referanser til kilder som ikke eksisterer. Det viste seg at kommunen hadde brukt ChatGPT i arbeidet med kunnskapsgrunnlaget, noe som førte til skandaleoppslag, ekstern granskning og en kommunetopps avgang. Denne saken ble avslørt ved en tilfeldighet – men mange blir trolig ikke det. Vår analyse i denne artikkelen viser at dette nå har en parallell på nasjonalt nivå: Ukritisk bruk av et tall foreslått av GPT-4, bidrar til å legge premissene for fremtidens norske KI-politikk.

Teksten ble opprinnelig publisert på Scandinavian University Press. Det kan ha vært gjort mindre endringer i teksten, blant annet når det gjelder titler, mellomtitler, bilder og fotnoter.

Grut, S., Kempton, A. M., Reinertsen, H. (2025). KI og effektivisering: Hvordan GPT-4 fant 155.000 overflødige årsverk i norsk offentlig sektor. Stat & Styring, 35(3), 3-12. https://doi.org/10.18261/stat.35.3.1

Publisert av Altinget under lisens CC BY 4.0

Artikkelen er skrevet av

Ståle Grut, Alexander Moltubakk Kempton og Hilde Reinertsen

Innsikt

Nytt om Navn

Om Emil Raaen
Ferdig som statssekretær – blir ny statsforvalter i Trøndelag

Om Hans Christian Holte
Han skal lede KI Norge

Om Per-Willy Amundsen
Utsetter høringen om Epstein-dokumentene

Kalender

mai

Åpen høring i Finanskomiteen

09:00-14:00

mai

Staten legger frem sitt tilbud i årets jordbruksoppgjør

13:00-14:00

mai

Høringersfrister og innstillinger – Uke 20

11. mai-17. mai

mai

Storting – Utenriksministeren redegjør om viktige EU- og EØS-saker i 2026

10:00-16:00

mai

Regjeringen legger fram forslag til revidert nasjonalbudsjett

12:00-13:00

mai

KS: Stormøte om RNB og kommuneproposisjonen

13:45-14:30

mai

Antire: AI & Robotics Conversation Hub

10:00-17:00

mai

FD: Informasjonsmøte om tilskuddsordning for frivillig aktivitet forsvars- og sikkerhetsområdet

12:00-14:00

mai

Innstillinger fra stortingskomiteene – Uke 21

18. mai-24. mai

mai

Riksrevisjonen med fire rapporter om Nansen-programmet

13:00-14:00

mai

KUD: Dialogmøte om EUs nye program for kultur, medier, likestilling og demokrati (AgoraEU)

10:00-11:30

jun

Digdir: Digitaliseringskonferansen 2026

16. juni-17. juni

Fødselsdager

Øyvind Eggen
56 år
Redaktør, Stat & Styring
Fødselsdag den 8. mai

Statsråden svarer

24-stjerners julekalender

Tiden går, hierarkiet i staten består

Torstein Nesheim

Klimaarbeid i staten: Mer enn symbolpolitikk

Bjarte Nygård, Liana Lan Nguyen og Michael S. Tveter

Samfunnssikkerhet og beredskap i utredning av statlige prosjekter

Erik T. Valestrand

Kontroll i praksis: Effektene av styringsmål og endringslogg i store statlige prosjekter

Morten Welde, Torbjørn Aass og Haavard Haaskjold

Når virkeligheten reduseres til en ambisjon

Eva Hildrum

Siste

– Det minner om et korthus, sier forsker som har studert to av Danmarks mest digitaliserte offentlige virksomheter

Ansatte i skatteetaten kan ikke svare gråtkvalte borgere, og medarbeidere hos landbruksmyndighetene tar skjermbilder for ikke å miste informasjon. Forskere har studert hvordan ansatte i den danske forvaltningen kjemper med IT-systemer som utfordrer deres arbeid og profesjonelle autoritet.

Sine Riis Lund