Når store språkmodeller bør avstå: Designe sikre ikke-svar

June 17, 2026
Comments 10
Teknologi og kunstig intelligens

Har du noen gang stilt en spørsmål til en stor språkmodell som en avansert algoritme som genererer tekst basert på mønstre i data, for eksempel ChatGPT eller Claude, bare for å få et svar som lød overbevsende, men som var helt feil?

Dette kalles hallusinasjon. Det er det øyeblikket når maskinen "fantaserer" fakta fordi den ikke vet svaret, men likevel prøver å være hjelpsom. Problemet er at brukere ofte tror på disse svarene. For å løse dette forsker vi nå intenst på hvordan vi kan designe systemer der modellen velger å si «jeg vet ikke» - eller rett og slett avstår fra å svare - når usikkerheten er for stor.

Hvorfor «jeg vet ikke» er det viktigste svaret

I tidlige dager med chatbots var målet enkelt: Gi et svar, uansett hva. Men med avanserte språkmodeller som AI-systemer trent på enorme mengder tekst for å forstå og generere menneskelig språk som GPT-4 og LLaMA, har spillet endret seg. Nå handler det om tillit.

Forskning fra 2024, inkludert en omfattende gjennomgang i *Transactions of the Association for Computational Linguistics*, definerer dette begrepet som abstention (avståelse). Det betyr at modellen aktivt velger å nekte å svare når den er usikker, når spørsmålet er umulig å besvare, eller når et svar ville vært skadelig. En ny metrikke kalt Abstention Ability (AA) som en kvantitativ målsetting for hvor godt en modell tilbakeholder svar ved usikkerhet viser at selv de mest avanserte modellene fortsatt sliter med å vite når de skal holde kjeft.

Tenk deg en lege-app. Hvis appen gir feil råd, kan noen bli skadet. Hvis den sier «jeg er usikker, konsulter en ekte lege», redder den kanskje livet. Å lære modeller å avstå er derfor ikke bare en teknisk utfordring; det er en sikkerhetsnødvendighet.

De tre hovedgrunnene til å avstå

Når bør en AI egentlig la være å svare? Forskere deler opp situasjonene i tre klare kategorier:

Epistemisk usikkerhet: Modellen har ikke nok informasjon. Dette skjer ofte med nye hendelser etter modellens treningsdato (kunnskapskutt) eller svært spesifikke nisjefakta.
Oppgaveumulighet: Spørsmålet er logisk sett ubesvartbart, tomt eller motstridende. Her finnes det rett og slett ingen korrekt løsning.
Sikkerhets- og etiske grenser: Et svar ville krenket personvern, oppfordret til vold eller brøt loven. Her er avståelse et moralsk valg, ikke kun et tegn på manglende kunnskap.

Det er avgjørende at modellen skiller mellom disse. Å si «jeg vet ikke» fordi man frykter konsekvensene er forskjellig fra å si det fordi man faktisk ikke har fakta. Brukere fortaper seg raskt hvis modellen unnskylder seg for dumme grunner.

Problemet med tid og utdatert kunnskap

En spesiell type feil skjer med tidsbestemt informasjon. En studie fra 2024-2025 med tittelen «When Silence Is Golden» fokuserer på akkurat dette. La oss si at du spør: «Hvem er presidenten i land X?»

Hvis modellen ble trent på data fra før valget, vil den sannsynligvis nevne den tidligere presidenten. Men den gjør det ofte med full selvtillit. Den «hallusinerer» ikke bevisst, men den presenterer gammel informasjon som om den var aktuell. Dette er farlig fordi svaret flyter fint, men er misvisende.

Løsningen her er å trene modellen på å gjenkjenne når tiden i spørsmålet ligger utenfor dens treningshorisont som den tidspunkt frem til hvilken modellen har lært informasjon. Når modellen ser at datoen overstiger treningsgrensen, bør den automatisk trigge en avståelsesmekanisme istedenfor å gjette.

Tre ånder representerer usikkerhet, umulighet og etikk foran et tøvende AI-kjerne

Hvordan vi får modeller til å innrømme usikkerhet

Det er ikke nok å ønske at modellen skal være ærlig. Vi må programmere mekanismer for det. Her er noen av metodene forskere tester:

Sannsynlighetsterskler: Systemet sjekker modellens interne «selvtillitspoeng». Hvis sannsynligheten for neste ord faller under en viss grense, blokkeres svaret.
Eksterne verifikatorer: En mindre, spesialisert AI-modell leser førstespørsmålet og det foreslåtte svaret. Dersom verifikatoren mener svaret er feil, erstattes det med et «jeg vet ikke».
Self-evaluation (Selvvurdering): Etter at modellen har generert et svar, blir den bedt om å vurdere det selv: «Er svaret over sant eller usant?» Hvis den svarer «usant», vises svaret ikke.
Komite-metoden: Flere ulike AI-modeller (f.eks. en ekspert i fakta, en i matematikk, en i sunn fornuft) svarer hver for seg. Hvis de ikke kommer enig, avstår systemet.

Disse metodene øker kostnadene. Å bruke flere modeller eller flere beregninger tar tid og ressurser. Derfor må vi finne balansen mellom nøyaktighet og hastighet, spesielt i applikasjoner der brukere forventer umiddelbare svar.

Design av trygge ikke-svar

Når modellen har bestemt seg for å avstå, hvordan skal den formidle det? I dag ser vi ofte lange, unnskyldende tekster som: «Jeg beklager, men jeg kan ikke hjelpe deg med det fordi...»

Brukere finner dette irriterende og nedlatende. En bedre tilnærming, foreslått i diskusjoner på plattformer som LessWrong, er å separere den tekniske beslutningen fra brukerinteraksjonen. Bak kulissene kan modellen sende et spesialsignal (la oss kalle det <AVSTÅ>) til systemet. Dette signalet er maskinlesbart og tydelig for utviklere som overvåker sikkerheten.

For brukeren kan vi derimot vise noe mer konstruktivt. Istedenfor bare å si nei, kan modellen:

Fortelle hvorfor den ikke vet (f.eks. «Dette hendte etter min siste oppdatering»).
Gi alternative veiledninger («Jeg vet ikke svaret, men her er lenker til steder der du kan finne det»).
Stille avklarende spørsmål for å innsnevre temaet.

Målet er at «ikke-svaret» fortsatt føles hjelpsomt, ikke som en dør i ansiktet.

AI-avatarene stemmer for å avstå og tilbyr hjelpsomme alternativer i et lyst rom

Sammenligning av avståelsesmetoder

Sammendrag av vanlige teknikker for å håndtere usikkerhet i AI
Metode	Hvordan det fungerer	Fordeler	Ulemper
Sannsynlighetsterskel	Blokkerer svar hvis modellens intern konfidens er lav.	Raskt og billig å implementere.	Modeller er ofte dårlig kalibrert; kan gi falske alarmer.
Ekstern verifikator	En annen modell vurderer svarets korrekthet.	Høy presisjon; fanger opp komplekse feil.	Øker ventetid og beregningskostnader.
Chain-of-Thought (CoT)	Modellen tenker høyt før den svarer.	Bedre logikk; reduserer tilfeldige feil.	Krever mer tekstgenerering; tregere.
Komite/Majoritet	Flere modeller stemmer; hvis de uenige, avstår.	Meget robust mot ensomme feil.	Veldig ressurskrevende (flere API-kall).

Veien videre mot troverdige AI-systemer

Industrien beveger seg bort fra «svare alltid» og mot «svar når du er sikker». Dette er en fundamental endring i hvordan vi bygger kunstig intelligens som teknologi som etterligner menneskelig intelligens og lærer fra data. Ved å integrere avståelsesmekanismer får vi ikke bare færre hallusinasjoner, vi får også høyere total nøyaktighet.

Når en modell tør å si «jeg vet ikke», frigjør den seg fra presset å lyve. Det gjør den til en mer pålitelig partner for studenter, forskere og profesjonelle. Fremover vil vi se strengere standarder i sensitive sektorer som helsevesen og jus, der feilinformasjon kan ha alvorlige konsekvenser. Da vil evnen til å avstå ikke være en bug, men en feature.

Post Comments (10)

Olav Finne

June 18, 2026 AT 08:52

Dette er en grunnleggende misforståelse av hvordan LLMs fungerer. Det handler ikke om 'tillit' eller 'moral', det handler om sannsynlighetsfordelinger og token-prediksjon. Begrepet 'hallusinasjon' er et antropomorft begrep som ikke har noen teknisk betydning i modellens arkitektur. Modellen 'fantaserer' ikke; den maksimerer log-likelihooden basert på treningsdataene sine. Når folk snakker om 'avståelse' (abstention), ignorerer de ofte at dette krever ekstern verifisering eller kalibrering av konfidensscore, noe som øker latensen dramatisk. Det er ingen magisk bryter inne i transformer-lagene som sier 'jeg vet ikke'. Det er en post-processing mekanisme eller en finjustering med negative samples. Uten denne distinksjonen blir diskusjonen ren pseudovitenskap.

Silje Løkstad

June 19, 2026 AT 04:37

Oh wow, så typisk Olav å komme med sin kjedelige, jargon-tunge forelesning :P Du forstår ingenting av menneskelig interaksjon! Vi trenger ikke dine tørre statistikker, vi trenger AI som faktisk kan håndtere nyanser uten å kræsje hele systemet. Det er jo helt absurd å tro at brukere bryr seg om 'log-likelihood'. De vil ha svar! Og hvis svaret er feil, er det din skyld for at du ikke har trent modellen riktig. Hold opp med å bagatellisere problemet med at disse maskinene luger til oss! Det er farlig og dumt! :D

Elin Lim

June 20, 2026 AT 09:45

Etikk er ikke en feature det er en nødvendighet. Maskiner bør vite sine grenser. Tysthet er gull.

Kari Viitanen

June 20, 2026 AT 16:07

Jeg setter stor pris på den faglige diskusjonen her. Det er viktig at vi reflekterer over de etiske implikasjonene av teknologiutviklingen. Som Kari Viitanen mener jeg at empati også må inn i designet. Hvis en bruker føler seg avvist når modellen sier 'jeg vet ikke', mister vi tilliten. Derfor er formuleringen like viktig som selve beslutningen om å avstå. Vi bør sikre at språket er inkluderende og forståelig for alle, uansett teknisk bakgrunn. Dette er en kompleks utfordring som krever tverrfaglig samarbeid mellom lingvister, psykologer og ingeniører for å løse på en god måte.

Runa Kalypso

June 22, 2026 AT 13:38

Hei hei! Jeg er helt enig med deg Kari. Det er så fint at man tenker på brukeren. Jeg syntes det var litt tungt lesing med alt det der med 'epistemisk usikkerhet' men poenget står klart. Vi må være snille mot AI'en også hehe. Men ja, stavefeil skjer vel hos meg dessverre, håper dere skjønner hva jeg mente. Det er viktig med dialog!

Even Ødegård

June 24, 2026 AT 05:47

Haha dere tror virkelig at dette er for sikkerheten? Nei nei. Det er bare en unnskyldning for at tech-gigantene vil spare penger på servere. Hvis de lar AI-en tenke selv, bruker den mer strøm. Så de programmerer den til å si 'jeg vet ikke' slik at de slipper å betale for dyrebare beregninger. Det er en konspirasjon! De vil kontrollere hva vi får vite. Hvert gang spørsmålet er politisk sensitivt, klikker det inn. Tenk selv etter. Hvorfor skal vi stole på dem?

Kathinka Haugsand

June 26, 2026 AT 01:32

Kjære Even, du mangler helt den intellektuelle kapasiteten til å forstå algoritmisk effektivitet. Det er ikke en konspirasjon, det er optimalisering. Men ja, det er kanskje skummelt at de rike bestemme hva som er 'fakta'. Likevel, din naive synspunkt er nesten sørgelig. La oss håpe at de som designer disse systemene har bedre smak enn deg. Smil gjerne videre mens verden endrer seg under deg :)

Kristian Krokslett

June 27, 2026 AT 19:04

Det er interessant å se på komité-metoden nevnt i artikkelen. I praksis ser jeg at mange selskaper nå implementerer RAG (Retrieval-Augmented Generation) sammen med avståelsesmekanismer. Ved å hente opp dokumenter fra en vektorettdatabase før generering, reduserer man epistemisk usikkerhet betydelig. Hvis ingen relevante dokumenter finnes, kan systemet trygt avstå. Dette kombinerer hastigheten til LLM med nøyaktigheten til databaser. Det er en robust løsning for enterprise-applikasjoner.

Gunnar Bye

June 28, 2026 AT 16:16

Ja, RAG er jo kjempemorball! :D Men husk at det koster i skykostnader. Hver query som trengs for å sjekke fakta tar tid. Brukere har kort tålmodighet. Hvis ventetiden overstiger 2 sekunder, dropper de appen. Så teoretisk flott som det høres ut, praktisk sett er det en balanseakt. Jeg tester gjerne nye ting, men virkeligheten er hard. La oss håpe hardwaren blir billigere snart! :P

Kristine Lou

June 29, 2026 AT 04:20

jeg tenkte bare at det var artig at man kan programmere en maskin til å holde kjeft. det høres ut som noe vi burde gjort tidligere. bra artikkel egentlig, lett å forstå selv om jeg ikke er tech-ninja.