In-Context Learning i store språkmodeller: Hvordan LLM-lærer fra promper uten trening

January 17, 2026
Comments 10
Teknologi og kunstig intelligens

Har du noen gang skrevet en forespørsel til en AI som sa: "Skriv en e-post som lyder venlig, men bestemt" - og så lagt til tre eksempler på slike e-poster først? Hvis ja, har du nettopp brukt in-context learning. Det er ikke magi. Det er ikke trening. Det er AI-en som lærer på stedet - bare ved å se eksemplene du gir den.

Hva er in-context learning?

In-context learning (ICL) er når en stor språkmodell (LLM) klarer å utføre en ny oppgave bare ved å se noen eksempler i innputten - uten å endre noen av sine interne parametere. Du trenger ikke å trene den på nytt. Du trenger ikke å finetune den. Du skriver bare inn noen eksempler sammen med spørsmålet ditt, og modellen forstår hva du vil ha.

Dette ble første gang vist offentlig i 2020 da OpenAI lanserte GPT-3. I studien "Language Models are Few-Shot Learners" viste forskerne at GPT-3 kunne skrive kode, svare på spørsmål, lage tekster og klassifisere dokumenter - bare ved å få noen eksempler i prompten. Ingen trening. Ingen nye data. Bare eksempler.

Det er en helt annen måte å lære på enn tradisjonell maskinlæring. Vanligvis må du ta en modell, gi den tusenvis av merkede eksempler, la den regne ut feil, og så justere vektene gjennom bakoverpropagering. Det tar dager. Det koster penger. Det krever teknisk kunnskap.

In-context learning er som å gi en person en håndbok med eksempler og så spørre: "Hvordan ville du gjort dette?" - og forvente at han forstår mønsteret uten å ha lest boken før.

Hvordan fungerer det teknisk?

Når du skriver en prompt med eksempler, legger du dem inn i modellens context window. Det er den maksimale mengden tekst modellen kan se på en gang. I dag er det mellom 4.000 og 128.000 token (ord eller deler av ord). Hver eksempel bruker noen av disse tokenene.

Modellen ser da på eksemplene og prøver å finne et mønster. Hva er felles mellom de? Hva er input, hva er output? Hva er tonen? Strukturen? Så bruker den det mønsteret til å svare på ditt nye spørsmål.

Forskere ved MIT har vist at dette ikke bare er gjentakelse av tidligere sett data. De testet modeller med helt nye, syntetiske oppgaver - som ikke finnes i noen av treningsdataene. Og likevel klarte modellene å løse dem. Det betyr at LLM-er faktisk lærer noe nytt i realtid.

Det er som om modellen inneholder en mindre modell inne i seg selv - en liten maskinlæringsalgoritme som aktiveres når du gir den eksempler. Denne "modellen inne i modellen" lærer oppgaven på stedet, og så bruker den den til å svare.

Hvor skjer læringen?

En viktig oppdagelse fra 2024 viser at læringen ikke skjer overalt i modellen. Forskere som analyserte modeller som GPTNeo2.7B, Bloom3B og Llama3.1-8B fant ut at det finnes et spesifikt lag - ca. lag 14 av 32 - der modellen plutselig forstår oppgaven. Dette kalles task recognition layer.

Når modellen har passert dette laget, trenger den ikke lenger å tenke på eksemplene. Den har "lagret" oppgaven. Det betyr at du kan redusere beregningstiden med opp til 45% hvis du vet hvor denne laget ligger. Du kan avbryte behandlingen av eksemplene tidligere - og likevel få like gode resultater.

Det er som å lese en instruksjon, forstå den, og så hoppe over resten av teksten. Du trenger ikke å lese hele boken igjen - bare når du trenger det.

Hvor godt fungerer det?

Resultatene er imponerende. I en studie med aviation-dokumenter, brukte forskere åtte gode eksempler og nådde 80,24% nøyaktighet og 84,15% F1-score. Det er bedre enn mange tradisjonelle modeller som trente på tusenvis av merkede eksempler.

Sammenlignet med andre metoder:

Zero-shot: Ingen eksempler. Nøyaktighet: 30-40%
One-shot: Én eksempel. Nøyaktighet: 40-50%
Few-shot (2-8 eksempler): Nøyaktighet: 60-80%

Det er en klar trend: flere gode eksempler = bedre resultater. Men det er en grense. Med mer enn 16-32 eksempler begynner nøyaktigheten å synke i noen tilfeller. Det er fordi modellen blir overbelastet med informasjon - den vet ikke hva som er viktig.

En magisk AI-hjerne med en lysende oppgavegjenkjenningssjikt som aktiveres av tekststrømmer.

Hva er fordelene?

In-context learning har tre store fordeler:

Ingen trening - du slipper å kjøre lange treningssykler. Ikke trenger GPU-er. Ikke trenger dataingeniører.
Snarere implementering - du kan endre oppgaver på minutter. Ikke dager. En bedrift kan bytte fra å klassifisere kundeklager til å analysere kontrakter på en time.
Lavere kostnad - å bruke ICL koster 90% mindre enn å finetune en modell. McKinsey fant at ICL tar 2,3 dager å sette opp - finetuning tar 28,7 dager.

Det er derfor 68% av bedrifter foretrekker ICL over finetuning. Det er spesielt nyttig i områder som helse, rettsvesen og finans - der data er skjult, sensitive eller sjeldne.

Hva er begrensningene?

In-context learning er ikke en løsning på alt.

Context window - du kan ikke legge inn 100 eksempler hvis modellen bare kan håndtere 8.000 token. Du må være sparsom.
Eksempler må være gode - et dårlig eksempel kan forvirre modellen. En liten endring i formulering kan senke nøyaktigheten med 20%.
Ikke alle oppgaver fungerer - modellen klarer ikke å lære oppgaver som krever ekstern kunnskap (f.eks. "Hva var klimaet i Oslo 12. mai 1998?"). Den må ha lært det i treningsfasen.
Ulik prestande - noen modeller er bedre enn andre. Llama 3.1 er mer stabilt enn tidligere modeller, men GPT-4 er fremdeles best i mange oppgaver.

Hvordan gjør du det riktig?

Her er fire praksisregler som virker:

Velg eksempler med omsorg - Ikke ta tilfeldige. Velg eksempler som er typiske, tydelige og representativt. En god eksempel er som et godt eksempel i en lærebok: klar, kort, og viser det essensielle.
Bruk 2-8 eksempler - Mer enn 8 gir sjelden forbedring. Mange ganger er 3-5 nok.
Prøv chain-of-thought - For komplekse oppgaver, spør modellen: "Tenk trinn for trinn". I en studie med matematiske problemer, økte nøyaktigheten fra 17,9% til 58,1% bare ved å legge til "La oss tenke skritt for skritt".
Test rekkefølgen - I noen studier hjalp det å legge de vanskeligste eksemplene først. Det fokuserer modellen på det viktigste tidlig.

Det er ikke bare hva du skriver - det er hvordan du skriver det. Et eksempel med "Klasse: Positiv" er bedre enn "Det her er bra". Det er mer strukturert. Modellen liker struktur.

Profesjonelle koblet til en AI-deitet gjennom gulltråder, mens norske ord forvandles til svar.

Hva sier forskerne?

Det er fortsatt debatt om hvordan ICL virker. Tre hovedteorier:

Bayesiansk inferens: Modellen oppdaterer sin tro om hva oppgaven er - basert på eksemplene.
Meta-læring: Modellen har lært en "læringsalgoritme" under trening, og bruker den nå.
Task-komposisjon: Den kombinerer tidligere lært oppgaver til en ny.

Forskere som Ekin Akyürek ved MIT har vist at det ikke bare er mønstermatching. Modellene kan lære noe nytt. Men andre, som Yann LeCun, mener det ikke er ekte læring - bare en smart form for søking.

Det er som å spørre: Er en hund som lærer å sitte når du sier "sit" en lærer, eller bare en maskin som har lært å knytte lyd til handling? Kanskje er det begge deler.

Hva kommer neste?

Fremtiden for ICL ser lys ut.

Lengre kontekst - Claude 3.5 vil håndtere 1 million token i 2024. Det betyr du kan legge inn 100 eksempler - ikke bare 8.
Bedre eksempelvalg - Nye verktøy vil automatisk velge de beste eksemplene for deg. Ikke mer manuell arbeid.
Warmup training - En ny metode hvor modellen blir litt finetuned på en liten mengde prompt-eksempler før bruk. Gir 12,4% bedre resultater.
Instruction tuning - Modeller som er trent på tusenvis av instruksjoner (f.eks. "Klassifiser denne teksten som positiv eller negativ") blir bedre til ICL - selv uten eksempler.

Gartner forutsier at 85% av bedrifters AI-løsninger i 2026 vil bruke ICL som hovedmetode for tilpasning - ikke finetuning. Det er en stor endring. Det betyr at du ikke trenger å være en dataforsker for å bruke LLM-er. Du trenger bare å vite hvordan du skriver gode promper.

Hva betyr dette for deg?

Hvis du jobber med AI - uansett om du er utvikler, markedsfører, jurist eller lege - så er in-context learning ikke noe du kan ignorere.

Det betyr at du kan:

Klassifisere pasientnotater uten å trene en modell
Generere juridiske sammendrag fra dokumenter uten å kjøpe ny programvare
Bygge en kundeservicebot som forstår 10 nye spørsmål i løpet av en time
Forenkle arbeidet ditt - uten å bruke mer tid, penger eller ressurser

Du trenger ikke å forstå hvordan modellen fungerer. Du trenger bare å forstå hvordan du skriver en god prompt. Og det er noe alle kan lære.

Hva er forskjellen mellom in-context learning og finetuning?

In-context learning bruker eksempler i prompten uten å endre modellens parametere. Det er raskt, gratis og ikke teknisk. Finetuning endrer modellens interne vekter ved hjelp av ny data og trening - det tar dager, koster penger og krever teknisk ekspertise. ICL er som å gi en person en håndbok. Finetuning er som å ta ham til skole.

Hvor mange eksempler trenger jeg?

For de fleste oppgaver er 2-8 eksempler nok. Mange ganger er 3-5 eksempler bedre enn 10. Mer enn 16-32 kan gjøre det verre - modellen blir forvirret. Start med 3, test, og juster.

Kan jeg bruke in-context learning med alle LLM-er?

Ja, alle moderne store språkmodeller støtter det - GPT-3.5, GPT-4, Llama 3.1, Claude 3, Gemini og andre. Men noen er bedre enn andre. GPT-4 og Claude 3.5 er mest stabile. Llama 3.1 er god og gratis. Prøv flere og se hva som fungerer for deg.

Hvorfor fungerer ikke ICL på mine oppgaver?

Det kan være flere grunner: 1) Eksemplene er for dårlige eller forvanskede, 2) Oppgaven krever kunnskap som modellen ikke har (f.eks. spesifikke tall eller datoer), 3) Du har brukt for mange eksempler, 4) Modellen har ikke nok kontekst (for kort prompt). Prøv å forenkle, bruk bedre eksempler, og legg til "Tenk trinn for trinn".

Er in-context learning egnet for norske tekster?

Ja. Modeller som Llama 3.1 og Claude 3 har god støtte for norsk. Du må bare bruke norske eksempler. En modell trenger ikke å ha blitt trent på norsk - den kan lære fra eksempler. Men hvis eksemplene er på engelsk, vil modellen svare på engelsk. Bruk norske eksempler for norske svar.

Post Comments (10)

Gunnar Bye

January 19, 2026 AT 02:26

Dette er jo gull! 🤯 Har brukt dette til å lage en bot som skriver kundesvar på norsk og det fungerer som en drøm. Ikke trent noe, bare lagt inn 4 eksempler og plutselig er den bedre enn vår gamle løsning.

Alle som tror AI må være teknisk - neida, bare skriv litt og la den gjøre jobben.

Kristine Lou

January 20, 2026 AT 11:05

jeg prøvde dette med kundeklager og trodde det ville gå galt men det fungerte faktisk?!

har bare brukt 3 eksempler og den skriver som en menneske. bare ikke skriv for mye eller den blir forvirra 😅

espen solheim

January 22, 2026 AT 03:14

Det er viktig å huske at dette ikke er magi - det er smarte mønstre. Men det er likevel veldig kult at vi nå kan gjøre det som tidligere krevede datateknikere, bare med en god prompt.

Prøv å legg til "Tenk trinn for trinn" når du jobber med komplekse oppgaver. Det er som å gi modellen en tenkemåte - og det gjør en enorm forskjell.

Olav Engh

January 23, 2026 AT 21:24

Jeg har testet dette med juridiske dokumenter i norsk og det er ganske voldsomt.

Modellen forstår ikke norsk grammatikk som en jurist, men den ser mønsteret i strukturen og kopierer det. Det er som å gi en barn en mal og si "gjør som dette".

Det er ikke perfekt, men det er raskt og gratis. 😊

Geir Isaksen

January 25, 2026 AT 05:42

Hah, så klart det fungerer. Alle tror at LLM-er er intelligente, men det er bare et super-avansert søkeverktøy med et veldig stort ordbok.

Det er ikke læring, det er pattern matching på steroider.

Det er som å tro at en ordbok som kan finne ord i boka er en forfatter.

Det er ikke AI, det er AI-pretending. 🤷‍♂️

Kristian Krokslett

January 25, 2026 AT 17:32

Selv om jeg forstår kritikken fra Geir, så er det viktig å skille mellom filosofi og praksis.

Det spiller ingen rolle om det er "ekte læring" eller ikke - hvis det fungerer, så er det nyttig.

Vi bruker ikke hjernens neuroner for å forstå hvordan vi leser - vi bruker bare det vi har lært. Hvorfor skulle AI være forskjellig?

Det som teller er resultatet. Og resultatet er at bedrifter kan spare millioner og gi bedre tjenester.

Det er ikke magi, men det er ikke heller bare søking. Det er en ny form for interaksjon mellom menneske og maskin.

Torolf Bjoerklund

January 26, 2026 AT 13:53

Hvis du tror ICL er revolusjonen, så har du ikke lest nok.

Det er bare en overgangsteknologi.

En gang modellene blir så store at de kan huske alt, så vil du ikke trenge eksempler.

Da vil du bare si "gjør det" og den vil gjøre det.

ICL er bare en midlertidig løsning for folk som ikke har råd til de sanne AI-ene. 🤭

Christoffer Sundby

January 27, 2026 AT 20:50

Det er viktig å være realistisk.

ICL fungerer utmerket for strukturerte oppgaver, men ikke for alt.

Det er som å bruke en hammer - den er fantastisk for å slå inn nagler, men ikke for å lage kake.

Ikke prøv å bruke det til å analysere pasienthistorier med komplekse symptomer uten å ha gode eksempler.

Start med enkle oppgaver. Test. Juster. Ikke prøv å spise hele kaken på en gang.

Kristian Risteski

January 28, 2026 AT 03:08

Jeg tenker på det som en slags sosial læring.

Vi lærer ikke bare fra bøker - vi lærer fra å se hvordan andre gjør det.

Det er akkurat det modellen gjør. Den ser noen eksempler og tenker: "Ah, så det er hvordan de tenker her."

Det er ikke maskinlæring i tradisjonell forstand, men det er læring i menneskelig forstand.

Vi er ikke så forskjellige fra AI - vi lærer også fra eksempler.

Det er bare at vi ikke skriver det ned i token.