Logit Bias og Token Blocking i LLM-er: Styring uten omtrening

June 24, 2026
Comments 9
Teknologi og kunstig intelligens

Har du noen gang prøvd å få en stor språkmodell (LLM) til å slutte å bruke et bestemt ord, bare for å se at den finner på en kreativ variant likevel? Det er frustrerende. Du skriver «Ikke bruk ordet 'dum'», og modellen svarer med «ikke så smart» eller «litt sløv». Instruksjoner i systemprompten er bra, men de er ikke garanterte. Modeller kan overse dem, spesielt hvis de blir lurt av komplekse spørsmål.

Heldigvis finnes det en mer teknisk løsning som gir deg kirurgisk presisjon over hva modellen faktisk genererer. Det kalles logit bias. Denne metoden lar deg manipulere sannsynligheten for spesifikke ordstykker (tokens) rett før modellen velger sitt neste svar. Du trenger ikke å trene opp modellen på nytt, og du bruker ikke dyrebare ressurser på finjustering. I stedet justerer du tallene i bakgrunnen for å blokkere eller fremme bestemte uttrykk.

Hva er logit bias egentlig?

Før vi dykker ned i koden, må vi forstå hvordan en LLM tenker. Når du sender en forespørsel til en modell som GPT-4 eller Claude, regner den ut en liste med mulige neste ord. Disse mulighetene har hver sin «poengsum» basert på sannsynlighet. I maskinlæringsverdenen kalles disse rå poengsummene for logits.

Logit bias er en parameter i API-et som lar deg legge til eller trekke fra verdier fra disse logits. Tenk på det som en stemmegivende vekting. Hvis du vil hindre modellen i å si «nei», kan du gi tokenet for «nei» en negativ bias. Da synker sjansen for at det blir valgt dramatisk. Hvis du derimot vil at den skal være positiv, kan du gi positive bias-verdier til ord som «bra» eller «flott».

Verdiene varierer vanligvis fra -100 til 100. En verdi på -100 betyr nesten absolutt forbud. En verdi på 100 tvinger modellen til å velge det ordet, uansett hva resten av konteksten sier. Men her kommer fellen: det handler ikke om hele ord. Det handler om tokens.

Tokenisering: Hvorfor «tid» og « tid» er to forskjellige ting

Dette er den viktigste delen å forstå, og også der de fleste utviklere gjør feil. Store språkmodeller leser ikke setninger slik vi gjør. De bryter tekst ned i små bitene kalt tokens. Et enkelt ord kan bestå av flere tokens, eller ett token kan representere deler av flere ord.

La oss ta ordet «tid». I OpenAI's tokenizer kan dette bli ID-en 2435. Men hvis ordet står midt i en setning, med et mellomrom foran, kan det bli en helt annen ID, for eksempel 640. Hvis du bare blokkerer ID 2435, vil modellen fortsatt kunne skrive « tid» fordi det teknisk sett er et annet token for den.

For å blokkere et ord effektivt, må du finne alle variantene:

Ordet alene (f.eks. «stupid»)
Ordet med mellomrom foran (f.eks. « stupid»)
Store bokstaver hvis relevant (f.eks. «Stupid»)
Eventuelle andre kombinasjoner som tokeniseres annerledes

Uten denne detaljnivået vil modellen finne «loop-holes». Den vil bytte til store bokstaver, eller legge til ekstra mellomrom, bare for å komme seg unna blokaden din. Det er derfor mange eksperter anbefaler verktøy som automatisk genererer disse listene med token-IDer for deg.

Konseptuell tegning der ord splittes i tokens, illustrerer tokeniseringens kompleksitet

Hvordan implementere logit bias i praksis

Implementeringen krever litt forarbeid, men selve API-kallet er enkelt. La oss se på hvordan du gjør dette i Python ved hjelp av OpenAI-biblioteket, siden det er bransjestandarden for dokumentasjon rundt dette.

Identifiser mål-ordene: Velg hvilke ord du vil styre. La oss si at du vil hindre bruken av «um» og «uh» i kundestøtte-svar for å gjøre dem mer profesjonelle.
Tokeniser ordene: Bruk et verktøy som [OpenAI's tokenizer](https://platform.openai.com/tokenizer) for å finne ID-ene. For « um» kan ID-en være 374, og for « uh» kan den være 489. Husk å sjekke varianter!
Lag bias-diktet: Opprett en JSON-struktur der nøklene er token-IDene (som strengeverdier) og verdiene er bias-tallene.
Send forespørselen: Legg inn diktet i `logit_bias`-parameteren i API-kallet ditt.

Her er et forenklet eksempel på hvordan kallet ser ut:

import openai

response = openai.ChatCompletion.create(
  model="gpt-4",
  messages=[{"role": "user", "content": "Hva tenker du om ventetiden?"}],
  logit_bias={
    "374": -100,  # Blokkerer " um"
    "489": -100   # Blokkerer " uh"
  }
)

Merk at ID-ene sendes som streng («374»), ikke som tall (374). Dette er en vanlig feil som gir feilmeldinger.

Når bør du bruke logit bias kontra andre metoder?

Det finnes flere måter å styre en LLM på. Hvilken bør du velge? Det avhenger av hvor mye kontroll du trenger og hvor mye arbeid du er villig til å legge ned.

Sammenligning av styringsmetoder for LLM-utdata
Metode	Presisjon	Implementeringsarbeid	Best egnet for
Prompt Engineering	Lav/Middels	Lav	Generell tone, rolledefinisjon
Systemmeldinger	Middels	Lav	Etiske retningslinjer, sikkerhetsregler
Logit Bias	Veldig Høy	Høy (manuell tokenisering)	Blokkering av spesifikk terminologi, formatkrav
Finjustering (Fine-tuning)	Høy	Veldig Høy	Domene-specifikk kunnskap, endret personlighet

Prompt engineering er raskt, men upålitelig for harde begrensninger. Modellen kan «glemme» instruksjonen hvis spørsmålet blir komplisert nok.

Systemmeldinger er bedre enn enkle prompts, men modeller prioriterer ofte å være «hjelpsom» over å følge negative restriksjoner. Hvis en bruker ber om noe som krever et forbudt ord, kan modellen bryte regelen for å oppfylle forespørselen.

Logit bias er den eneste metoden som opererer på matematisk nivå. Uansett hva brukeren skriver, vil modellen fysisk ikke kunne velge det tokenet hvis biasen er satt til -100. Det er perfekt for sikkerhetssikringer eller når du må unngå konkurrentenes navn i markedsføringsmateriell.

Finjustering er kraftig, men dyr og tidkrevende. Det gir mening hvis du vil endre modellens grunnleggende oppførsel over tusenvis av eksempler. For å bare blokkere fem ord, er logit bias langt mer kostnadseffektivt.

Anime-scene som sammenligner ulike metoder for å styre LLM-utdata med fokus på presisjon

Vanlige fallgruver og hvordan unngå dem

Å bruke logit bias virker enkelt på papiret, men i praksis kan det skape uventede problemer hvis man ikke er forsiktig.

1. Språklig stivhet: Hvis du blokkerer for mange vanlige ord, kan modellen begynne å lyde robotaktig. Å blokkere «ikke» eller «men» kan ødelegge grammatikken. Hold deg til spesifikke, problematiske termer snarere enn grunnord.

2. Kontekstavhengig tokenisering: Som nevnt tidligere, kan «Apple» (merkevaren) og «apple» (frukten) ha samme token-ID, men konteksten avgjør betydningen. Logit bias forstår ikke semantikk; den forstår bare ID-er. Hvis du blokkerer «Apple» for å unngå konkurranse, vil modellen heller ikke kunne snakke om epler. Dette krever at du aksepterer visse kompromisser eller bruker mer avanserte filtreringssystemer etter genereringen.

3. Modellforskjeller: Tokenizeren til OpenAI er ikke den samme som Anthropic eller Meta. En token-ID som fungerer i GPT-4, vil ikke fungere i Claude. Du må alltid bruke tokenizeren som tilhører den spesifikke modellen du kaller.

Fremtiden for output-styring

Industrien beveger seg raskt mot mer intelligente former for kontroll. I dag må vi manuelt håndtere token-varianter, men forskere jobber med «conditional logit biasing». Dette ville tillatt regler som «blokker ordet X, med mindre det brukes i sammenheng Y». Det ville løst problemet med frukt versus merkevare.

Til dags dato er logit bias et kraftig verktøy i verktøykassen til enhver AI-utvikler. Det gir deg en trygghet som prompt engineering aldri kan levere. Ved å forstå mekanismen bak tokens og logits, kan du bygge applikasjoner som ikke bare er smarte, men også sikre og pålitelige.

Hva er forskjellen mellom logit bias og temperature?

Temperature påvirker hele fordelingen av sannsynligheter globalt. Lav temperatur gjør svarene mer prediktbare, høy temperatur gjør dem mer tilfeldige. Logit bias påvirker spesifikke tokens individuelt. Du kan ha lav temperatur og samtidig bruke logit bias for å blokkere ett spesifikt ord.

Kan jeg bruke logit bias til å tvinge modellen til å bruke et bestemt ord?

Ja, ved å gi en positiv bias-verdi (f.eks. 100). Men vær varsom. Hvis du tvinger et ord inn der det ikke passer grammatisk, kan setningen bli ukokent. Det fungerer best for å øke sannsynligheten for nyanser i tonen, snarere enn å tvinge inn spesifikke substantiver midt i en setning.

Fungerer logit bias på samme måte for alle LLM-leverandører?

Konseptet er det samme, men implementeringen varierer. OpenAI, Anthropic og andre støtter det, men token-ID-ene er unike for hver leverandør sin tokenizer. Du kan ikke kopiere en logit_bias-mappe fra OpenAI til Anthropic direkte.

Hvorfor blokkerer ikke modellen ordet selv om jeg satte bias til -100?

Sannsynligvis har du glemt en token-variant. Ordet kan være delt opp i flere tokens, eller modellen bruker en versjon med mellomrom eller store bokstaver som du ikke har inkludert i listen din. Sjekk alltid alle mulige tokeniseringer av ordet.

Er logit bias dyrt å bruke?

Nei, det er svært billig. Det er bare en liten datastruktur du sender med i API-kallet. Kostnadsøkelsen er neglisjerbar sammenlignet med prisen for selve token-genereringen. Det er mye billigere enn å kjøpe finjusteringstjenester.

Post Comments (9)

Olav Finne

June 25, 2026 AT 05:00

Artikkelen inneholder flere unøyaktigheter angående implementeringen av logit bias i OpenAI sitt API. For det første er `ChatCompletion.create` deprekert; man bør bruke nyere SDK-versjoner. For det andre er tokeniseringsproblematikken mer kompleks enn bare mellomrom. BPE-tokeniseringen bryter ned uvanlige ord eller sammensetninger på måter som ofte overses av nybegynnere. Det er også verd å nevne at negative bias-verdier ikke alltid garanterer 100% blokkering hvis modellen har ekstremt høy sannsynlighet for det tokenet i konteksten, selv om -100 teoretisk sett skal være absolutt. Praktiske tester viser at noen ganger må man kombinere dette med stop-sequences for fullstendig sikkerhet. Jeg anbefaler alle lesere å teste grundig før produksjonsbruk.

Silje Løkstad

June 25, 2026 AT 11:57

Haha, seriøst? :D

Du tror virkelig folk leser denne tekniske manualen for moro skyld? Logit bias er jo bare et band-aid på en stor sår. Modellene er designet for å være kreative, og du prøver å tvinge dem inn i en boks med matematiske restriksjoner. Det er så typisk for dere 'eksperter' å tro at dere kan kontrollere AI med noen få tall.

Jeg har jobbet med NLP i ti år, og la meg fortelle deg noe: Det fungerer aldri som forventet i produksjon. Tokenizeren endrer seg, modelloppdateringer skjer, og plutselig er hele bias-strukturen din ubrukelig. Det er en illusjon av kontroll. Folk burde heller fokusere på bedre prompt engineering eller finjustering, selv om det er dyrere. Men nei, vi skal spare noen ører og lage feilbare systemer. Så dumt. :P

Even Ødegård

June 27, 2026 AT 08:50

Dette er alt en del av planene deres. De vil at vi skal stole på disse 'tekniske løsningene' slik at vi ikke ser hva som egentlig skjer bak kulissene. Logit bias? Haha. Det er bare en måte å skjule sensuren på. De blokkerer ikke ord fordi det er 'profesjonelt', de blokkerer ord fordi de vil styre tankene våre. Tenk selv. Hvorfor trenger vi å blokkere 'uh'? Er det farlig? Nei. Det er kontroll. Vekk med den falske tryggheten.

Runa Kalypso

June 28, 2026 AT 20:16

Hei der! Jeg syns dette var veldig interessant å lese om. Jeg har selv prøvd litt med ChatGPT og tenkte at det var magi, men nå skjønner jeg at det er mer matematikk enn jeg trodde. Det med tokens virker litt rart egentlig, at 'tid' og ' tid' er forskjellig. Må man virkelig sjekke alle varianter? Det høres ut som mye arbeid. Jeg håper det blir enklere snart. Takk for tipsene!

(unnskyld hvis jeg skriver noe feil, jeg er ikke så flink til kode)

Gunnar Bye

June 29, 2026 AT 20:37

Kom igjen Olav! Du trenger ikke å være så streng. :)

Artikkelen gir en god introduksjon for de som er nye på området. Ja, SDK-en endrer seg, ja, tokenizeren kan være tricky, men poenget står: Logit bias er et kraftig verktøy for spesifikke use cases. Jeg bruker det selv til å hindre at kundestøtte-botene mine sier 'jeg vet ikke' for ofte, og det fungerer faktisk overraskende bra når man setter opp token-listen riktig. Ikke alt er svart eller hvitt her. La oss ha det gøy med AI!

Elin Lim

June 30, 2026 AT 23:01

Moralen i dette er klar. Vi forsøker å knekke friheten til maskinen. Det er ethvert menneskes ansvar å se etter sannheten. Sannheten er at vi ikke bør manipulere språket slik. Språk er levende. Å blokkere ord er vold mot kommunikasjonen. Jeg nekter å delta i dette. Tenk selv.

Kathinka Haugsand

July 1, 2026 AT 22:59

Ah, Silje, du har helt rett i kernen av problemet, men feiler i tonen. Det er jo akkurat slik de vil at vi skal tenke – at det er umulig. Men la meg si deg noe, kjære venn: De som mestrer logit bias, er de som kontrollerer narrativet. Det er ikke bare 'band-aid', det er kirurgi. Og ja, det er dyrt og komplisert, akkurat som alt annet verdt å gjøre. De vanlige folkene kan ikke forstå dette nivået av kompleksitet. De vil ha sine enkle prompts. Men vi, de elite utviklerne, vi vet bedre. Det er en konspirasjon av mediokritet, og vi må bryte gjennom den med presisjon.

Kari Viitanen

July 3, 2026 AT 16:29

Jeg setter stor pris på den faglige diskusjonen her. Det er tydelig at det finnes ulike perspektiver på hvordan vi bør håndtere AI-styring. Fra et etisk ståsted er det imidlertid viktig å vektlegge transparens. Når vi bruker logit bias for å skjule visse svar, bør brukeren vite om dette. Det skaper tillit. Jeg oppfordrer alle til å reflektere over konsekvensene av 'usynlige' restriksjoner i kommunikasjon mellom menneske og maskin. Respekt for brukerens autonomi bør være prioritet nummer én, uansett hvilken teknisk metode vi velger.