Gevir KI
Gevir KI
Gevir KI

Tag: post-training quantization

Kvantifiserte Transformer-arkitekturer for Edge LLMer: En praktisk guide
  • May 9, 2026
  • Comments 6
  • Teknologi og kunstig intelligens

Kvantifiserte Transformer-arkitekturer for Edge LLMer: En praktisk guide

Oppdag hvordan kvantifisering gjør store språkmodeller (LLM) brukbare på edge-enheter. Vi gjennomgår PTQ, QAT, INT8/INT4 og verktøy som NVIDIA TensorRT for å redusere minnebruk uten å ofre nøyaktighet.
Read More

Categories

  • Teknologi og kunstig intelligens (142)
  • Verktøy og plattformer (8)
  • Teknologi (1)

recent Posts

Begrenset dekoding for store språkmodeller: JSON, Regex og skjema-kontroll
Begrenset dekoding for store språkmodeller: JSON, Regex og skjema-kontroll
By Marvin Belen
Hvordan store språkmodeller bruker sannsynlighet for å velge ord
Hvordan store språkmodeller bruker sannsynlighet for å velge ord
By Marvin Belen
Brukertilpassing av generativ AI: Gjennomsiktighet og trygge retningslinjer i utdanning
Brukertilpassing av generativ AI: Gjennomsiktighet og trygge retningslinjer i utdanning
By Marvin Belen
Modellkort og styring for generativ AI-samsvar: Hva du må publisere
Modellkort og styring for generativ AI-samsvar: Hva du må publisere
By Marvin Belen
Vibe Coding for Non-Technical Founders: Build a Prototype in Days
Vibe Coding for Non-Technical Founders: Build a Prototype in Days
By Marvin Belen

Popular Tags

generativ AI store språkmodeller LLM vibe coding RAG kunstig intelligens maskinlæring prompt engineering GitHub Copilot språkmodeller kvantisering fine-tuning hallucinasjoner generative AI LLM-sikkerhet AI-regulering sikkerhet AI-koding transformer arkitektur attention mekanisme
Gevir KI

Recent Projects

Redusere promptkostnader i generativ AI: Få mer kontekst med færre tokens
Kunnskapsdeling for vibe-kodete prosjekter: interne wikier og demos
Skalering av store språkmodeller: Fra millioner til hundrevis av milliarder parametere
Fra Markov-modeller til transformers: Teknisk historie for generativ AI
E-post og CRM-automatisering med LLM: Personalisering i stor skala

©2026 hjorthen.org. All rights reserved