Komprimering og kvantisering av store språkmodeller: Kjøring på edge-enheter