Evaluere Drift etter Fine-Tuning: Overvåking av Stabilitet i Store Språkmodeller