Bygge en evalueringkultur for team som bruker store språkmodeller