Språk og lydforståelse i multimodale store språkmodeller