BUT-FIT
/

SE_DiCoW

Automatic Speech Recognition

speaker-diarization

meeting-transcription

target-speaker-asr

Model card Files Files and versions

Lakoc commited on Sep 30, 2025

Commit

e1af3d4

·

verified ·

1 Parent(s): 57fe226

Update generation.py

Files changed (1) hide show

generation.py +3 -2

generation.py CHANGED Viewed

@@ -1197,8 +1197,9 @@ class DiCoWGenerationMixin(WhisperForConditionalGeneration):
             self.vad_seek_callback(kwargs["stno_mask"])
         if "is_valid" in kwargs:
             kwargs['is_valid'] = kwargs["is_valid"][batch_idx_map]
-        kwargs['labels'] = kwargs["labels"][batch_idx_map]
-        kwargs['upp_labels'] = kwargs["upp_labels"][batch_idx_map]
         return kwargs
     def generate_with_fallback(

             self.vad_seek_callback(kwargs["stno_mask"])
         if "is_valid" in kwargs:
             kwargs['is_valid'] = kwargs["is_valid"][batch_idx_map]
+        if "labels" in kwargs:
+            kwargs['labels'] = kwargs["labels"][batch_idx_map]
+            kwargs['upp_labels'] = kwargs["upp_labels"][batch_idx_map]
         return kwargs
     def generate_with_fallback(