Spaces:

jmcinern
/

Qomhra

Sleeping

jmcinern commited on Oct 7, 2025

Commit

a9f0d06

verified ·

1 Parent(s): b5eb228

Update app.py

set based on tokenizer ID and not just text

Files changed (1) hide show

app.py CHANGED Viewed

@@ -68,7 +68,10 @@ class ChatBot:
         # Tokenize
         inputs = self.tokenizer(prompt, return_tensors="pt").to(self.model.device)
         # Generate response
         with torch.no_grad():
             outputs = self.model.generate(
@@ -77,7 +80,8 @@ class ChatBot:
                 temperature=0.6,
                 do_sample=True,
                 return_dict_in_generate=True,
-                pad_token_id=self.tokenizer.eos_token_id
             )
         # Decode and clean response, with multiple debugs

         # Tokenize
         inputs = self.tokenizer(prompt, return_tensors="pt").to(self.model.device)
+        # Set EOS seen in training (per Qwen chat template)
+        stop_id = tokenizer.convert_tokens_to_ids("<|im_end|>")
         # Generate response
         with torch.no_grad():
             outputs = self.model.generate(
                 temperature=0.6,
                 do_sample=True,
                 return_dict_in_generate=True,
+                pad_token_id=self.tokenizer.eos_token_id,
+                eos_token_id=stop_id
             )
         # Decode and clean response, with multiple debugs