总是不能正确显示简体中文

#57
by rickieyang - opened

充满大量繁体中文和广东话,进行提示词约束也不行。

这是 gemma-4-12b 底模带来的,我的训练数据全是英文只有很少部分是其它语言的,所以中文表现完全继承自 base。我在 Q8 上做过 finetune vs base 的 A/B,我没专门喂中文去修,但微调后跑繁体/粤语其实比 base 更少。低量化档更糟(会放大 base 本身的粤语倾向)。这确实是个真实局限,也是我现在在为未来版本评估换底座的原因之一。

Sign up or log in to comment