Orion-HYMT
Collection
基于HY-MT1.5微调版本 • 2 items • Updated
基于HY-MT1.5-7B,经过约900万行,12B tokens的轻小说日-中平行语料中微调的翻译模型,该仓库为SFT阶段的模型。
1.8B版本:https://huggingface.co/3tic/Orion-HYMT1.5-1.8B-SFT-v2601
2026-01-08 开始训练,预计1月中旬上传权重和训练数据
2026-01-15 训练结束,共训练10B+Tokens,160k step.
python3 -m vllm.entrypoints.openai.api_server \
--host 0.0.0.0 \
--port 9633 \
--trust-remote-code \
--model 3tic/Orion-HYMT1.5-7B-SFT-v2601 \
--tensor-parallel-size 1 \
--dtype bfloat16 \
--served-model-name Orion-HYMT1.5-7B-SFT-v2601
支持HY-MT1.5的对话格式
单行
将以下文本翻译为简体中文,注意只需要输出翻译后的结果,不要额外解释:
{source_text}
多行(JSONLINE)
将以下文本翻译为简体中文,使用JSONLINE格式输出翻译结果,注意只需要输出翻译后的结果,不要额外解释:
{"<序号>":"<原文>"}
{"<序号>":"<原文>"}
{"<序号>":"<原文>"}
带术语表
参考下面的翻译:
{source_term} 翻译成 {target_term}
将以下文本翻译为简体中文,注意只需要输出翻译后的结果,不要额外解释:
{source_text}
带上文
{context}
参考上面的信息,把下面的文本翻译成简体中文,注意不需要翻译上文,也不要额外解释:
{source_text}