HachimiMT-demo / README.md
ngocdang83's picture
Init Space: HachimiMT zh-vi demo (CT2, chuẩn hóa xưng hô)
e9015b1 verified
|
Raw
History Blame
1.81 kB
metadata
title: HachimiMT  Dịch Trung Việt
emoji: 📜
colorFrom: red
colorTo: yellow
sdk: gradio
sdk_version: 6.18.0
app_file: app.py
pinned: false
short_description: Dịch truyện Trung  Việt, chuẩn hóa xưng  Hán-Việt

HachimiMT — Dịch Trung → Việt

Công cụ dịch truyện tiếng Trung sang tiếng Việt bằng các model MarianMT (CTranslate2 INT8):

Tính năng

  • Dịch văn bản trực tiếp + đối chiếu song song theo từng câu/đoạn, hoặc dịch file .txt.
  • Chọn model (HachimiMT / MoxhiMT, bản 60 hoặc 30) — model tự tải từ Hugging Face khi chọn lần đầu (lazy), chạy CPU.
  • Chuẩn hóa chữ Hán phồn → giản trước khi dịch (model train trên giản thể).
  • Tuỳ chọn chuẩn hóa xưng hô (mục nâng cao, mặc định tắt) — ép xưng hô về Hán-Việt theo từ tường minh trong nguồn:
    • Thân tộc: chị → tỷ, anh trai → ca ca, chị em → tỷ muội… khi nguồn có 姐姐/哥哥/姐妹…
    • Đại từ: cậu → ngươi, cô ấy → nàng, tôi → ta — chỉ áp ở văn cổ trang/tu tiên.
    • Ổn định ngôi hiện đại: chỉnh ngôi theo ngữ cảnh (thầy/em, mẹ/con…) cho truyện hiện đại.

Space chạy CPU (CTranslate2 INT8). Văn bản dài sẽ chậm hơn máy có GPU; chia theo câu giúp giảm trôi tên riêng.

Mã nguồn: https://github.com/ngocdang8311/qt2