Spaces:

ngocdang83
/

HachimiMT-demo

Running

App Files Files Community

ngocdang83 commited on about 21 hours ago

Commit

47ed9bb

verified ·

1 Parent(s): 98bb457

feat(space): add MoxhiMT-30-QT and rebuild zip

Browse files

Files changed (5) hide show

HachimiMT_Benchmark_Profile.ipynb +1 -1
README_hachimimt_colab.md +203 -194
hachimimt-local.zip +2 -2
src/app.py +2 -2
src/translator.py +19 -0

HachimiMT_Benchmark_Profile.ipynb CHANGED Viewed

@@ -136,7 +136,7 @@
     "# Đổi các biến ở đây rồi chạy lại cell benchmark bên dưới.\n",
     "import os\n",
     "\n",
-    "MODEL = \"HachimiMT-60\"      # HachimiMT-60, HachimiMT-30, MoxhiMT-60, MoxhiMT-30, HirashibaMT-Medium, HirashibaMT-Tiny\n",
     "BEAM = 2                    # 1 nhanh hơn, 2 thường cân bằng hơn\n",
     "CHUNK_MODE = \"sentence\"     # sentence hoặc paragraph\n",
     "NORMALIZE = \"auto\"          # auto, t2s, none\n",

     "# Đổi các biến ở đây rồi chạy lại cell benchmark bên dưới.\n",
     "import os\n",
     "\n",
+    "MODEL = \"HachimiMT-60\"      # HachimiMT-60, HachimiMT-30, MoxhiMT-60, MoxhiMT-30, MoxhiMT-30-QT, HirashibaMT-Medium, HirashibaMT-Tiny\n",
     "BEAM = 2                    # 1 nhanh hơn, 2 thường cân bằng hơn\n",
     "CHUNK_MODE = \"sentence\"     # sentence hoặc paragraph\n",
     "NORMALIZE = \"auto\"          # auto, t2s, none\n",

README_hachimimt_colab.md CHANGED Viewed

@@ -1,194 +1,203 @@
-<p align="center">
-  <img src="assets/hachimimt-logo.png" alt="HachimiMT logo" width="180">
-</p>
-# HachimiMT — Dịch truyện Trung → Việt bằng AI, chạy miễn phí trên Colab / Kaggle
-> **Dịch truyện tiên hiệp / huyền huyễn / web-novel Trung → Việt** bằng mô hình
-> dịch máy neural (CTranslate2 INT8), cho ra văn **đọc trôi chảy như tiếng Việt
-> thật** — không phải "convert" sát từng chữ. Chạy ngay trên **Google Colab** hoặc
-> **Kaggle** với GPU miễn phí, hoặc cài về máy. Không cần tài khoản trả phí, không
-> cần card đồ họa ở nhà.
-[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Colab.ipynb)
-[![Open in Kaggle](https://kaggle.com/static/images/open-in-kaggle.svg)](https://www.kaggle.com/kernels/welcome?src=https://github.com/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Kaggle.ipynb)
-🌐 **Bản demo online (CPU, dùng ngay không cài gì):**
-[ngocdang83/HachimiMT-demo](https://huggingface.co/spaces/ngocdang83/HachimiMT-demo)
----
-## HachimiMT là gì?
-HachimiMT (và biến thể MoxhiMT) là các **mô hình dịch máy chuyên cho truyện mạng
-Trung Quốc** — tiên hiệp, huyền huyễn, đô thị, khoa huyễn. Khác với từ điển thay
-chữ, đây là mạng neural Transformer (kiến trúc Marian) được huấn luyện riêng để
-**dịch nghĩa cả câu**, giữ giọng văn tiếng Việt tự nhiên, xử lý thành ngữ / điển cố
-/ cú pháp Hán cổ tốt hơn cách convert truyền thống.
-Mô hình rất nhỏ (35–58 MB, lượng tử INT8) nên chạy nhanh kể cả trên GPU miễn phí
-của Colab/Kaggle — **một bộ truyện dài 2–3 triệu chữ Hán dịch xong trong khoảng 1
-phút** trên GPU. Notebook trong repo này đóng gói sẵn toàn bộ: bấm chạy → mở link →
-dán văn bản → tải bản dịch.
----
-## So với QuickTranslator + Vietphrase
-QuickTranslator (QT) cùng bộ từ điển Vietphrase là cách đọc truyện Trung phổ biến
-nhất nhiều năm nay. HachimiMT **không thay thế hoàn toàn** QT — mỗi bên mạnh ở chỗ
-khác nhau. Chọn đúng theo nhu cầu:
-| | **QuickTranslator + Vietphrase** | **HachimiMT (notebook này)** |
-|---|---|---|
-| **Cách dịch** | Tra từ điển, thay chữ theo bảng | Mạng neural, dịch nghĩa cả câu |
-| **Văn đọc ra** | Sát từ gốc, đôi chỗ cứng / Hán-Việt thô | **Trôi chảy, tự nhiên như tiếng Việt** |
-| **Thành ngữ, điển cố, cú pháp Hán cổ** | Thường dịch chữ-đối-chữ, khó hiểu | Hiểu và diễn đạt lại mượt hơn |
-| **Chạy offline, tức thì** | ✅ Có, không cần mạng | ⚠️ Cần GPU (Colab/Kaggle) để nhanh; bản máy/CPU chậm hơn |
-| **Nhất quán tên riêng** | ✅ **Bạn pin tên trong từ điển → cố định mãi** | ⚠️ Tên hiếm có thể dịch lệch giữa các đoạn |
-| **Tùy biến từ điển** | ✅ Sửa, thêm, ghi đè thoải mái | ❌ Mô hình cố định, không sửa từ điển |
-| **Tốc độ** | Tức thì (tra bảng) | ~40.000 chữ/giây (Colab T4, beam 1) — rất nhanh, nhưng cần khởi động |
-**Tóm lại:**
-- Muốn **đọc nhanh, mượt, đỡ "lai Hán-Việt"** → HachimiMT thắng về độ trôi chảy.
-- Cần **offline tuyệt đối, dịch tức thì, hoặc kiểm soát chặt tên riêng / thuật ngữ
-  bằng từ điển tự pin** → QuickTranslator vẫn là lựa chọn tốt.
-- Nhiều người dùng **cả hai**: HachimiMT để đọc trôi chảy, QT khi cần tra đúng một
-  tên riêng cố định.
-> So sánh ở đây nói về **độ trôi chảy của văn dịch**, không khẳng định HachimiMT
-> "chính xác hơn" — ở khoản giữ tên riêng nhất quán, từ điển pin tay của QT vẫn có
-> lợi thế (xem mục [Hạn chế](#hạn-chế-cần-biết-trước)).
----
-## Bắt đầu nhanh (3 cách)
-### Cách 1 — Google Colab (dễ nhất, khuyên dùng)
-[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Colab.ipynb)
-1. Bấm nút **Open In Colab** ở trên.
-2. **Bật GPU trước** (rất nên — nhanh gấp nhiều lần):
-   **`Runtime → Change runtime type → T4 GPU → Save`**
-   *(Colab tiếng Việt: `Thời gian chạy → Thay đổi loại thời gian chạy → T4 GPU → Lưu`)*
-   ⚠️ Chọn đúng **T4 GPU** — **KHÔNG** chọn **TPU** (CTranslate2 không chạy được TPU,
-   sẽ rớt về CPU chậm).
-3. **`Runtime → Run all`** (Ctrl+F9) — *tiếng Việt: `Thời gian chạy → Chạy tất cả`*.
-4. Đợi cài đặt xong, cell cuối in ra một **link công khai `*.gradio.live`** → bấm
-   vào để mở giao diện dịch.
-### Cách 2 — Kaggle (có 2× GPU T4, nhanh hơn nữa)
-[![Open in Kaggle](https://kaggle.com/static/images/open-in-kaggle.svg)](https://www.kaggle.com/kernels/welcome?src=https://github.com/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Kaggle.ipynb)
-1. Bấm **Open in Kaggle** → Kaggle tạo notebook từ repo này (cần tài khoản Kaggle).
-2. Phải xác minh số điện thoại để bật GPU; sau đó:
-   **Settings (bên phải) → Accelerator → `GPU T4 x2`**, và **Internet → On**.
-   ⚠️ **Tránh P100** (không hỗ trợ kiểu tính INT8 của mô hình) và **TPU**.
-3. **`Run All`** → mở link `*.gradio.live` ở cell cuối.
-Kaggle T4×2 tận dụng **cả 2 GPU** nên vẫn nhanh nhất khi dịch file dài. Colab T4
-1 GPU sau tối ưu `window=16` đã tiệm cận hơn: beam 2 chậm hơn Kaggle T4×2 khoảng
-1,9×, còn so với Kaggle ép 1 GPU chỉ chậm hơn khoảng 14%.
-### Cách 3 — Cài về máy (chạy offline bằng CPU)
-Tải gói chạy-máy từ Space rồi chạy bằng Python — không cần GPU, nhưng CPU chậm hơn
-GPU nhiều lần (xem mục Tốc độ). Hướng dẫn chi tiết nằm trong
-[bản demo HF Space](https://huggingface.co/spaces/ngocdang83/HachimiMT-demo)
-(mục "📦 Cài bản local").
----
-## Tốc độ (đo thật)
-| Môi trường | Tốc độ đo thật | Bộ truyện 2,4 triệu chữ |
-|---|---|---|
-| **Colab T4 (1 GPU)** | ~40.000 chữ Hán/giây (beam 1) · ~28.000 (beam 2) | ~1 phút (beam 1) · ~1 phút 30 giây (beam 2) |
-| **Kaggle T4 × 2 (2 GPU)** | ~81.000 chữ/giây (beam 1) · ~54.000 (beam 2) | ~35 giây (beam 1) · ~52 giây (beam 2) cho 2,84M chữ |
-| **CPU (bản máy / demo)** | ~500 chữ/giây | chậm — chỉ nên dùng cho đoạn ngắn |
-> **GPU nhanh hơn CPU hàng chục lần.** Vì vậy luôn **bật GPU** trên Colab/Kaggle.
-> Bản demo HF Space chạy CPU dùng chung nên chỉ hợp dán thử vài đoạn; muốn dịch
-> nguyên bộ thì dùng Colab/Kaggle (GPU) hoặc cài về máy.
->
-> *beam* càng cao dịch càng kỹ nhưng càng chậm; mặc định để 1–2 cho nhanh. Notebook
-> Colab đặt sẵn `HACHIMIMT_CT2_WINDOW_MULTIPLIER=16`, nhanh hơn window cũ khoảng
-> 25–31% trên T4 x1. Kaggle T4 x2 đặt window 8; nhờ auto multi-GPU, window hiệu dụng
-> là 32x để giữ cả hai GPU bận hơn trên file dài.
----
-## Các mô hình có sẵn
-App cho chọn 4 mô hình; khi mở app sẵn chọn **HachimiMT-60**, đổi sang model khác
-bất cứ lúc nào (tự tải khi cần). Bốn mô hình **ngang hàng** — không có cái nào "tốt
-nhất" cho mọi trường hợp; mỗi cái ra giọng văn hơi khác và mạnh/yếu ở chỗ khác nhau:
-| Mô hình | Cỡ | Đặc điểm |
-|---|---|---|
-| **HachimiMT-60** | 57 MB | Bản 60M dòng HachimiMT — giọng văn của riêng nó |
-| **HachimiMT-30** | 35 MB | Bản 30M, nhỏ & nhanh nhất — hợp máy yếu / cần tốc độ |
-| **MoxhiMT-60** | 58 MB | Bản 60M dòng MoxhiMT — giọng văn khác để đối chiếu |
-| **MoxhiMT-30** | 38 MB | Bản 30M dòng MoxhiMT — nhỏ, nhanh, giọng văn riêng |
-> Không có model "đỉnh" tuyệt đối: ví dụ ở khoản **giữ tên riêng / xưng hô nhất
-> quán**, mấy bản kia có lúc ổn định hơn HachimiMT-60; ngược lại HachimiMT-60 có thể
-> hợp hơn ở đoạn khác. **Cách tốt nhất là thử cả 4 trên cùng một đoạn truyện của bạn
-> rồi chọn cái hợp gu nhất.**
-Repo mô hình trên Hugging Face:
-[HachimiMT-60](https://huggingface.co/ngocdang83/HachimiMT-60-zh-vi) ·
-[HachimiMT-30](https://huggingface.co/ngocdang83/HachimiMT-30-zh-vi) ·
-[MoxhiMT-60](https://huggingface.co/DanVP/MoxhiMT-60) ·
-[MoxhiMT-30](https://huggingface.co/DanVP/MoxhiMT-30)
----
-## Tính năng app
-- 📄 **Dán văn bản hoặc tải file `.txt`** (tự nhận mã GB18030 / Big5 / UTF-8, hỗ
-  trợ cả phồn thể lẫn giản thể).
-- ⚙️ **Chọn mô hình** và **beam** (đánh đổi tốc độ ↔ chất lượng).
-- 🈶 **Chuẩn hóa xưng hô Hán-Việt** (tùy chọn nâng cao, thử nghiệm): chuyển 哥哥/姐姐…
-  sang ca ca / tỷ tỷ… theo văn phong tiên hiệp, nhận diện bối cảnh cổ trang vs hiện
-  đại. Mặc định tắt — bật khi cần.
-- 💾 **Xuất bản dịch ra `.txt`** để đọc offline.
-- ☁️ Trên Colab/Kaggle tự tạo **link công khai** chia sẻ được tạm thời.
----
-## Hạn chế (cần biết trước)
-Để công bằng, đây là những chỗ HachimiMT **chưa bằng** cách dịch cũ:
-- **Tên riêng hiếm có thể dịch lệch giữa các đoạn.** Mô hình nhỏ nên một số tên ít
-  gặp có thể ra vài biến thể Hán-Việt khác nhau trong cùng truyện. Đây chính là chỗ
-  **từ điển pin tay của QuickTranslator vẫn nhỉnh hơn** — bạn cố định một tên là cố
-  định mãi. (HachimiMT không cho sửa từ điển.)
-- **Cần GPU để nhanh.** CPU (bản máy / demo HF) chậm hơn nhiều lần; dịch nguyên bộ
-  truyện trên CPU không thực tế.
-- **Mô hình cố định**, không tùy biến thuật ngữ / không thêm từ điển riêng.
-- Mô hình nhỏ → đôi khi vẫn có câu khó hiểu ở đoạn quá dài hoặc nội dung hiếm gặp.
-Nếu những điểm trên là then chốt với bạn (đọc offline tuyệt đối, kiểm soát chặt
-thuật ngữ), hãy dùng kèm QuickTranslator. Còn nếu ưu tiên **đọc trôi chảy, ít lai
-Hán-Việt**, HachimiMT là một lựa chọn đáng thử.
----
-## Liên kết
-- 🌐 Demo online (CPU): https://huggingface.co/spaces/ngocdang83/HachimiMT-demo
-- 🤖 Mô hình: [HachimiMT-60](https://huggingface.co/ngocdang83/HachimiMT-60-zh-vi) ·
-  [HachimiMT-30](https://huggingface.co/ngocdang83/HachimiMT-30-zh-vi) ·
-  [MoxhiMT-60](https://huggingface.co/DanVP/MoxhiMT-60) ·
-  [MoxhiMT-30](https://huggingface.co/DanVP/MoxhiMT-30)
-- 📓 Notebook: [Colab](HachimiMT_Colab.ipynb) · [Kaggle](HachimiMT_Kaggle.ipynb)
----
-*HachimiMT là mô hình dịch máy neural Trung→Việt chuyên cho truyện mạng, mã nguồn
-mở trên Hugging Face. Repo này chỉ chứa notebook + hướng dẫn; bản dịch do mô hình
-sinh tự động và có thể cần biên tập lại trước khi xuất bản.*

+<p align="center">
+  <img src="assets/hachimimt-logo.png" alt="HachimiMT logo" width="180">
+</p>
+# HachimiMT — Dịch truyện Trung → Việt bằng AI, chạy miễn phí trên Colab / Kaggle
+> **Dịch truyện tiên hiệp / huyền huyễn / web-novel Trung → Việt** bằng mô hình
+> dịch máy neural (CTranslate2 INT8), cho ra văn **đọc trôi chảy như tiếng Việt
+> thật** — không phải "convert" sát từng chữ. Chạy ngay trên **Google Colab** hoặc
+> **Kaggle** với GPU miễn phí, hoặc cài về máy. Không cần tài khoản trả phí, không
+> cần card đồ họa ở nhà.
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Colab.ipynb)
+[![Open in Kaggle](https://kaggle.com/static/images/open-in-kaggle.svg)](https://www.kaggle.com/kernels/welcome?src=https://github.com/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Kaggle.ipynb)
+🌐 **Bản demo online (CPU, dùng ngay không cài gì):**
+[ngocdang83/HachimiMT-demo](https://huggingface.co/spaces/ngocdang83/HachimiMT-demo)
+---
+## HachimiMT là gì?
+HachimiMT (và biến thể MoxhiMT) là các **mô hình dịch máy chuyên cho truyện mạng
+Trung Quốc** — tiên hiệp, huyền huyễn, đô thị, khoa huyễn. Khác với từ điển thay
+chữ, đây là mạng neural Transformer (kiến trúc Marian) được huấn luyện riêng để
+**dịch nghĩa cả câu**, giữ giọng văn tiếng Việt tự nhiên, xử lý thành ngữ / điển cố
+/ cú pháp Hán cổ tốt hơn cách convert truyền thống.
+Mô hình rất nhỏ (35–58 MB, lượng tử INT8) nên chạy nhanh kể cả trên GPU miễn phí
+của Colab/Kaggle — **một bộ truyện dài 2–3 triệu chữ Hán dịch xong trong khoảng 1
+phút** trên GPU. Notebook trong repo này đóng gói sẵn toàn bộ: bấm chạy → mở link →
+dán văn bản → tải bản dịch.
+---
+## So với QuickTranslator + Vietphrase
+QuickTranslator (QT) cùng bộ từ điển Vietphrase là cách đọc truyện Trung phổ biến
+nhất nhiều năm nay. HachimiMT **không thay thế hoàn toàn** QT — mỗi bên mạnh ở chỗ
+khác nhau. Chọn đúng theo nhu cầu:
+| | **QuickTranslator + Vietphrase** | **HachimiMT (notebook này)** |
+|---|---|---|
+| **Cách dịch** | Tra từ điển, thay chữ theo bảng | Mạng neural, dịch nghĩa cả câu |
+| **Văn đọc ra** | Sát từ gốc, đôi chỗ cứng / Hán-Việt thô | **Trôi chảy, tự nhiên như tiếng Việt** |
+| **Thành ngữ, điển cố, cú pháp Hán cổ** | Thường dịch chữ-đối-chữ, khó hiểu | Hiểu và diễn đạt lại mượt hơn |
+| **Chạy offline, tức thì** | ✅ Có, không cần mạng | ⚠️ Cần GPU (Colab/Kaggle) để nhanh; bản máy/CPU chậm hơn |
+| **Nhất quán tên riêng** | ✅ **Bạn pin tên trong từ điển → cố định mãi** | ⚠️ Tên hiếm có thể dịch lệch giữa các đoạn |
+| **Tùy biến từ điển** | ✅ Sửa, thêm, ghi đè thoải mái | ❌ Mô hình cố định, không sửa từ điển |
+| **Tốc độ** | Tức thì (tra bảng) | ~40.000 chữ/giây (Colab T4, beam 1) — rất nhanh, nhưng cần khởi động |
+**Tóm lại:**
+- Muốn **đọc nhanh, mượt, đỡ "lai Hán-Việt"** → HachimiMT thắng về độ trôi chảy.
+- Cần **offline tuyệt ��ối, dịch tức thì, hoặc kiểm soát chặt tên riêng / thuật ngữ
+  bằng từ điển tự pin** → QuickTranslator vẫn là lựa chọn tốt.
+- Nhiều người dùng **cả hai**: HachimiMT để đọc trôi chảy, QT khi cần tra đúng một
+  tên riêng cố định.
+> So sánh ở đây nói về **độ trôi chảy của văn dịch**, không khẳng định HachimiMT
+> "chính xác hơn" — ở khoản giữ tên riêng nhất quán, từ điển pin tay của QT vẫn có
+> lợi thế (xem mục [Hạn chế](#hạn-chế-cần-biết-trước)).
+---
+## Bắt đầu nhanh (3 cách)
+### Cách 1 — Google Colab (dễ nhất, khuyên dùng)
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Colab.ipynb)
+1. Bấm nút **Open In Colab** ở trên.
+2. **Bật GPU trước** (rất nên — nhanh gấp nhiều lần):
+   **`Runtime → Change runtime type → T4 GPU → Save`**
+   *(Colab tiếng Việt: `Thời gian chạy → Thay đổi loại thời gian chạy → T4 GPU → Lưu`)*
+   ⚠️ Chọn đúng **T4 GPU** — **KHÔNG** chọn **TPU** (CTranslate2 không chạy được TPU,
+   sẽ rớt về CPU chậm).
+3. **`Runtime → Run all`** (Ctrl+F9) — *tiếng Việt: `Thời gian chạy → Chạy tất cả`*.
+4. Đợi cài đặt xong, cell cuối in ra một **link công khai `*.gradio.live`** → bấm
+   vào để mở giao diện dịch.
+### Cách 2 — Kaggle (có 2× GPU T4, nhanh hơn nữa)
+[![Open in Kaggle](https://kaggle.com/static/images/open-in-kaggle.svg)](https://www.kaggle.com/kernels/welcome?src=https://github.com/ngocdang8311/hachimimt-colab/blob/master/HachimiMT_Kaggle.ipynb)
+1. Bấm **Open in Kaggle** → Kaggle tạo notebook từ repo này (cần tài khoản Kaggle).
+2. Phải xác minh số điện thoại để bật GPU; sau đó:
+   **Settings (bên phải) → Accelerator → `GPU T4 x2`**, và **Internet → On**.
+   ⚠️ **Tránh P100** (không hỗ trợ kiểu tính INT8 của mô hình) và **TPU**.
+3. **`Run All`** → mở link `*.gradio.live` ở cell cuối.
+Kaggle T4×2 tận dụng **cả 2 GPU** nên vẫn nhanh nhất khi dịch file dài. Colab T4
+1 GPU sau tối ưu `window=16` đã tiệm cận hơn: beam 2 chậm hơn Kaggle T4×2 khoảng
+1,9×, còn so với Kaggle ép 1 GPU chỉ chậm hơn khoảng 14%.
+### Cách 3 — Cài về máy (chạy offline bằng CPU)
+Tải gói chạy-máy từ Space rồi chạy bằng Python — không cần GPU, nhưng CPU chậm hơn
+GPU nhiều lần (xem mục Tốc độ). Hướng dẫn chi tiết nằm trong
+[bản demo HF Space](https://huggingface.co/spaces/ngocdang83/HachimiMT-demo)
+(mục "📦 Cài bản local").
+---
+## Tốc độ (đo thật)
+| Môi trường | Tốc độ đo thật | Bộ truyện 2,4 triệu chữ |
+|---|---|---|
+| **Colab T4 (1 GPU)** | ~40.000 chữ Hán/giây (beam 1) · ~28.000 (beam 2) | ~1 phút (beam 1) · ~1 phút 30 giây (beam 2) |
+| **Kaggle T4 × 2 (2 GPU)** | ~81.000 chữ/giây (beam 1) · ~54.000 (beam 2) | ~35 giây (beam 1) · ~52 giây (beam 2) cho 2,84M chữ |
+| **CPU (bản máy / demo)** | ~500 chữ/giây | chậm — chỉ nên dùng cho đoạn ngắn |
+> **GPU nhanh hơn CPU hàng chục lần.** Vì vậy luôn **bật GPU** trên Colab/Kaggle.
+> Bản demo HF Space chạy CPU dùng chung nên chỉ hợp dán thử vài đoạn; muốn dịch
+> nguyên bộ thì dùng Colab/Kaggle (GPU) hoặc cài về máy.
+>
+> *beam* càng cao dịch càng kỹ nhưng càng chậm; mặc định để 1–2 cho nhanh. Notebook
+> Colab đặt sẵn `HACHIMIMT_CT2_WINDOW_MULTIPLIER=16`, nhanh hơn window cũ khoảng
+> 25–31% trên T4 x1. Kaggle T4 x2 đặt window 8; nhờ auto multi-GPU, window hiệu dụng
+> là 32x để giữ cả hai GPU bận hơn trên file dài.
+---
+## Các mô hình có sẵn
+App cho chọn 7 mô hình; khi mở app sẵn chọn **HachimiMT-60**, đổi sang model khác
+bất cứ lúc nào (tự tải khi cần). Các mô hình **ngang hàng** — không có cái nào "tốt
+nhất" cho mọi trường hợp; mỗi cái ra giọng văn hơi khác và mạnh/yếu ở chỗ khác nhau:
+| Mô hình | Cỡ | Đặc điểm |
+|---|---|---|
+| **HachimiMT-60** | 57 MB | Bản 60M dòng HachimiMT — giọng văn của riêng nó |
+| **HachimiMT-30** | 35 MB | Bản 30M nhẹ trong nhóm Hachimi/Moxhi — hợp máy yếu / cần tốc độ |
+| **MoxhiMT-60** | 58 MB | Bản 60M dòng MoxhiMT — giọng văn khác để đối chiếu |
+| **MoxhiMT-30** | 38 MB | Bản 30M dòng MoxhiMT — nhỏ, nhanh, giọng văn riêng |
+| **MoxhiMT-30-QT** | 38 MB | Bản MoxhiMT-30 đơn giản hóa ngôi xưng kiểu QT (`ta/ngươi/hắn/nàng`) |
+| **HirashibaMT-Medium** | 62 MB | Model tham khảo Hirashiba cỡ vừa, CT2 qua mirror |
+| **HirashibaMT-Tiny** | 17 MB | Model tham khảo rất nhẹ, phù hợp thử nhanh |
+> Không có model "đỉnh" tuyệt đối: ví dụ ở khoản **giữ tên riêng / xưng hô nhất
+> quán**, mấy bản kia có lúc ổn định hơn HachimiMT-60; ngược lại HachimiMT-60 có thể
+> hợp hơn ở đoạn khác. **Cách tốt nhất là thử vài model trên cùng một đoạn truyện của bạn
+> rồi chọn cái hợp gu nhất.**
+Repo mô hình trên Hugging Face:
+[HachimiMT-60](https://huggingface.co/ngocdang83/HachimiMT-60-zh-vi) ·
+[HachimiMT-30](https://huggingface.co/ngocdang83/HachimiMT-30-zh-vi) ·
+[MoxhiMT-60](https://huggingface.co/DanVP/MoxhiMT-60) ·
+[MoxhiMT-30](https://huggingface.co/DanVP/MoxhiMT-30) ·
+[MoxhiMT-30-QT](https://huggingface.co/DanVP/MoxhiMT-30-QT) ·
+[HirashibaMT-Medium](https://huggingface.co/Moleys/hirashiba-mt-medium) ·
+[HirashibaMT-Tiny](https://huggingface.co/chi-vi/hirashiba-mt-tiny-zh-vi)
+---
+## Tính năng app
+- 📄 **Dán văn bản hoặc tải file `.txt`** (tự nhận mã GB18030 / Big5 / UTF-8, hỗ
+  trợ cả phồn thể lẫn giản thể).
+- ⚙️ **Chọn mô hình** và **beam** (đánh đổi tốc độ ↔ chất lượng).
+- 🈶 **Chuẩn hóa xưng hô Hán-Việt** (tùy chọn nâng cao, thử nghiệm): chuyển 哥哥/姐姐…
+  sang ca ca / tỷ tỷ… theo văn phong tiên hiệp, nhận diện bối cảnh cổ trang vs hiện
+  đại. Mặc định tắt — bật khi cần.
+- 💾 **Xuất bản dịch ra `.txt`** để đọc offline.
+- ☁️ Trên Colab/Kaggle tự tạo **link công khai** chia sẻ được tạm thời.
+---
+## Hạn chế (cần biết trước)
+Để công bằng, đây là những chỗ HachimiMT **chưa bằng** cách dịch cũ:
+- **Tên riêng hiếm có thể dịch lệch giữa các đoạn.** Mô hình nhỏ nên một số tên ít
+  gặp có thể ra vài biến thể Hán-Việt khác nhau trong cùng truyện. Đây chính là chỗ
+  **từ điển pin tay của QuickTranslator vẫn nhỉnh hơn** — bạn cố định một tên là cố
+  định mãi. (HachimiMT không cho sửa từ điển.)
+- **Cần GPU để nhanh.** CPU (bản máy / demo HF) chậm hơn nhiều lần; dịch nguyên bộ
+  truyện trên CPU không thực tế.
+- **Mô hình cố định**, không tùy biến thuật ngữ / không thêm từ điển riêng.
+- Mô hình nhỏ → đôi khi vẫn có câu khó hiểu ở đoạn quá dài hoặc nội dung hiếm gặp.
+Nếu những điểm trên là then chốt với bạn (đọc offline tuyệt đối, kiểm soát chặt
+thuật ngữ), hãy dùng kèm QuickTranslator. Còn nếu ưu tiên **đọc trôi chảy, ít lai
+Hán-Việt**, HachimiMT là một lựa chọn đáng thử.
+---
+## Liên kết
+- 🌐 Demo online (CPU): https://huggingface.co/spaces/ngocdang83/HachimiMT-demo
+- 🤖 Mô hình: [HachimiMT-60](https://huggingface.co/ngocdang83/HachimiMT-60-zh-vi) ·
+  [HachimiMT-30](https://huggingface.co/ngocdang83/HachimiMT-30-zh-vi) ·
+  [MoxhiMT-60](https://huggingface.co/DanVP/MoxhiMT-60) ·
+  [MoxhiMT-30](https://huggingface.co/DanVP/MoxhiMT-30) ·
+  [MoxhiMT-30-QT](https://huggingface.co/DanVP/MoxhiMT-30-QT) ·
+  [HirashibaMT-Medium](https://huggingface.co/Moleys/hirashiba-mt-medium) ·
+  [HirashibaMT-Tiny](https://huggingface.co/chi-vi/hirashiba-mt-tiny-zh-vi)
+- 📓 Notebook: [Colab](HachimiMT_Colab.ipynb) · [Kaggle](HachimiMT_Kaggle.ipynb)
+---
+*HachimiMT là mô hình dịch máy neural Trung→Việt chuyên cho truyện mạng, mã nguồn
+mở trên Hugging Face. Repo này chỉ chứa notebook + hướng dẫn; bản dịch do mô hình
+sinh tự động và có thể cần biên tập lại trước khi xuất bản.*

hachimimt-local.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2aef88fb410eaf54f9bd7d3363e02b484db1c35a1af6009a4cbd7fdc3497076f
-size 126534

 version https://git-lfs.github.com/spec/v1
+oid sha256:8fd3fcbc0f4876e9247120221e121f6e95976b4814eb01d76a92cabc1345a660
+size 128835

src/app.py CHANGED Viewed

@@ -1978,8 +1978,8 @@ mục `hachimimt`, chạy `setup.bat` (cài thư viện + tải model mặc đ
 - **GPU NVIDIA**: app mặc định chạy CPU; có nút **“Cài torch để bật GPU”** ngay trong
   app (tải ~2–3 GB, một lần) → nhanh hơn nhiều lần với văn bản dài.
-- Model (HachimiMT/MoxhiMT) tự tải từ Hugging Face lần đầu, sau đó chạy **offline**.
-- Bản local mở khoá: chọn 4 model, dịch file `.txt`, không giới hạn CPU như Space.""",
                     elem_classes=["info-card"],
                 )

 - **GPU NVIDIA**: app mặc định chạy CPU; có nút **“Cài torch để bật GPU”** ngay trong
   app (tải ~2–3 GB, một lần) → nhanh hơn nhiều lần với văn bản dài.
+- Các model tự tải từ Hugging Face lần đầu, sau đó chạy **offline**.
+- Bản local mở khoá: chọn 7 model, dịch file `.txt`, không giới hạn CPU như Space.""",
                     elem_classes=["info-card"],
                 )

src/translator.py CHANGED Viewed

@@ -163,6 +163,25 @@ MODELS: dict[str, ModelConfig] = {
         default_beam=2,
         ct2_size_mb=38,
     ),
     "HirashibaMT-Medium": ModelConfig(
         label="HirashibaMT-Medium",
         model_id="Moleys/hirashiba-mt-medium",

         default_beam=2,
         ct2_size_mb=38,
     ),
+    "MoxhiMT-30-QT": ModelConfig(
+        label="MoxhiMT-30-QT",
+        model_id="DanVP/MoxhiMT-30-QT",
+        use_marian_class=True,
+        generate_kwargs={
+            "max_new_tokens": 300,
+            # QT-register variant: same 37M Marian family as MoxhiMT-30, but
+            # targets are normalized toward ta/nguoi/han/nang. Keep the short
+            # 30M input cap and DO NOT add no_repeat_ngram_size: 711d70e showed
+            # no_repeat causes duplicate-name entity drift. repetition_penalty
+            # was isolated as safe there. Default beam stays 1 because this model
+            # is meant as a simple stable-pronoun option.
+            "repetition_penalty": 1.2,
+        },
+        ct2_max_input_tokens=160,
+        ct2_max_output_tokens=512,
+        default_beam=1,
+        ct2_size_mb=38,
+    ),
     "HirashibaMT-Medium": ModelConfig(
         label="HirashibaMT-Medium",
         model_id="Moleys/hirashiba-mt-medium",