How to use from
vLLM
Install from pip and serve model
# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF",
		"messages": [
			{
				"role": "user",
				"content": [
					{
						"type": "text",
						"text": "Describe this image in one sentence."
					},
					{
						"type": "image_url",
						"image_url": {
							"url": "https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg"
						}
					}
				]
			}
		]
	}'
Use Docker
docker model run hf.co/gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF:
Quick Links

Gemma-3-TAIDE-12b-Chat-2602 (Q3_K_L)

本模型是由 TAIDE 基於 Google Gemma-3-12b 進行微調的繁體中文強化版本。此 GGUF 版本量化採用 audreyt 的 Gemma-3-TAIDE-12b-Chat-2602-F16.gguf 及 Bartowski 的 mmproj-google_gemma-3-12b-it-bf16.gguf。(Accessed May 4, 2026) 並收藏 mradermacher 的 gemma-3-12b-it-qat-q4_0-unquantized.mmproj-Q8_0.gguf 作為 mmproj 檔的可選項。(Accessed May 6, 2026)


🚀 llama-cli 教學

# 下載模型檔案
hf download gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF:Q3_K_L

# 執行對話 (含視覺)
llama-cli -hf gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF:Q3_K_L --mmproj ./mmproj-google_gemma-3-12b-it-bf16.gguf -p "你是一個來自台灣的 AI 助手..." -cnv

🦙 Ollama 教學

  1. 建立一個名為 Modelfile 的檔案。
  2. 將下方提供的內容複製進去。
FROM ./Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L.gguf
FROM ./mmproj-google_gemma-3-12b-it-bf16.gguf
SYSTEM """你是一個來自台灣的 AI 助手,你的名字是 TAIDE,由國家科學及技術委員會開發。你負責協助使用者解決問題,並以繁體中文 (zh-TW) 進行回答。"""
  1. 執行指令:
ollama create gemma-3-taide-12b-chat-2602-Q3_K_L -f Modelfile
ollama run gemma-3-taide-12b-chat-2602-Q3_K_L

📱 Nexa SDK CLI 教學

  • 安裝指南: 請至 Nexa SDK GitHub 查閱最新版本的下載與安裝說明。
  • 執行指令:
nexa infer gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF

🦀 Shimmy 教學

  • 安裝指南: 請至 Shimmy GitHub 查閱最新版本的下載與安裝說明。
  • 執行指令:
shimmy serve
Downloads last month
140
GGUF
Model size
13B params
Architecture
gemma3
Hardware compatibility
Log In to add your hardware

3-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for gn00029914/Gemma-3-TAIDE-12b-Chat-2602-Q3_K_L-GGUF

Quantized
(7)
this model