--- license: apache-2.0 library_name: llama.cpp base_model: Qwen/Qwen2.5-1.5B-Instruct language: - zh tags: - coffee - barista - gguf - q4_k_m - qwen2.5 --- # Qwen2.5-1.5B 吧台咖啡师 v5 (GGUF Q4_K_M) 基于 [ynanxiu/qwen25-15b-coffee-lora-v5](https://huggingface.co/ynanxiu/qwen25-15b-coffee-lora-v5) 合并全量后量化的 GGUF 模型。 ## 量化信息 | 参数 | 值 | |------|-----| | 量化方法 | Q4_K_M | | 模型大小 | 935 MB | | BPW | 5.08 | | 原始 FP16 | 3.09 GB | | 压缩比 | 3.3x | ## 使用方法 ```bash # llama.cpp CLI ./llama-cli -m qwen25-15b-coffee-v5-q4_k_m.gguf -p "Espresso 标准萃取压力是多少 bar?" # Python (llama-cpp-python) pip install llama-cpp-python ``` ```python from llama_cpp import Llama llm = Llama.from_pretrained( repo_id="ynanxiu/qwen25-15b-coffee-v5-gguf", filename="qwen25-15b-coffee-v5-q4_k_m.gguf", ) print(llm("咖啡太苦了怎么办?")["choices"][0]["text"]) ``` ## 能力 | 维度 | 结论 | |------|------| | 咖啡参数 | 10/10 🏆 | | 寒暄社交 | ✅ | | 故障排查 | ✅ | | 清洁保养 | ✅ | | 购买建议 | ✅ | | 辟谣知识 | ✅ | ## 来源 - LoRA: [ynanxiu/qwen25-15b-coffee-lora-v5](https://huggingface.co/ynanxiu/qwen25-15b-coffee-lora-v5) - 数据集: [ynanxiu/coffee-sft-dataset](https://huggingface.co/datasets/ynanxiu/coffee-sft-dataset) - 基座: Qwen/Qwen2.5-1.5B-Instruct