---
license: apache-2.0
library_name: llama.cpp
base_model: Qwen/Qwen2.5-1.5B-Instruct
language:
- zh
tags:
- coffee
- barista
- gguf
- q4_k_m
- qwen2.5
---

# Qwen2.5-1.5B 吧台咖啡师 v5 (GGUF Q4_K_M)

基于 [ynanxiu/qwen25-15b-coffee-lora-v5](https://huggingface.co/ynanxiu/qwen25-15b-coffee-lora-v5) 合并全量后量化的 GGUF 模型。

## 量化信息

| 参数 | 值 |
|------|-----|
| 量化方法 | Q4_K_M |
| 模型大小 | 935 MB |
| BPW | 5.08 |
| 原始 FP16 | 3.09 GB |
| 压缩比 | 3.3x |

## 使用方法

```bash
# llama.cpp CLI
./llama-cli -m qwen25-15b-coffee-v5-q4_k_m.gguf -p "Espresso 标准萃取压力是多少 bar？"

# Python (llama-cpp-python)
pip install llama-cpp-python
```

```python
from llama_cpp import Llama
llm = Llama.from_pretrained(
    repo_id="ynanxiu/qwen25-15b-coffee-v5-gguf",
    filename="qwen25-15b-coffee-v5-q4_k_m.gguf",
)
print(llm("咖啡太苦了怎么办？")["choices"][0]["text"])
```

## 能力

| 维度 | 结论 |
|------|------|
| 咖啡参数 | 10/10 🏆 |
| 寒暄社交 | ✅ |
| 故障排查 | ✅ |
| 清洁保养 | ✅ |
| 购买建议 | ✅ |
| 辟谣知识 | ✅ |

## 来源

- LoRA: [ynanxiu/qwen25-15b-coffee-lora-v5](https://huggingface.co/ynanxiu/qwen25-15b-coffee-lora-v5)
- 数据集: [ynanxiu/coffee-sft-dataset](https://huggingface.co/datasets/ynanxiu/coffee-sft-dataset)
- 基座: Qwen/Qwen2.5-1.5B-Instruct