ynanxiu's picture
Add model card
0b488b9 verified
|
raw
history blame contribute delete
1.54 kB
---
license: apache-2.0
library_name: peft
base_model: Qwen/Qwen2.5-1.5B-Instruct
language:
- zh
tags:
- coffee
- barista
- lora
- sft
- qwen2.5
pipeline_tag: text-generation
---
# Qwen2.5-1.5B Coffee LoRA v5 ☕
基于 Qwen2.5-1.5B-Instruct 的咖啡吧台对话 LoRA 适配器。
## 训练信息
| 参数 | 值 |
|------|-----|
| 基座模型 | Qwen2.5-1.5B-Instruct |
| 数据集 | coffee-sft-v5 (3825条) |
| LoRA rank | 16 |
| LoRA alpha | 32 |
| 训练 epoch | 3 |
| Adapter 大小 | 73.9 MB |
| 硬件 | RTX 4060 8GB |
| 训练时长 | ~70 min |
## 能力评测
| 维度 | 得分 | 说明 |
|------|:--:|------|
| 咖啡参数 | 10/10 | 🏆 满分 |
| 寒暄社交 | ✅ | 自然对话 |
| 故障排查 | ✅ | 过萃/堵杯/crema |
| 清洁保养 | ✅ | 摩卡壶/意式机/磨豆机 |
| 购买建议 | ✅ | 新手推荐/预算选购 |
| 辟谣知识 | ✅ | 深烘/健康/猫屎咖啡 |
## 使用方法
```python
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
model = AutoModelForCausalLM.from_pretrained(
"Qwen/Qwen2.5-1.5B-Instruct",
torch_dtype=torch.bfloat16,
device_map="auto",
)
model = PeftModel.from_pretrained(model, "ynanxiu/qwen25-15b-coffee-lora-v5")
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
# 开始聊天!
```
## 相关资源
- 数据集:[ynanxiu/coffee-sft-dataset](https://huggingface.co/datasets/ynanxiu/coffee-sft-dataset)
- 项目代码:[AngelLiang/openmind-llm01](https://github.com/AngelLiang/openmind-llm01)