File size: 1,544 Bytes
981a5b7
0b488b9
981a5b7
0b488b9
 
 
981a5b7
0b488b9
 
981a5b7
 
0b488b9
981a5b7
 
 
0b488b9
981a5b7
0b488b9
981a5b7
0b488b9
981a5b7
0b488b9
 
 
 
 
 
 
 
 
 
981a5b7
0b488b9
981a5b7
0b488b9
 
 
 
 
 
 
 
981a5b7
0b488b9
981a5b7
0b488b9
 
 
981a5b7
0b488b9
 
 
 
 
 
981a5b7
0b488b9
 
 
981a5b7
0b488b9
981a5b7
0b488b9
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
---
license: apache-2.0
library_name: peft
base_model: Qwen/Qwen2.5-1.5B-Instruct
language:
- zh
tags:
- coffee
- barista
- lora
- sft
- qwen2.5
pipeline_tag: text-generation
---

# Qwen2.5-1.5B Coffee LoRA v5 ☕

基于 Qwen2.5-1.5B-Instruct 的咖啡吧台对话 LoRA 适配器。

## 训练信息

| 参数 | 值 |
|------|-----|
| 基座模型 | Qwen2.5-1.5B-Instruct |
| 数据集 | coffee-sft-v5 (3825条) |
| LoRA rank | 16 |
| LoRA alpha | 32 |
| 训练 epoch | 3 |
| Adapter 大小 | 73.9 MB |
| 硬件 | RTX 4060 8GB |
| 训练时长 | ~70 min |

## 能力评测

| 维度 | 得分 | 说明 |
|------|:--:|------|
| 咖啡参数 | 10/10 | 🏆 满分 |
| 寒暄社交 | ✅ | 自然对话 |
| 故障排查 | ✅ | 过萃/堵杯/crema |
| 清洁保养 | ✅ | 摩卡壶/意式机/磨豆机 |
| 购买建议 | ✅ | 新手推荐/预算选购 |
| 辟谣知识 | ✅ | 深烘/健康/猫屎咖啡 |

## 使用方法

```python
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

model = AutoModelForCausalLM.from_pretrained(
    "Qwen/Qwen2.5-1.5B-Instruct",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
model = PeftModel.from_pretrained(model, "ynanxiu/qwen25-15b-coffee-lora-v5")

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
# 开始聊天!
```

## 相关资源

- 数据集:[ynanxiu/coffee-sft-dataset](https://huggingface.co/datasets/ynanxiu/coffee-sft-dataset)
- 项目代码:[AngelLiang/openmind-llm01](https://github.com/AngelLiang/openmind-llm01)