ynanxiu
/

qwen25-15b-coffee-lora-v5

Text Generation

Model card Files Files and versions

qwen25-15b-coffee-lora-v5 / README.md

ynanxiu's picture

Add model card

0b488b9 verified 10 days ago

|

history blame contribute delete

1.54 kB

	---
	license: apache-2.0
	library_name: peft
	base_model: Qwen/Qwen2.5-1.5B-Instruct
	language:
	- zh
	tags:
	- coffee
	- barista
	- lora
	- sft
	- qwen2.5
	pipeline_tag: text-generation
	---

	# Qwen2.5-1.5B Coffee LoRA v5 ☕

	基于 Qwen2.5-1.5B-Instruct 的咖啡吧台对话 LoRA 适配器。

	## 训练信息

	\| 参数 \| 值 \|
	\|------\|-----\|
	\| 基座模型 \| Qwen2.5-1.5B-Instruct \|
	\| 数据集 \| coffee-sft-v5 (3825条) \|
	\| LoRA rank \| 16 \|
	\| LoRA alpha \| 32 \|
	\| 训练 epoch \| 3 \|
	\| Adapter 大小 \| 73.9 MB \|
	\| 硬件 \| RTX 4060 8GB \|
	\| 训练时长 \| ~70 min \|

	## 能力评测

	\| 维度 \| 得分 \| 说明 \|
	\|------\|:--:\|------\|
	\| 咖啡参数 \| 10/10 \| 🏆 满分 \|
	\| 寒暄社交 \| ✅ \| 自然对话 \|
	\| 故障排查 \| ✅ \| 过萃/堵杯/crema \|
	\| 清洁保养 \| ✅ \| 摩卡壶/意式机/磨豆机 \|
	\| 购买建议 \| ✅ \| 新手推荐/预算选购 \|
	\| 辟谣知识 \| ✅ \| 深烘/健康/猫屎咖啡 \|

	## 使用方法

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer
	from peft import PeftModel

	model = AutoModelForCausalLM.from_pretrained(
	"Qwen/Qwen2.5-1.5B-Instruct",
	torch_dtype=torch.bfloat16,
	device_map="auto",
	)
	model = PeftModel.from_pretrained(model, "ynanxiu/qwen25-15b-coffee-lora-v5")

	tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
	# 开始聊天！
	```

	## 相关资源

	- 数据集：[ynanxiu/coffee-sft-dataset](https://huggingface.co/datasets/ynanxiu/coffee-sft-dataset)
	- 项目代码：[AngelLiang/openmind-llm01](https://github.com/AngelLiang/openmind-llm01)