--- language: - zh - en license: mit tags: - beer - brewing - homebrew - craft-beer - recipe - qwen - lora pipeline_tag: text-generation base_model: Qwen/Qwen3-4B --- # BeerLLM v1 BeerLLM 是一个面向精酿啤酒酿造的中文大语言模型,基于 Qwen3-4B 通过 LoRA SFT 微调训练。模型覆盖配方设计、工艺参数、原料知识、风格对比、安全质控等酿造全流程,可作为酿造助手、配方推荐工具或知识库推理后端使用。 ## 模型信息 - **基座模型**: [Qwen3-4B](https://huggingface.co/Qwen/Qwen3-4B)(fp16) - **训练方式**: LoRA SFT(rank=32, alpha=64, epochs=3) - **训练数据**: ~6,870 条中文酿造问答,覆盖 7 类任务 - **显存需求**: 约 8GB(fp16),RTX 4080 SUPER 16GB 可直接运行 - **微调框架**: LLaMA-Factory ## 能力覆盖 | 任务类型 | 说明 | 数据量 | |---------|------|--------| | 配方查询 | 按风格推荐经典配方(麦芽、酒花、酵母、参数) | ~5,000 | | 参数问答 | IBU/SRM/OG/FG 等风格参数查询与比较 | ~2,500 | | 原料知识 | 啤酒花、麦芽、酵母的特性与适用风格 | ~2,000 | | 酿造工艺 | 糖化温度、发酵控制、水质、氧化等深度工艺 | ~3,500 | | 风格对比 | 易混淆风格的定性差异比较(含知识库) | ~1,000 | | 配方生成 | 根据用户需求(ABV/IBU/风格偏好)推荐配方 | ~1,000 | | 安全质控 | 酿造故障诊断与食品安全 | ~17* | > *安全质控样本量较小,建议在涉及食品安全问题时结合实际经验判断。 ## 快速使用 ```python from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.from_pretrained( "kevinix/beerllm-v1", dtype="float16", device_map="auto", trust_remote_code=True, ) tokenizer = AutoTokenizer.from_pretrained("kevinix/beerllm-v1") messages = [ {"role": "system", "content": "你是一个专业的啤酒酿造助手 BeerLLM"}, {"role": "user", "content": "请给我一份美式IPA的配方"}, ] prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True) inputs = tokenizer(prompt, return_tensors="pt").to(model.device) outputs = model.generate(**inputs, max_new_tokens=1024, temperature=0.7) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ``` ## 局限与注意事项 1. **配方参数来自统计分布**,不代表某款特定啤酒的实际配方 2. **安全建议仅供参考**,酿造安全须结合实际经验和当地规范 3. **原料知识覆盖不全面**——部分小众原料的参数可能不准确 4. 模型有时会产生幻觉,建议关键参数交叉验证 5. 本模型面向教育和参考用途,不构成商业酿造建议 ## 使用许可 MIT License — 可自由使用、修改、分发,包括商业用途。 ## 致谢 - [Qwen](https://github.com/QwenLM/Qwen) 团队提供优秀的基座模型 - [LLaMA-Factory](https://github.com/hiyouga/LLaMA-Factory) 提供便捷的微调框架 - 精酿啤酒社区积累的丰富酿造数据