File size: 6,909 Bytes
7d20731 f0cacfe 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 02896ca 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 ee092c1 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 f0cacfe 7d20731 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 | # Z.AI OpenAI API 代理服务



为 Z.AI 提供 OpenAI API 兼容接口的轻量级代理服务,支持 GLM-4.5 系列模型的完整功能。
## ✨ 核心特性
- 🔌 **完全兼容 OpenAI API** - 无缝集成现有应用
- 🚀 **高性能流式响应** - Server-Sent Events (SSE) 支持
- 🛠️ **Function Call 支持** - 完整的工具调用功能
- 🧠 **思考模式支持** - 智能处理模型推理过程
- 🔍 **搜索模型集成** - GLM-4.5-Search 网络搜索能力
- 🐳 **Docker 部署** - 一键容器化部署
- 🛡️ **会话隔离** - 匿名模式保护隐私
- 🔧 **高度可配置** - 环境变量灵活配置
## 🚀 快速开始
### 环境要求
- Python 3.8+
- pip 或 uv (推荐)
### 安装运行
```bash
# 克隆项目
git clone https://github.com/ZyphrZero/z.ai2api_python.git
cd z.ai2api_python
# 使用 uv (推荐)
curl -LsSf https://astral.sh/uv/install.sh | sh
uv sync
uv run python main.py
# 或使用 pip (推荐使用清华源)
pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
python main.py
```
服务启动后访问:http://localhost:8080/docs
### 基础使用
```python
import openai
# 初始化客户端
client = openai.OpenAI(
base_url="http://localhost:8080/v1",
api_key="your-auth-token" # 替换为你的 AUTH_TOKEN
)
# 普通对话
response = client.chat.completions.create(
model="GLM-4.5",
messages=[{"role": "user", "content": "你好,介绍一下 Python"}],
stream=False
)
print(response.choices[0].message.content)
```
### Docker 部署
```bash
cd deploy
docker-compose up -d
```
## 📖 详细指南
### 支持的模型
| 模型 | 描述 | 特性 |
|------|------|------|
| `GLM-4.5` | 标准模型 | 通用对话,平衡性能 |
| `GLM-4.5-Thinking` | 思考模型 | 显示推理过程,透明度高 |
| `GLM-4.5-Search` | 搜索模型 | 实时网络搜索,信息更新 |
### Function Call 功能
```python
# 定义工具
tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "获取天气信息",
"parameters": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "城市名称"}
},
"required": ["city"]
}
}
}]
# 使用工具
response = client.chat.completions.create(
model="GLM-4.5",
messages=[{"role": "user", "content": "北京天气怎么样?"}],
tools=tools,
tool_choice="auto"
)
```
### 流式响应
```python
response = client.chat.completions.create(
model="GLM-4.5-Thinking",
messages=[{"role": "user", "content": "解释量子计算"}],
stream=True
)
for chunk in response:
content = chunk.choices[0].delta.content
reasoning = chunk.choices[0].delta.reasoning_content
if content:
print(content, end="")
if reasoning:
print(f"\n🤔 思考: {reasoning}\n")
```
## ⚙️ 配置说明
### 环境变量配置
| 变量名 | 默认值 | 说明 |
|--------|--------|------|
| `AUTH_TOKEN` | `sk-your-api-key` | 客户端认证密钥 |
| `API_ENDPOINT` | `https://chat.z.ai/api/chat/completions` | 上游 API 地址 |
| `LISTEN_PORT` | `8080` | 服务监听端口 |
| `DEBUG_LOGGING` | `true` | 调试日志开关 |
| `THINKING_PROCESSING` | `think` | 思考内容处理策略 |
| `ANONYMOUS_MODE` | `true` | 匿名模式开关 |
| `TOOL_SUPPORT` | `true` | Function Call 功能开关 |
### 思考内容处理策略
- `think` - 转换为 `<thinking>` 标签(OpenAI 兼容)
- `strip` - 移除思考内容
- `raw` - 保留原始格式
## 🎯 使用场景
### 1. AI 应用开发
```python
# 集成到现有应用
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:8080/v1",
api_key="your-token"
)
# 智能客服
def chat_with_ai(message):
response = client.chat.completions.create(
model="GLM-4.5",
messages=[{"role": "user", "content": message}]
)
return response.choices[0].message.content
```
### 2. 多模型对比测试
```python
models = ["GLM-4.5", "GLM-4.5-Thinking", "GLM-4.5-Search"]
for model in models:
response = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": "什么是机器学习?"}]
)
print(f"\n=== {model} ===")
print(response.choices[0].message.content)
```
### 3. 工具调用集成
```python
# 结合外部 API
def call_external_api(tool_name, arguments):
# 执行实际工具调用
return result
# 处理工具调用
if response.choices[0].message.tool_calls:
for tool_call in response.choices[0].message.tool_calls:
result = call_external_api(
tool_call.function.name,
json.loads(tool_call.function.arguments)
)
# 将结果返回给模型继续对话
```
## ❓ 常见问题
**Q: 如何获取 AUTH_TOKEN?**
A: `AUTH_TOKEN` 为自己自定义的api key,在 `main.py` 的 `ServerConfig` 类中或通过环境变量配置,需要保证客户端与服务端一致。
**Q: 匿名模式是什么?**
A: 匿名模式使用临时 token,避免对话历史共享,保护隐私。
**Q: Function Call 如何工作?**
A: 通过智能提示注入实现,将工具定义转换为系统提示。
**Q: 支持哪些 OpenAI 功能?**
A: 支持聊天完成、模型列表、流式响应、工具调用等核心功能。
**Q: 如何自定义配置?**
A: 通过环境变量或修改 `main.py` 中的 `ServerConfig` 类。
## 🏗️ 技术架构
```
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ OpenAI │ │ Proxy │ │ Z.AI │
│ Client │────▶│ Server │────▶│ API │
│ │ │ │ │ │
└─────────────┘ └─────────────┘ └─────────────┘
```
- **FastAPI** - 高性能 Web 框架
- **Pydantic** - 数据验证和序列化
- **Uvicorn** - ASGI 服务器
- **Requests** - HTTP 客户端
## 🤝 贡献指南
我们欢迎所有形式的贡献!
请确保代码符合 PEP 8 规范,并更新相关文档。
## 📄 许可证
本项目采用 MIT 许可证 - 查看 [LICENSE](LICENSE) 文件了解详情。
## ⚠️ 免责声明
- 本项目与 Z.AI 官方无关
- 使用前请确保遵守 Z.AI 服务条款
- 请勿用于商业用途或违反使用条款的场景
- 项目仅供学习和研究使用
---
<div align="center">
Made with ❤️ by the community
</div> |