Spaces:

wdawdwa
/

TFAI

Paused

App Files Files Community

TFAI / README.md

ZyphrZero

🔧 chore(security): replace hardcoded API key with placeholder

7561cf7 10 months ago

preview code

Raw

History Blame

11.4 kB

项目简介

这是一个为 Z.ai 提供 OpenAI API 兼容接口的 Python 代理服务，允许开发者通过标准的 OpenAI API 格式访问 Z.ai 的 GLM-4.5 模型。

主要特性

OpenAI API 兼容：完整支持 /v1/chat/completions 和 /v1/models 端点
流式响应支持：完整实现 Server-Sent Events (SSE) 流式传输
思考内容处理：提供多种策略处理模型的思考过程（<details> 标签）
匿名会话支持：可选使用匿名 token 避免共享对话历史
多种模型支持：支持 GLM-4.5 基础版、思考版和搜索版
调试模式：详细的请求/响应日志记录，便于开发调试
CORS 支持：内置跨域资源共享支持
Function Call 支持：完整支持 OpenAI 格式的工具调用功能，通过智能提示注入实现，支持流式响应时的工具调用缓冲机制

使用场景

将 Z.ai 集成到支持 OpenAI API 的应用程序中
开发需要同时使用多个 AI 服务的应用
测试和评估 GLM-4.5 模型的能力
需要流式响应或思考内容的 AI 应用开发

快速开始

使用 uv (推荐)

安装 uv：

# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh
# Windows (PowerShell)
powershell -c "irm https://astral.sh/uv/install.sh | iex"

同步依赖：
```
uv sync
```
运行服务：
```
uv run python main.py
```

使用 pip

安装依赖：
```
pip install -r requirements.txt
```
配置服务（可选）：编辑 main.py 中的 ServerConfig 类以调整服务行为：
- AUTH_TOKEN: 客户端 API Key 密钥
- API_ENDPOINT: Z.ai 上游 API 地址
- BACKUP_TOKEN: 固定认证 token（匿名模式失败时使用）
- LISTEN_PORT: 服务监听端口
- DEBUG_LOGGING: 调试模式开关
- THINKING_PROCESSING: 思考内容处理策略
- ANONYMOUS_MODE: 匿名模式开关
- TOOL_SUPPORT: Function Call 功能开关
运行服务：
```
python main.py
```
服务启动后，可以访问 http://localhost:8080/docs 查看自动生成的 Swagger API 文档

使用 OpenAI 客户端库调用：

import openai

# 初始化客户端
client = openai.OpenAI(
    base_url="http://localhost:8080/v1",
    api_key="sk-your-api-key"
)

# 流式调用示例
response = client.chat.completions.create(
    model="GLM-4.5",  # 可选: "GLM-4.5-Thinking", "GLM-4.5-Search"
    messages=[{"role": "user", "content": "你好"}],
    stream=True
)

for chunk in response:
    content = chunk.choices[0].delta.content
    reasoning = chunk.choices[0].delta.reasoning_content
    if content:
        print(content, end="")
    if reasoning:
        print(f"\n[思考] {reasoning}\n")

注意：请将 api_key 替换为您在 main.py 中配置的 AUTH_TOKEN 值。

Function Call 使用示例

本项目完整支持 OpenAI 格式的工具调用功能，包括流式和非流式响应。实现原理是将 OpenAI 的工具定义转换为特殊的系统提示，让模型理解并生成符合格式的工具调用。

基本工具调用

import openai

# 初始化客户端
client = openai.OpenAI(
    base_url="http://localhost:8080/v1",
    api_key="sk-your-api-key"
)

# 定义天气查询工具
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "获取指定城市的天气信息",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {
                        "type": "string",
                        "description": "城市名称"
                    },
                    "unit": {
                        "type": "string",
                        "enum": ["celsius", "fahrenheit"],
                        "description": "温度单位",
                        "default": "celsius"
                    }
                },
                "required": ["city"]
            }
        }
    }
]

# 使用工具调用
response = client.chat.completions.create(
    model="GLM-4.5",
    messages=[{"role": "user", "content": "北京今天天气怎么样？"}],
    tools=tools,
    tool_choice="auto"
)

message = response.choices[0].message
if message.tool_calls:
    print("模型请求调用工具:")
    for tool_call in message.tool_calls:
        print(f"工具名称: {tool_call.function.name}")
        print(f"参数: {tool_call.function.arguments}")
        print(f"调用ID: {tool_call.id}")
else:
    print(f"回复: {message.content}")

流式工具调用

# 流式工具调用示例
response = client.chat.completions.create(
    model="GLM-4.5",
    messages=[{"role": "user", "content": "帮我计算 2 的 10 次方"}],
    tools=[{
        "type": "function",
        "function": {
            "name": "calculate",
            "description": "执行数学计算",
            "parameters": {
                "type": "object",
                "properties": {
                    "expression": {
                        "type": "string",
                        "description": "数学表达式"
                    }
                },
                "required": ["expression"]
            }
        }
    }],
    stream=True
)

# 注意：工具调用模式下，流式响应会缓冲所有内容，
# 在最后一次性返回工具调用信息
tool_calls = None
content = ""

for chunk in response:
    delta = chunk.choices[0].delta
    if delta.tool_calls:
        tool_calls = delta.tool_calls
    if delta.content:
        content += delta.content

if tool_calls:
    print("工具调用:")
    for tool_call in tool_calls:
        print(f"函数: {tool_call.function.name}")
        print(f"参数: {tool_call.function.arguments}")
else:
    print("回复:", content)

强制使用特定工具

# 强制使用特定工具
response = client.chat.completions.create(
    model="GLM-4.5",
    messages=[{"role": "user", "content": "今天是什么日子"}],
    tools=[{
        "type": "function",
        "function": {
            "name": "get_current_date",
            "description": "获取当前日期和时间",
            "parameters": {
                "type": "object",
                "properties": {},
                "required": []
            }
        }
    }],
    tool_choice={"type": "function", "function": {"name": "get_current_date"}}
)

message = response.choices[0].message
print(f"完成原因: {response.choices[0].finish_reason}")  # tool_calls
if message.tool_calls:
    print("工具调用结果:", message.tool_calls[0].function.arguments)

多工具协作

# 定义多个工具
tools = [
    {
        "type": "function",
        "function": {
            "name": "search_web",
            "description": "搜索网络信息",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {
                        "type": "string",
                        "description": "搜索关键词"
                    }
                },
                "required": ["query"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "summarize_text",
            "description": "总结文本内容",
            "parameters": {
                "type": "object",
                "properties": {
                    "text": {
                        "type": "string",
                        "description": "要总结的文本"
                    },
                    "max_length": {
                        "type": "integer",
                        "description": "最大长度",
                        "default": 100
                    }
                },
                "required": ["text"]
            }
        }
    }
]

# 使用多工具
response = client.chat.completions.create(
    model="GLM-4.5",
    messages=[{"role": "user", "content": "搜索一下最新的 AI 新闻并总结"}],
    tools=tools,
    tool_choice="auto"
)

message = response.choices[0].message
if message.tool_calls:
    for tool_call in message.tool_calls:
        print(f"调用工具: {tool_call.function.name}")
        # 在实际应用中，这里需要执行相应的函数
        # 并将结果通过工具消息返回给模型

运行 Function Call 演示

项目包含一个完整的 Function Call 演示脚本：

python function_call_demo.py

该脚本将演示：

基本的工具调用
数学计算工具
强制使用特定工具
流式工具调用响应

使用 Docker Compose

启动服务：

# 在 deploy 目录下运行
cd deploy
docker-compose up -d

停止服务：
```
docker-compose down
```
查看日志：
```
docker-compose logs -f
```
重新构建并启动：
```
docker-compose up -d --build
```

注意：如需修改配置参数（如 API 密钥、端口等），请直接编辑 main.py 文件中的 ServerConfig 类。

配置选项

配置项	描述	默认值
`API_ENDPOINT`	Z.ai 的上游 API 地址	`https://chat.z.ai/api/chat/completions`
`AUTH_TOKEN`	下游客户端鉴权 key	`sk-your-api-key`
`BACKUP_TOKEN`	上游 API 的 token (匿名模式失败时使用)	JWT token
`PRIMARY_MODEL`	默认模型名称	`GLM-4.5`
`THINKING_MODEL`	思考模型名称	`GLM-4.5-Thinking`
`SEARCH_MODEL`	搜索模型名称	`GLM-4.5-Search`
`LISTEN_PORT`	服务监听端口	`8080`
`DEBUG_LOGGING`	调试模式开关	`true`
`THINKING_PROCESSING`	思考内容处理策略	`think` (可选: `strip`, `raw`)
`ANONYMOUS_MODE`	是否使用匿名 token	`true`
`TOOL_SUPPORT`	是否启用 Function Call 功能	`true`

思考内容处理策略说明

think: 将 <details> 标签转换为 <thinking> 标签，适合 OpenAI 兼容格式
strip: 完全移除 <details> 标签及其内容
raw: 保留原始格式，不做任何处理

架构说明

本项目采用以下技术栈：

FastAPI: 现代、快速的 Web 框架，提供自动 API 文档生成
Pydantic: 数据验证和序列化，确保 API 兼容性
uvicorn: ASGI 服务器，提供高性能服务

项目通过异步编程模型实现高效的并发处理，支持流式和非流式两种响应模式。

贡献指南

欢迎提交 Issue 和 Pull Request！请确保：

遵循 PEP 8 规范
提交前运行测试（如果有）
更新相关文档

许可证

MIT LICENSE

免责声明

本项目与 Z.ai 官方无关，使用前请确保遵守 Z.ai 的服务条款。请勿将此服务用于商业用途或违反 Z.ai 使用条款的场景。