Changelog
更新日志
记录每次更新的功能、优化与修复。
2026-03-14
v2.8.0
2026-03-14v2.8.0
新增 Gemini 2.5 Pro、支持音频输入
- 新模型新增 Google Gemini 2.5 Pro(1M context,multi-modal)
- 新模型新增 Gemini 2.5 Flash 轻量版
- 新功能音频输入支持(audio modality),可直接发送 base64 音频片段
- 优化流式输出延迟优化,P99 从 80ms 降至 48ms
- 修复修复 function calling 返回空 arguments 时的解析错误
2026-03-01
v2.7.2
2026-03-01v2.7.2
DeepSeek-R1 集成 & Fallback 策略增强
- 新模型新增 DeepSeek-R1 推理模型(128K context)
- 新功能Fallback 策略新增 cost-optimized 模式,优先选择同能力中最低价的模型
- 优化API Key 权限体系重构,支持按模型组授权
- 修复修复部分情况下 usage.total_tokens 计算不准确的问题
- 修复修复 `/v1/models` 列表偶发超时
2026-02-15
v2.7.0
2026-02-15v2.7.0
Claude 3.7 Sonnet 上线 & 控制台改版
- 新模型新增 Anthropic Claude 3.7 Sonnet(200K context)
- 新模型新增 Claude 3.7 Haiku 快速版
- 新功能控制台全新改版:新增使用量图表、按模型汇总统计
- 新功能支持充值记录导出为 CSV
- 优化改进负载均衡算法,多供应商同模型时按延迟动态分配
- Beta组织账户(Team)功能开放内测,支持成员管理 & 共享余额
2026-02-01
v2.6.5
2026-02-01v2.6.5
GPT-5.1 & o3-mini 支持
- 新模型新增 OpenAI GPT-5.1(全新旗舰,1M context)
- 新模型新增 OpenAI o3-mini 推理模型
- 优化图像输入(vision)支持 URL 和 base64 两种格式
- 修复修复 streaming 模式下最后一帧 finish_reason 丢失
2026-01-18
v2.6.0
2026-01-18v2.6.0
速率限制自定义 & 多区域部署
- 新功能支持通过控制台为每个 API Key 单独配置 RPM / TPM 限额
- 新功能新增亚洲(新加坡)接入节点,就近接入降低延迟
- 优化错误响应体现在标准 OpenAI 格式,x-request-id 便于排错
- 新模型新增 Mistral Large 2501 & Mistral Small 3
- 修复修复 JSON mode 在 Claude 时返回额外转义字符
2026-01-02
v2.5.0
2026-01-02v2.5.0
平台正式上线
- 新功能平台正式上线,首批支持 120+ 模型
- 新功能支持 OpenAI / Anthropic / Google / DeepSeek / Meta 五大供应商
- 新功能提供 Chat Completions、Embeddings、Models 三类 API
- 新功能支持 Function Calling、JSON Mode、Vision、Streaming
- 新功能控制台基础功能:API Key 管理、余额查看、基础用量统计