25-0309更新：

grok系列模型已支持超高并发

grok-3

grok-3-r1

25-0225更新：

新增支持Anthropic最新发布的C37S，新增模型如下：

claude-3-7-sonnet-latest

claude-3-7-sonnet-20250219

25-0201更新：

新增支持OpenAI最新开放的闭源 o3-mini 系列API模型推理服务，新增如下模型支持

o3-mini

o3-mini-2025-01-31

25-0120更新：

新增支持 deepseek-reasoner 模型

25-0112更新：

新增支持o1正式版，新增支持模型名称如下：

o1-2024-12-17

25-0108更新

新增支持DeepSeek系列模型

添加 gemini-1.5-pro 模型

25-0103更新：

新增cdn加速节点api2.shubiaobiao.com，该节点大幅度优化响应速度。经内部测试通过后，会正式部署到api域名。

24-1219更新：

新增支持最新的24-1217版本的Realtime系列模型，新版的4o Realtime降价很多，mini的价格也是更加便宜，带上高命中率的缓存功能，价格已经到了还算能接受的程度了：

gpt-4o-realtime-preview-2024-12-17

gpt-4o-mini-realtime-preview

gpt-4o-mini-realtime-preview-2024-12-17

24-1218更新：

新增最新的 gpt-4o-audio-preview-2024-12-17 模型支持，音频输入输出价格相较于原有的4oA1001下降很多。

关于最新发布的 o1 正式版，由于OAI并未全量开放，我这边看了一堆Tier5的号也没有发现有o1正式版API权限的，因此今天并没有接入，等待后续OAI开放。

Chat.Completions API新增支持 reasoning_effort 可选参数，可以调整o1系列模型思考时的“努力程度”，根据官方文档[1]，这个参数仅对o1系列有意义。

“消费记录”部分新增支持缓存字段以及音频输入输出字段，现在可以在Next站的用量统计/消费记录中查询这些数据。

新的4o-realtime1217会在明天接入，今天新增一些这些字段的支持占用了一些时间。

24-1121更新：

新增支持最新的 gpt-4o-2024-11-20 模型，价格和上个版本的24-0806没变化

24-1107更新：

完善Claude系列模型在OpenAI兼容接口的Tools调用兼容性支持

24-1105更新：

支持最新的Claude 3.5 Sonnet，新增如下模型名称：

claude-3-5-haiku

claude-3-5-haiku-latest

claude-3-5-haiku-20241022

24-1023更新：

新增支持Anthropic最新的 claude-3-5-sonnet-20241022

24-1018更新：

新增支持最新的 gpt-4o-audio-preview 系列模型，但是由于技术原因，暂时仅支支持该模型的非流调用，需要实时语音交互的用户请联系我们获取特殊的实时WebSocket端点接口

24-1012

新增支持OpenAI最新的Realtime Endpoint以及4o-realtime预览版模型，现在可以和AI低延迟地实时通话了。（由于该模型api框架改动较大，仅在前沿站使用，有需要的客户请联系客服。预计一周内完全适配该模型）

新增支持的模型名称：

gpt-4o-realtime-preview-2024-10-01

24-0913

新增支持OpenAI最新的o1和o1 mini系列模型

新增支持的模型名称：

o1-preview

o1-preview-2024-09-12

o1-mini

o1-mini-2024-09-12

24-0828

新增支持 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827

Gemini API服务提供商从谷歌云Vertex AI平台迁移到Google AI平台，Gemini相关模型并发量大幅提升

24-0813

支持 chatgpt-4o-latest

24-0807

新增支持最新的GPT-4 Omni 0806版本，价格比初代4Omni降低一大半

新增支持模型名称：

gpt-4o-2024-08-06

24-0621

支持Anthropic最新发布的Claude 3.5 Sonnet，价格和Claude 3 Sonnet完全相同，但是A说它的能力和速度比C3Opus强，同样支持通过Messages原生API调用，也支持通过OpenAI Chat.Completions 兼容API调用。

claude-3-5-sonnet

claude-3-5-sonnet-20240620

24-0531

支持谷歌最新的Gemini 1.5，新增模型支持：

gemini-1.5-pro-001

gemini-1.5-flash-001

均支持Vision输入

注：

gemini-pro-vision 和 gemini-pro-vision 已指向 gemini-1.5-pro-001

24-0514

新增支持最新的GPT-4 Omni，OpenAI最先进的多模态模型。

新增支持模型名称：

gpt-4o

gpt-4o-2024-05-13

该模型目前和gpt-4-turbo一样，仅支持文字和图像混合推理+纯文本输出

输入输出的价格相较于gpt4t降低70%到50%，再加上GPT4o的分词器优化，实际相同字数下，GPT4o的Token会少一大半，因此调用成本大约和gpt3.5在一个数量级上。

参考：https://openai.com/index/hello-gpt-4o/

24-0318

修复OpenAI.Chat.Completions兼容接口中的Claude模型stop参数没有正确映射的问题

优化兼容接口中对于Claude的适配：

role=system的msg会被提取出来，放到API的system参数中再发过去

如果一个assistant的msg中包含图像，为了使其符合claude的msg api的校验规则，会在前面加一个占位的msg，从而将这个msg顶到user角色中，使其能正常带上图像内容而不报错

如果msg的长度为偶数，则现在不会再强制补成奇数，（一般情况下）此时末尾会是assistant，这样会触发原生的直接补全功能

24-0314

新增 Claude 3 Haiku （小杯）支持 claude-3-haiku | claude-3-haiku-20240307

特色：

同样支持图像/文字混合的多模态输入

价格和性能对标gpt-3.5-turbo

（Anthropic声称）Haiku的性能比3.5更加优秀（https://www.anthropic.com/news/claude-3-family

C3系列中最快最便宜的

24-0306

解决新的Anthropic接口的兼容性问题，包括：

网页/兼容API中的Cladue系列模型，因各个角色的对话顺序限制导致的请求错误

LobeChat中使用C3模型+图像输入时导致的错误

修复更新Vision相关代码后导致GPT4V接口异常的问题

24-0305

新增Anthropic最新的Claude3系列模型，C3全系多模态，支持图像输入，其中C3大杯（Opus）声称比GPT4还要强。

claude-3-opus C3 （大杯）

claude-3-sonnet C3 （中杯）

C3小杯等待发布

价格参考：https://www.anthropic.com/api#pricing

现可通过OpenAI的Chat.Completions接口，以GPT4V的标准输入和输出，也可以通过Anthropic官方的Messages接口格式使用。

24-0217

由于OpenAI官方已经将gpt-3.5-turbo滚动更新到0125，因此默认模型的计费也同步更新到0125了

24-0125

新增 gpt-4-0125-preview 和 gpt-4-turbo-preview ，其上下文窗口、参数和价格相对于1106均无变化（据说解决了懒惰的问题

新增第三代嵌入模型： text-embedding-3-small 和 text-embedding-3-large ，其中第三代嵌入模型对于第二代有如下变化

价格和ada v2不同，3代小号嵌入模型比ada v2便宜，大号比ada v2贵一点点

嵌入API现可选维度（dimesions）参数

总结：

总共新增如下模型名称

gpt-4-turbo-preview

gpt-4-0125-preview

text-embedding-3-small

text-embedding-3-large

受影响的API Endpoints:

Embeddings API: Add dimensions parameter support for embedding v3 models
Chat Completions API: 新增0125批次的GPT4 Turbo模型

参考：

https://platform.openai.com/docs/changelog/jan-25th-2024
https://openai.com/blog/new-embedding-models-and-api-updates

24-0110

移除了24-01-04弃用的模型，受影响的API和模型如下：

Completions:

text-davinci-003

text-davinci-002

text-ada-001

text-babbage-001

text-curie-001

Edits:

code-davinci-edit-001

text-davinci-edit-001

Embeddings:

text-search-ada-doc-001

参考链接：
https://platform.openai.com/docs/deprecations

23-1214

增集成谷歌最新的Gemini Pro系列模型推理服务

新增Google AI系列模型：

gemini-pro

gemini-pro-vision

现可通过本站提供的Chat/Completions API直接调用，其中Gemini Pro Vision是一个多模态的大模型，支持基于文字和图片混合推理，参数用法和OpenAI的GPT4v一致，支持流和非流，模型能力大约是3.5的水平，多模态推理能力差强人意（指大体上算令人满意），可以当作小GPT4v来玩。

23-1117

优化消费数据统计图表相关的查询性能

优化前端统计图表支出展示方式，改为直接展示各个时段的支出费用而不是代币数目，更加直观。

添加相关密钥到API调用的账单记录里。

新增日志数据批量导出支持，支持导出为JSON或者CSV文件

23-1113

放宽速率限制策略+降低400流控力度

23-1106

新的模型和API已经从今天中午开始陆续上线完毕

新增普通模型支持：

gpt-3.5-turbo-1106

新的GPT35模型
输入价格比老模型降低约1/3

老的 gpt-3.5-turbo 仍然指向旧版的35-0613，旧版没有降价所以 gpt-3.5-turbo 还是那个价格（可以考虑主动将默认模型重写到新款1106，打算征求一下群里的意见+看看新款稳不稳定再改。

dalle-e-3

OpenAI最新款的图像生成模型，效果也是非常不错，已经快要干翻Mj了，调用起来非常简单，推荐使用这个。

tts-1

tts-1-hd

OpenAI最新款的TTS语音转文本模型，效果也是非常棒，媲美真实人声，一个声音就原生支持多国语言，个人觉得效果比Azure的神经网络语音引擎还要牛x，对于语言学习类、AI对话交流类、AI朗读(听书、网页阅读)等方面的应用应该很有用。

新增GPT-4 Trubo模型支持：

gpt-4-1106-preview

gpt-4-vision-preview

优点：

速度飞快

超大上下文窗口 128k（其中输入最多124k，输出最多4k）

强大的多模态图像输入支持

新版的Tools工具调用支持，可一次调用多个函数

更低价格

新的预览版模型的请求频率限制较为严格，目前看上去是众生平等每个OpAI账号100RPD，本站总共只能提供大约几千到几万的RPD，虽说可用性没法保证，但是已经可以开始尝试接入并适配到自己的应用了。

还有需要注意的是 gpt-4-vision-preview 最好主动指定一下 max_tokens ，否则会生成几token就中止输出。

23-1104

将Anthropic模型（Claude2/ClaudeInstant1）添加到OpenAI ChatCompletions接口中

即现在可以通过 /v1/chat/completions 接口调用 claude-2 和 claude-instant-1 这两个模型了（OpAI接口的兼容性相比Anthropic原接口好一些，直接自定义一个模型名称就可以用了。）

同时将Anthropic模型费率从之前的1.2下调到1.1

23-1025

普通模型倍率下调为0.2

GPT4倍率下调为0.4

23-0906

新增gpt-4-32k模型（由Azure提供）

23-0720

新增CN2 GIA CDN加速，国内用户请求更稳定。

23-0719

计划内的网站维护，服务中断10min，迁移到高防高性能服务器。

23-0620

3.5模型限时1折

23-0614

同步OpenAI下调gpt-3.5-turbo模型的费用

新增gpt-3.5-turbo-0613

新增gpt-3.5-turbo-16k

23-0517

重构网站前端，优化聊天页面和充值页面

增加了密钥权限控制功能，精细控制每个密钥可以访问的模型

23-0426

上线网页文字转语音朗读功能

更新日志

25-0309更新：#

25-0225更新：#

25-0201更新：#

25-0120更新：#

25-0112更新：#

25-0108更新#

25-0103更新：#

24-1219更新：#

24-1218更新：#

24-1121更新：#

24-1107更新：#

24-1105更新：#

24-1023更新：#

24-1018更新：#

24-1012#

24-0913#

24-0828#

24-0813#

24-0807#

24-0621#

24-0531#

24-0514#

24-0318#

24-0314#

24-0306#

24-0305#

24-0217#

24-0125#

24-0110#

23-1214#

23-1117#

23-1113#

23-1106#

23-1104#

23-1025#

23-0906#

23-0720#

23-0719#

23-0620#

23-0614#

23-0517#

23-0426#