数标标API

更新日志

24-1012

新增支持OpenAI最新的Realtime Endpoint以及4o-realtime预览版模型，现在可以和AI低延迟地实时通话了。（由于该模型api框架改动较大，仅在前沿站使用，有需要的客户请联系客服。预计一周内完全适配该模型）

新增支持的模型名称：

gpt-4o-realtime-preview-2024-10-01

24-0913

新增支持OpenAI最新的o1和o1 mini系列模型

新增支持的模型名称：

o1-preview
o1-preview-2024-09-12
o1-mini
o1-mini-2024-09-12

24-0828

新增支持 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827
Gemini API服务提供商从谷歌云Vertex AI平台迁移到Google AI平台，Gemini相关模型并发量大幅提升

24-0813

支持 chatgpt-4o-latest
24-0807
新增支持最新的GPT-4 Omni 0806版本，价格比初代4Omni降低一大半

新增支持模型名称：

gpt-4o-2024-08-06

24-0621

支持Anthropic最新发布的Claude 3.5 Sonnet，价格和Claude 3 Sonnet完全相同，但是A说它的能力和速度比C3Opus强，同样支持通过Messages原生API调用，也支持通过OpenAI Chat.Completions 兼容API调用。

claude-3-5-sonnet
claude-3-5-sonnet-20240620

24-0531

支持谷歌最新的Gemini 1.5，新增模型支持：

gemini-1.5-pro-001
gemini-1.5-flash-001

均支持Vision输入

注：

gemini-pro-vision 和 gemini-pro-vision 已指向 gemini-1.5-pro-001

24-0514

新增支持最新的GPT-4 Omni，OpenAI最先进的多模态模型。

新增支持模型名称：

gpt-4o

gpt-4o-2024-05-13

该模型目前和gpt-4-turbo一样，仅支持文字和图像混合推理+纯文本输出

输入输出的价格相较于gpt4t降低70%到50%，再加上GPT4o的分词器优化，实际相同字数下，GPT4o的Token会少一大半，因此调用成本大约和gpt3.5在一个数量级上。

参考：https://openai.com/index/hello-gpt-4o/

24-0318

修复OpenAI.Chat.Completions兼容接口中的Claude模型stop参数没有正确映射的问题

优化兼容接口中对于Claude的适配：

role=system的msg会被提取出来，放到API的system参数中再发过去

如果一个assistant的msg中包含图像，为了使其符合claude的msg api的校验规则，会在前面加一个占位的msg，从而将这个msg顶到user角色中，使其能正常带上图像内容而不报错

如果msg的长度为偶数，则现在不会再强制补成奇数，（一般情况下）此时末尾会是assistant，这样会触发原生的直接补全功能

24-0314

新增 Claude 3 Haiku （小杯）支持 claude-3-haiku | claude-3-haiku-20240307

特色：

同样支持图像/文字混合的多模态输入
价格和性能对标gpt-3.5-turbo
（Anthropic声称）Haiku的性能比3.5更加优秀（https://www.anthropic.com/news/claude-3-family
C3系列中最快最便宜的

24-0306

解决新的Anthropic接口的兼容性问题，包括：

网页/兼容API中的Cladue系列模型，因各个角色的对话顺序限制导致的请求错误

LobeChat中使用C3模型+图像输入时导致的错误

修复更新Vision相关代码后导致GPT4V接口异常的问题

24-0305

新增Anthropic最新的Claude3系列模型，C3全系多模态，支持图像输入，其中C3大杯（Opus）声称比GPT4还要强。

claude-3-opus C3 （大杯）

claude-3-sonnet C3 （中杯）

C3小杯等待发布

价格参考：https://www.anthropic.com/api#pricing

现可通过OpenAI的Chat.Completions接口，以GPT4V的标准输入和输出，也可以通过Anthropic官方的Messages接口格式使用。

24-0217

由于OpenAI官方已经将gpt-3.5-turbo滚动更新到0125，因此默认模型的计费也同步更新到0125了

24-0125

新增 gpt-4-0125-preview 和 gpt-4-turbo-preview ，其上下文窗口、参数和价格相对于1106均无变化（据说解决了懒惰的问题

新增第三代嵌入模型： text-embedding-3-small 和 text-embedding-3-large ，其中第三代嵌入模型对于第二代有如下变化

价格和ada v2不同，3代小号嵌入模型比ada v2便宜，大号比ada v2贵一点点
嵌入API现可选维度（dimesions）参数

总结：

总共新增如下模型名称

gpt-4-turbo-preview
gpt-4-0125-preview
text-embedding-3-small
text-embedding-3-large

受影响的API Endpoints:

Embeddings API: Add dimensions parameter support for embedding v3 models
Chat Completions API: 新增0125批次的GPT4 Turbo模型

参考：

https://platform.openai.com/docs/changelog/jan-25th-2024
https://openai.com/blog/new-embedding-models-and-api-updates

24-0110

移除了24-01-04弃用的模型，受影响的API和模型如下：

Completions:

text-davinci-003
text-davinci-002
text-ada-001
text-babbage-001
text-curie-001
Edits:
code-davinci-edit-001
text-davinci-edit-001

Embeddings:

text-search-ada-doc-001

参考链接：
https://platform.openai.com/docs/deprecations

23-1214

增集成谷歌最新的Gemini Pro系列模型推理服务

新增Google AI系列模型：

gemini-pro
gemini-pro-vision

现可通过本站提供的Chat/Completions API直接调用，其中Gemini Pro Vision是一个多模态的大模型，支持基于文字和图片混合推理，参数用法和OpenAI的GPT4v一致，支持流和非流，模型能力大约是3.5的水平，多模态推理能力差强人意（指大体上算令人满意），可以当作小GPT4v来玩。

23-1117

优化消费数据统计图表相关的查询性能
优化前端统计图表支出展示方式，改为直接展示各个时段的支出费用而不是代币数目，更加直观。
添加相关密钥到API调用的账单记录里。
新增日志数据批量导出支持，支持导出为JSON或者CSV文件

23-1113

放宽速率限制策略+降低400流控力度

23-1106

新的模型和API已经从今天中午开始陆续上线完毕

新增普通模型支持：

gpt-3.5-turbo-1106

新的GPT35模型
输入价格比老模型降低约1/3

老的 gpt-3.5-turbo 仍然指向旧版的35-0613，旧版没有降价所以 gpt-3.5-turbo 还是那个价格（可以考虑主动将默认模型重写到新款1106，打算征求一下群里的意见+看看新款稳不稳定再改。

dalle-e-3

OpenAI最新款的图像生成模型，效果也是非常不错，已经快要干翻Mj了，调用起来非常简单，推荐使用这个。

tts-1
tts-1-hd

OpenAI最新款的TTS语音转文本模型，效果也是非常棒，媲美真实人声，一个声音就原生支持多国语言，个人觉得效果比Azure的神经网络语音引擎还要牛x，对于语言学习类、AI对话交流类、AI朗读(听书、网页阅读)等方面的应用应该很有用。

新增GPT-4 Trubo模型支持：

gpt-4-1106-preview
gpt-4-vision-preview

优点：

速度飞快
超大上下文窗口 128k（其中输入最多124k，输出最多4k）
强大的多模态图像输入支持
新版的Tools工具调用支持，可一次调用多个函数
更低价格

新的预览版模型的请求频率限制较为严格，目前看上去是众生平等每个OpAI账号100RPD，本站总共只能提供大约几千到几万的RPD，虽说可用性没法保证，但是已经可以开始尝试接入并适配到自己的应用了。

还有需要注意的是 gpt-4-vision-preview 最好主动指定一下 max_tokens ，否则会生成几token就中止输出。

23-1104

将Anthropic模型（Claude2/ClaudeInstant1）添加到OpenAI ChatCompletions接口中

即现在可以通过 /v1/chat/completions 接口调用 claude-2 和 claude-instant-1 这两个模型了（OpAI接口的兼容性相比Anthropic原接口好一些，直接自定义一个模型名称就可以用了。）

同时将Anthropic模型费率从之前的1.2下调到1.1

23-1025

普通模型倍率下调为0.2
GPT4倍率下调为0.4

23-0906

新增gpt-4-32k模型（由Azure提供）

23-0720

新增CN2 GIA CDN加速，国内用户请求更稳定。

23-0719

计划内的网站维护，服务中断10min，迁移到高防高性能服务器。

23-0620

3.5模型限时1折

23-0614

同步OpenAI下调gpt-3.5-turbo模型的费用
新增gpt-3.5-turbo-0613
新增gpt-3.5-turbo-16k

23-0517

重构网站前端，优化聊天页面和充值页面
增加了密钥权限控制功能，精细控制每个密钥可以访问的模型

23-0426

上线网页文字转语音朗读功能

[updatedIn] 2 个月前