更新日志
24-1012
新增支持OpenAI最新的Realtime Endpoint以及4o-realtime预览版模型,现在可以和AI低延迟地实时通话了。(由于该模型api框架改动较大,仅在前沿站使用,有需要的客户请联系客服。预计一周内完全适配该模型)
新增支持的模型名称:
- gpt-4o-realtime-preview-2024-10-01
24-0913
- 新增支持OpenAI最新的o1和o1 mini系列模型
新增支持的模型名称:
- o1-preview
- o1-preview-2024-09-12
- o1-mini
- o1-mini-2024-09-12
24-0828
新增支持 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827
Gemini API服务提供商从谷歌云Vertex AI平台迁移到Google AI平台,Gemini相关模型并发量大幅提升
24-0813
- 支持 chatgpt-4o-latest
24-0807
新增支持最新的GPT-4 Omni 0806版本,价格比初代4Omni降低一大半
新增支持模型名称:
- gpt-4o-2024-08-06
24-0621
支持Anthropic最新发布的Claude 3.5 Sonnet,价格和Claude 3 Sonnet完全相同,但是A说它的能力和速度比C3Opus强,同样支持通过Messages原生API调用,也支持通过OpenAI Chat.Completions 兼容API调用。
claude-3-5-sonnet
claude-3-5-sonnet-20240620
24-0531
支持谷歌最新的Gemini 1.5,新增模型支持:
gemini-1.5-pro-001
gemini-1.5-flash-001
均支持Vision输入
注:
gemini-pro-vision 和 gemini-pro-vision 已指向 gemini-1.5-pro-001
24-0514
新增支持最新的GPT-4 Omni,OpenAI最先进的多模态模型。
新增支持模型名称:
gpt-4o
gpt-4o-2024-05-13
该模型目前和gpt-4-turbo一样,仅支持文字和图像混合推理+纯文本输出
输入输出的价格相较于gpt4t降低70%到50%,再加上GPT4o的分词器优化,实际相同字数下,GPT4o的Token会少一大半,因此调用成本大约和gpt3.5在一个数量级上。
参考:https://openai.com/index/hello-gpt-4o/
24-0318
修复OpenAI.Chat.Completions兼容接口中的Claude模型stop参数没有正确映射的问题
优化兼容接口中对于Claude的适配:
role=system的msg会被提取出来,放到API的system参数中再发过去
如果一个assistant的msg中包含图像,为了使其符合claude的msg api的校验规则,会在前面加一个占位的msg,从而将这个msg顶到user角色中,使其能正常带上图像内容而不报错
如果msg的长度为偶数,则现在不会再强制补成奇数,(一般情况下)此时末尾会是assistant,这样会触发原生的直接补全功能
24-0314
新增 Claude 3 Haiku (小杯) 支持 claude-3-haiku | claude-3-haiku-20240307
特色:
- 同样支持图像/文字混合的多模态输入
- 价格和性能对标gpt-3.5-turbo
- (Anthropic声称)Haiku的性能比3.5更加优秀(https://www.anthropic.com/news/claude-3-family
- C3系列中最快最便宜的
24-0306
解决新的Anthropic接口的兼容性问题,包括:
网页/兼容API中的Cladue系列模型,因各个角色的对话顺序限制导致的请求错误
LobeChat中使用C3模型+图像输入时导致的错误
修复更新Vision相关代码后导致GPT4V接口异常的问题
24-0305
新增Anthropic最新的Claude3系列模型,C3全系多模态,支持图像输入,其中C3大杯(Opus)声称比GPT4还要强。
claude-3-opus C3 (大杯)
claude-3-sonnet C3 (中杯)
C3小杯等待发布
价格参考:https://www.anthropic.com/api#pricing
现可通过OpenAI的Chat.Completions接口,以GPT4V的标准输入和输出,也可以通过Anthropic官方的Messages接口格式使用。
24-0217
由于OpenAI官方已经将gpt-3.5-turbo滚动更新到0125,因此默认模型的计费也同步更新到0125了
24-0125
新增 gpt-4-0125-preview 和 gpt-4-turbo-preview ,其上下文窗口、参数和价格相对于1106均无变化(据说解决了懒惰的问题
新增第三代嵌入模型: text-embedding-3-small 和 text-embedding-3-large ,其中第三代嵌入模型对于第二代有如下变化
- 价格和ada v2不同,3代小号嵌入模型比ada v2便宜,大号比ada v2贵一点点
- 嵌入API现可选维度(dimesions)参数
总结:
总共新增如下模型名称
- gpt-4-turbo-preview
- gpt-4-0125-preview
- text-embedding-3-small
- text-embedding-3-large
受影响的API Endpoints:
Embeddings API: Add dimensions parameter support for embedding v3 models
Chat Completions API: 新增0125批次的GPT4 Turbo模型
参考:
https://platform.openai.com/docs/changelog/jan-25th-2024
https://openai.com/blog/new-embedding-models-and-api-updates
24-0110
移除了24-01-04弃用的模型,受影响的API和模型如下:
Completions:
- text-davinci-003
- text-davinci-002
- text-ada-001
- text-babbage-001
- text-curie-001
- Edits:
- code-davinci-edit-001
- text-davinci-edit-001
Embeddings:
- text-search-ada-doc-001
参考链接:
https://platform.openai.com/docs/deprecations
23-1214
增集成谷歌最新的Gemini Pro系列模型推理服务
新增Google AI系列模型:
- gemini-pro
- gemini-pro-vision
现可通过本站提供的Chat/Completions API直接调用,其中Gemini Pro Vision是一个多模态的大模型,支持基于文字和图片混合推理,参数用法和OpenAI的GPT4v一致,支持流和非流,模型能力大约是3.5的水平,多模态推理能力差强人意(指大体上算令人满意),可以当作小GPT4v来玩。
23-1117
- 优化消费数据统计图表相关的查询性能
- 优化前端统计图表支出展示方式,改为直接展示各个时段的支出费用而不是代币数目,更加直观。
- 添加相关密钥到API调用的账单记录里。
- 新增日志数据批量导出支持,支持导出为JSON或者CSV文件
23-1113
放宽速率限制策略+降低400流控力度
23-1106
新的模型和API已经从今天中午开始陆续上线完毕
新增普通模型支持:
- gpt-3.5-turbo-1106
新的GPT35模型
输入价格比老模型降低约1/3
老的 gpt-3.5-turbo 仍然指向旧版的35-0613,旧版没有降价所以 gpt-3.5-turbo 还是那个价格(可以考虑主动将默认模型重写到新款1106,打算征求一下群里的意见+看看新款稳不稳定再改。
- dalle-e-3
OpenAI最新款的图像生成模型,效果也是非常不错,已经快要干翻Mj了,调用起来非常简单,推荐使用这个。
tts-1
tts-1-hd
OpenAI最新款的TTS语音转文本模型,效果也是非常棒,媲美真实人声,一个声音就原生支持多国语言,个人觉得效果比Azure的神经网络语音引擎还要牛x,对于语言学习类、AI对话交流类、AI朗读(听书、网页阅读)等方面的应用应该很有用。
新增GPT-4 Trubo模型支持:
gpt-4-1106-preview
gpt-4-vision-preview
优点:
- 速度飞快
- 超大上下文窗口 128k(其中输入最多124k,输出最多4k)
- 强大的多模态图像输入支持
- 新版的Tools工具调用支持,可一次调用多个函数
- 更低价格
新的预览版模型的请求频率限制较为严格,目前看上去是众生平等每个OpAI账号100RPD,本站总共只能提供大约几千到几万的RPD,虽说可用性没法保证,但是已经可以开始尝试接入并适配到自己的应用了。
还有需要注意的是 gpt-4-vision-preview 最好主动指定一下 max_tokens ,否则会生成几token就中止输出。
23-1104
将Anthropic模型(Claude2/ClaudeInstant1)添加到OpenAI ChatCompletions接口中
即现在可以通过 /v1/chat/completions 接口调用 claude-2 和 claude-instant-1 这两个模型了(OpAI接口的兼容性相比Anthropic原接口好一些,直接自定义一个模型名称就可以用了。)
同时将Anthropic模型费率从之前的1.2下调到1.1
23-1025
- 普通模型倍率下调为0.2
- GPT4倍率下调为0.4
23-0906
新增gpt-4-32k模型(由Azure提供)
23-0720
新增CN2 GIA CDN加速,国内用户请求更稳定。
23-0719
计划内的网站维护,服务中断10min,迁移到高防高性能服务器。
23-0620
3.5模型限时1折
23-0614
- 同步OpenAI下调gpt-3.5-turbo模型的费用
- 新增gpt-3.5-turbo-0613
- 新增gpt-3.5-turbo-16k
23-0517
- 重构网站前端,优化聊天页面和充值页面
- 增加了密钥权限控制功能,精细控制每个密钥可以访问的模型
23-0426
上线网页文字转语音朗读功能