数标标API
  1. 站点介绍
数标标API
  • 使用说明(必看)
  • 各软件配置教程
  • 人工客服
  • 站点介绍
    • 介绍
    • 更新日志
    • 稳定性保障
    • (旧)使用说明
  • 示例代码大全
    • Python使用文档
  • 模型接口
    • 模型(Models)
      • 列出模型
    • 聊天(Chat)
      • 文本模型
      • 多模态输入模型
    • 音频(Audio)
      • TTS-文本转语音
      • STT-语音转文本
      • STET-语音转英文文本
    • 图像(Images)
      • DALL·E
    • 嵌入(Embeddings)
      • 创建嵌入
    • 审查(Moderations)
      • 创建内容审核
  1. 站点介绍

更新日志

25-0309更新:#

grok系列模型已支持超高并发
grok-3
grok-3-r1

25-0225更新:#

新增支持Anthropic最新发布的C37S,新增模型如下:
claude-3-7-sonnet-latest
claude-3-7-sonnet-20250219

25-0201更新:#

新增支持OpenAI最新开放的闭源 o3-mini 系列API模型推理服务,新增如下模型支持
o3-mini
o3-mini-2025-01-31

25-0120更新:#

新增支持 deepseek-reasoner 模型

25-0112更新:#

新增支持o1正式版,新增支持模型名称如下:
o1
o1-2024-12-17

25-0108更新#

1.
新增支持DeepSeek系列模型
2.
添加 gemini-1.5-pro 模型

25-0103更新:#

新增cdn加速节点api2.shubiaobiao.com,该节点大幅度优化响应速度。经内部测试通过后,会正式部署到api域名。

24-1219更新:#

新增支持最新的24-1217版本的Realtime系列模型,新版的4o Realtime降价很多,mini的价格也是更加便宜,带上高命中率的缓存功能,价格已经到了还算能接受的程度了:
gpt-4o-realtime-preview-2024-12-17
gpt-4o-mini-realtime-preview
gpt-4o-mini-realtime-preview-2024-12-17

24-1218更新:#

新增最新的 gpt-4o-audio-preview-2024-12-17 模型支持,音频输入输出价格相较于原有的4oA1001下降很多。
关于最新发布的 o1 正式版,由于OAI并未全量开放,我这边看了一堆Tier5的号也没有发现有o1正式版API权限的,因此今天并没有接入,等待后续OAI开放。
Chat.Completions API新增支持 reasoning_effort 可选参数,可以调整o1系列模型思考时的“努力程度”,根据官方文档[1],这个参数仅对o1系列有意义。
“消费记录”部分新增支持缓存字段以及音频输入输出字段,现在可以在Next站的用量统计/消费记录中查询这些数据。
新的4o-realtime1217会在明天接入,今天新增一些这些字段的支持占用了一些时间。

24-1121更新:#

新增支持最新的 gpt-4o-2024-11-20 模型,价格和上个版本的24-0806没变化

24-1107更新:#

完善Claude系列模型在OpenAI兼容接口的Tools调用兼容性支持

24-1105更新:#

支持最新的Claude 3.5 Sonnet,新增如下模型名称:
claude-3-5-haiku
claude-3-5-haiku-latest
claude-3-5-haiku-20241022

24-1023更新:#

新增支持Anthropic最新的 claude-3-5-sonnet-20241022

24-1018更新:#

新增支持最新的 gpt-4o-audio-preview 系列模型,但是由于技术原因,暂时仅支支持该模型的非流调用,需要实时语音交互的用户请联系我们获取特殊的实时WebSocket端点接口

24-1012#

新增支持OpenAI最新的Realtime Endpoint以及4o-realtime预览版模型,现在可以和AI低延迟地实时通话了。(由于该模型api框架改动较大,仅在前沿站使用,有需要的客户请联系客服。预计一周内完全适配该模型)
新增支持的模型名称:
gpt-4o-realtime-preview-2024-10-01

24-0913#

新增支持OpenAI最新的o1和o1 mini系列模型
新增支持的模型名称:
o1-preview
o1-preview-2024-09-12
o1-mini
o1-mini-2024-09-12

24-0828#

新增支持 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827
Gemini API服务提供商从谷歌云Vertex AI平台迁移到Google AI平台,Gemini相关模型并发量大幅提升

24-0813#

支持 chatgpt-4o-latest

24-0807#

新增支持最新的GPT-4 Omni 0806版本,价格比初代4Omni降低一大半
新增支持模型名称:
gpt-4o-2024-08-06

24-0621#

支持Anthropic最新发布的Claude 3.5 Sonnet,价格和Claude 3 Sonnet完全相同,但是A说它的能力和速度比C3Opus强,同样支持通过Messages原生API调用,也支持通过OpenAI Chat.Completions 兼容API调用。
claude-3-5-sonnet
claude-3-5-sonnet-20240620

24-0531#

支持谷歌最新的Gemini 1.5,新增模型支持:
gemini-1.5-pro-001
gemini-1.5-flash-001
均支持Vision输入
注:
gemini-pro-vision 和 gemini-pro-vision 已指向 gemini-1.5-pro-001

24-0514#

新增支持最新的GPT-4 Omni,OpenAI最先进的多模态模型。
新增支持模型名称:
gpt-4o
gpt-4o-2024-05-13
该模型目前和gpt-4-turbo一样,仅支持文字和图像混合推理+纯文本输出
输入输出的价格相较于gpt4t降低70%到50%,再加上GPT4o的分词器优化,实际相同字数下,GPT4o的Token会少一大半,因此调用成本大约和gpt3.5在一个数量级上。
参考:https://openai.com/index/hello-gpt-4o/

24-0318#

修复OpenAI.Chat.Completions兼容接口中的Claude模型stop参数没有正确映射的问题
优化兼容接口中对于Claude的适配:
role=system的msg会被提取出来,放到API的system参数中再发过去
如果一个assistant的msg中包含图像,为了使其符合claude的msg api的校验规则,会在前面加一个占位的msg,从而将这个msg顶到user角色中,使其能正常带上图像内容而不报错
如果msg的长度为偶数,则现在不会再强制补成奇数,(一般情况下)此时末尾会是assistant,这样会触发原生的直接补全功能

24-0314#

新增 Claude 3 Haiku (小杯) 支持 claude-3-haiku | claude-3-haiku-20240307
特色:
同样支持图像/文字混合的多模态输入
价格和性能对标gpt-3.5-turbo
(Anthropic声称)Haiku的性能比3.5更加优秀(https://www.anthropic.com/news/claude-3-family
C3系列中最快最便宜的

24-0306#

解决新的Anthropic接口的兼容性问题,包括:
网页/兼容API中的Cladue系列模型,因各个角色的对话顺序限制导致的请求错误
LobeChat中使用C3模型+图像输入时导致的错误
修复更新Vision相关代码后导致GPT4V接口异常的问题

24-0305#

新增Anthropic最新的Claude3系列模型,C3全系多模态,支持图像输入,其中C3大杯(Opus)声称比GPT4还要强。
claude-3-opus C3 (大杯)
claude-3-sonnet C3 (中杯)
C3小杯等待发布
价格参考:https://www.anthropic.com/api#pricing
现可通过OpenAI的Chat.Completions接口,以GPT4V的标准输入和输出,也可以通过Anthropic官方的Messages接口格式使用。

24-0217#

由于OpenAI官方已经将gpt-3.5-turbo滚动更新到0125,因此默认模型的计费也同步更新到0125了

24-0125#

新增 gpt-4-0125-preview 和 gpt-4-turbo-preview ,其上下文窗口、参数和价格相对于1106均无变化(据说解决了懒惰的问题
新增第三代嵌入模型: text-embedding-3-small 和 text-embedding-3-large ,其中第三代嵌入模型对于第二代有如下变化
1.
价格和ada v2不同,3代小号嵌入模型比ada v2便宜,大号比ada v2贵一点点
2.
嵌入API现可选维度(dimesions)参数
总结:
总共新增如下模型名称
gpt-4-turbo-preview
gpt-4-0125-preview
text-embedding-3-small
text-embedding-3-large
受影响的API Endpoints:
Embeddings API: Add dimensions parameter support for embedding v3 models
Chat Completions API: 新增0125批次的GPT4 Turbo模型
参考:
https://platform.openai.com/docs/changelog/jan-25th-2024
https://openai.com/blog/new-embedding-models-and-api-updates

24-0110#

移除了24-01-04弃用的模型,受影响的API和模型如下:
Completions:
text-davinci-003
text-davinci-002
text-ada-001
text-babbage-001
text-curie-001
Edits:
code-davinci-edit-001
text-davinci-edit-001
Embeddings:
text-search-ada-doc-001
参考链接:
https://platform.openai.com/docs/deprecations

23-1214#

增集成谷歌最新的Gemini Pro系列模型推理服务
新增Google AI系列模型:
gemini-pro
gemini-pro-vision
现可通过本站提供的Chat/Completions API直接调用,其中Gemini Pro Vision是一个多模态的大模型,支持基于文字和图片混合推理,参数用法和OpenAI的GPT4v一致,支持流和非流,模型能力大约是3.5的水平,多模态推理能力差强人意(指大体上算令人满意),可以当作小GPT4v来玩。

23-1117#

优化消费数据统计图表相关的查询性能
优化前端统计图表支出展示方式,改为直接展示各个时段的支出费用而不是代币数目,更加直观。
添加相关密钥到API调用的账单记录里。
新增日志数据批量导出支持,支持导出为JSON或者CSV文件

23-1113#

放宽速率限制策略+降低400流控力度

23-1106#

新的模型和API已经从今天中午开始陆续上线完毕
新增普通模型支持:
gpt-3.5-turbo-1106
新的GPT35模型
输入价格比老模型降低约1/3
老的 gpt-3.5-turbo 仍然指向旧版的35-0613,旧版没有降价所以 gpt-3.5-turbo 还是那个价格(可以考虑主动将默认模型重写到新款1106,打算征求一下群里的意见+看看新款稳不稳定再改。
dalle-e-3
OpenAI最新款的图像生成模型,效果也是非常不错,已经快要干翻Mj了,调用起来非常简单,推荐使用这个。
tts-1
tts-1-hd
OpenAI最新款的TTS语音转文本模型,效果也是非常棒,媲美真实人声,一个声音就原生支持多国语言,个人觉得效果比Azure的神经网络语音引擎还要牛x,对于语言学习类、AI对话交流类、AI朗读(听书、网页阅读)等方面的应用应该很有用。
新增GPT-4 Trubo模型支持:
gpt-4-1106-preview
gpt-4-vision-preview
优点:
速度飞快
超大上下文窗口 128k(其中输入最多124k,输出最多4k)
强大的多模态图像输入支持
新版的Tools工具调用支持,可一次调用多个函数
更低价格
新的预览版模型的请求频率限制较为严格,目前看上去是众生平等每个OpAI账号100RPD,本站总共只能提供大约几千到几万的RPD,虽说可用性没法保证,但是已经可以开始尝试接入并适配到自己的应用了。
还有需要注意的是 gpt-4-vision-preview 最好主动指定一下 max_tokens ,否则会生成几token就中止输出。

23-1104#

将Anthropic模型(Claude2/ClaudeInstant1)添加到OpenAI ChatCompletions接口中
即现在可以通过 /v1/chat/completions 接口调用 claude-2 和 claude-instant-1 这两个模型了(OpAI接口的兼容性相比Anthropic原接口好一些,直接自定义一个模型名称就可以用了。)
同时将Anthropic模型费率从之前的1.2下调到1.1

23-1025#

1.
普通模型倍率下调为0.2
2.
GPT4倍率下调为0.4

23-0906#

新增gpt-4-32k模型(由Azure提供)

23-0720#

新增CN2 GIA CDN加速,国内用户请求更稳定。

23-0719#

计划内的网站维护,服务中断10min,迁移到高防高性能服务器。

23-0620#

3.5模型限时1折

23-0614#

1.
同步OpenAI下调gpt-3.5-turbo模型的费用
2.
新增gpt-3.5-turbo-0613
3.
新增gpt-3.5-turbo-16k

23-0517#

1.
重构网站前端,优化聊天页面和充值页面
2.
增加了密钥权限控制功能,精细控制每个密钥可以访问的模型

23-0426#

上线网页文字转语音朗读功能
上一页
介绍
下一页
稳定性保障
Built with