新闻 发表于 2025-4-18 01:36

OpenAI推出Flex处理模式,以慢换便宜,瞄准非生产任务,适配o3和o4-mini

作者:微信文章



为了更积极地与谷歌等人工智能竞争对手展开竞争,OpenAI正在推出Flex处理模式,这是一种应用程序编程接口(API)选项,它以较慢的响应时间和“偶尔出现资源不可用的情况”为代价,提供更低的人工智能模型使用价格。

OpenAI表示,Flex处理模式目前处于测试阶段,适用于该公司最近发布的o3和o4-mini推理模型,其目标是用于优先级较低和“非生产性”的任务,例如模型评估、数据充实以及异步工作负载。

它将API成本整整降低了一半。对于o3模型,Flex处理模式的输入tokens价格为每百万个5美元(约75万个单词),输出tokens价格为每百万个20美元,而标准价格为输入tokens每百万个10美元,输出tokens每百万个40美元。对于o4-mini模型,Flex处理模式将价格从输入tokens每百万个1.10美元和输出tokens每百万个4.40美元,降低到了输入tokens每百万个0.55美元和输出tokens每百万个2.20美元。

Flex处理模式推出之际,前沿人工智能的价格持续攀升,同时其竞争对手也推出了更便宜、更高效且面向预算有限客户的模型。周四,谷歌推出了Gemini 2.5 Flash推理模型,该模型在性能上与DeepSeek的R1模型相当,甚至更优,且输入tokens成本更低。

在向客户发送的宣布推出Flex定价模式的电子邮件中,OpenAI还指出,处于其使用层级体系中1至3级的开发者,必须完成新引入的身份验证流程,才能使用o3模型。(层级由在OpenAI服务上的花费金额决定。)o3模型以及其他模型的推理摘要和流式API支持,也需要通过身份验证才能使用。

OpenAI此前曾表示,进行身份验证是为了阻止不良行为者违反其使用政策。
参考链接:https://techcrunch.com/2025/04/17/openai-launches-flex-processing-for-cheaper-slower-ai-tasks/—END—
http://mmbiz.qpic.cn/mmbiz_png/apQtCz7icLpaIuLuEDKfnjWdaxB19hrd0rMQ7bB5n8yG7fH1RelYqf1PpiagQibBnp1SQy3er8siaccFpJZQUFKpbA/640?wx_fmt=png&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1&retryload=3&tp=webp
页: [1]
查看完整版本: OpenAI推出Flex处理模式,以慢换便宜,瞄准非生产任务,适配o3和o4-mini