【OpenAI推出Flex处理模式,以慢换便宜,瞄准非生产任务,适配o3和o4-mini】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-4-18 01:36

OpenAI推出Flex处理模式,以慢换便宜,瞄准非生产任务,适配o3和o4-mini

作者：微信文章

为了更积极地与谷歌等人工智能竞争对手展开竞争，OpenAI正在推出Flex处理模式，这是一种应用程序编程接口（API）选项，它以较慢的响应时间和“偶尔出现资源不可用的情况”为代价，提供更低的人工智能模型使用价格。

OpenAI表示，Flex处理模式目前处于测试阶段，适用于该公司最近发布的o3和o4-mini推理模型，其目标是用于优先级较低和“非生产性”的任务，例如模型评估、数据充实以及异步工作负载。

它将API成本整整降低了一半。对于o3模型，Flex处理模式的输入tokens价格为每百万个5美元（约75万个单词），输出tokens价格为每百万个20美元，而标准价格为输入tokens每百万个10美元，输出tokens每百万个40美元。对于o4-mini模型，Flex处理模式将价格从输入tokens每百万个1.10美元和输出tokens每百万个4.40美元，降低到了输入tokens每百万个0.55美元和输出tokens每百万个2.20美元。

Flex处理模式推出之际，前沿人工智能的价格持续攀升，同时其竞争对手也推出了更便宜、更高效且面向预算有限客户的模型。周四，谷歌推出了Gemini 2.5 Flash推理模型，该模型在性能上与DeepSeek的R1模型相当，甚至更优，且输入tokens成本更低。

在向客户发送的宣布推出Flex定价模式的电子邮件中，OpenAI还指出，处于其使用层级体系中1至3级的开发者，必须完成新引入的身份验证流程，才能使用o3模型。（层级由在OpenAI服务上的花费金额决定。）o3模型以及其他模型的推理摘要和流式API支持，也需要通过身份验证才能使用。

OpenAI此前曾表示，进行身份验证是为了阻止不良行为者违反其使用政策。
参考链接：https://techcrunch.com/2025/04/17/openai-launches-flex-processing-for-cheaper-slower-ai-tasks/—END—
http://mmbiz.qpic.cn/mmbiz_png/apQtCz7icLpaIuLuEDKfnjWdaxB19hrd0rMQ7bB5n8yG7fH1RelYqf1PpiagQibBnp1SQy3er8siaccFpJZQUFKpbA/640?wx_fmt=png&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1&retryload=3&tp=webp

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

OpenAI推出Flex处理模式,以慢换便宜,瞄准非生产任务,适配o3和o4-mini