新闻 发表于 2025-6-11 03:06

OpenAI推出o3-pro并大幅降低o3价格【AI早报 2025-06-11】

作者:微信文章
AI早报 2025-06-11

目录

OpenAI推出新一代推理模型o3-pro并大幅降低o3价格Mistral AI发布首款推理模型Magistral苹果发布Apple Intelligence基础模型,并更新开发者工具XcodeGrok 3向Cline用户开放试用,xAI与Polymarket合作Meta成立新AI实验室,致力于追求“超级智能”豆包App推出多项AI新功能与模型科大讯飞宣布将于7月推出星火大模型X1升级版微软Edge浏览器增加AI历史记录搜索功能开源社区及其他产品动态
OpenAI推出新一代推理模型o3-pro并大幅降低o3价格


OpenAI发布增强版推理模型o3-pro并大幅降价现有o3模型。

OpenAI正式推出了新一代推理模型o3-pro,并宣布对现有o3模型进行大幅降价。o3-pro被描述为o3的增强版本,投入了更多计算资源以获得更好的响应质量。

在专家评估中,o3-pro在科学、教育、编程、数据分析和写作等领域表现优于o3,偏好率在64%至67%之间,并在博士级别问题和竞赛级代码基准测试中取得了79%至84%的通过率。该模型支持网页搜索、文件分析、视觉推理、Python使用和记忆功能,能够提供个性化响应。

o3-pro已向ChatGPT的Pro和Team用户以及API用户推出。其API定价为每百万输入token 20美元,每百万输出token 80美元,价格与Anthropic的Opus模型相当。早期用户反馈显示,o3-pro在获得大量上下文时表现尤为出色,能生成具体且有深度的计划和分析。

与此同时,OpenAI宣布将o3模型的API价格下调**80%**,调整后价格为每百万输入token 2美元,每百万输出token 8美元,使其成本低于GPT-4o。OpenAI CEO Sam Altman表示,期待降价后用户的新应用。此次降价已在Cursor等第三方应用中得到反映,Perplexity也宣布其Pro用户现在可以使用o3模型。

此外,OpenAI更新了评估框架Evals,增加了对工具使用的支持。开发者现在可以在评估运行时使用工具和结构化输出,并根据传递的参数和返回的响应评估工具调用。这一更新支持OpenAI托管、MCP和非托管的各类工具。

在业务方面,OpenAI计划增加使用Alphabet的Google云服务,以满足其日益增长的算力需求。该交易已于5月敲定,标志着OpenAI在主要支持者微软之外,进一步实现计算来源的多样化。

https://openai.com/blog/introducing-o3-pro
https://platform.openai.com/docs/models/o3-pro
Mistral AI发布首款推理模型Magistral


Mistral AI推出Magistral推理模型系列,包括Medium和Small版本,支持多语言和可审计推理。

法国AI初创公司Mistral AI发布了首款推理模型系列“Magistral”,旨在实现卓越的领域特定、透明和多语言推理能力。该系列包含两个不同规模的模型:Magistral Medium和Magistral Small。

Magistral Medium是一个通过API提供服务的大型闭源模型。用户可以通过Mistral的Le Chat平台中的“Thinking”选项体验,支持不使用工具的“Pure Thinking”模式以专注于数学和编码任务,并提供了一个由Cerebras支持的“10x speed”选项,能以十倍速度运行。

Magistral Small (Magistral-Small-2506) 是一个拥有240亿参数的开源权重模型,基于Apache 2.0许可证发布。该模型在Mistral Small 3.1的基础上,通过使用Magistral Medium的轨迹进行监督微调(SFT)和强化学习(RL)增强了推理能力。它支持包括中文、日语、韩语在内的数十种语言,拥有128k的上下文窗口,但官方建议最大模型长度设为40k以获得最佳性能。Magistral Small可在单张RTX 4090或配备32GB内存的MacBook上本地部署,Mistral官方还发布了GGUF格式版本,方便通过Ollama等工具运行。

在基准测试中,Magistral Medium和Magistral Small在AIME24、AIME25和GPQA Diamond等推理能力测试中表现出色。Mistral AI强调,这些模型提供可追溯的推理过程,每个结论都可追溯其逻辑步骤,为金融、法律、医疗等高风险环境提供可审计性。

https://mistral.ai/news/magistral
https://huggingface.co/mistralai/Magistral-Small-2506
苹果发布Apple Intelligence基础模型,并更新开发者工具Xcode


苹果在WWDC上介绍设备端和服务器基础模型家族,并深度集成AI功能到Xcode开发者工具。

苹果公司在2025年全球开发者大会(WWDC)上,详细介绍了为Apple Intelligence提供支持的设备端和服务器基础语言模型。这些模型旨在增强iOS、iPadOS、macOS等最新软件版本中的智能功能,并向开发者开放。

苹果发布的基础模型家族包括一个约30亿参数的设备端模型和一个基于服务器的混合专家(MoE)模型。设备端模型经过优化,可在Apple Silicon上高效运行,实现低延迟和最小资源占用。该模型被量化至2-bit,采用创新架构将模型分为两个深度比例为5:3的块,并共享部分键值(KV)缓存,从而减少了**37.5%**的KV缓存内存使用,显著改善了首次生成token的时间。服务器模型采用新颖的并行轨道混合专家(PT-MoE)架构,由多个称为“轨道”的小型transformer组成,能独立处理token,减少同步开销,在保证质量的同时实现高效扩展和低延迟。为支持更长上下文输入,模型设计了结合滑动窗口局部注意力和旋转位置嵌入(RoPE)的交错注意力架构。

在视觉能力方面,苹果开发了一个视觉编码器,服务器模型使用10亿参数的Vision Transformer (ViT-g),设备端则使用更高效的3亿参数ViTDet-L骨干网络,并加入创新的Register-Window (RW)机制,以同时捕捉局部细节和全局上下文。

同时,苹果发布了全新的开发者工具Xcode 26,深度集成AI功能。开发者可直接在Xcode中使用ChatGPT,或通过API密钥连接其他AI服务,甚至在Apple Silicon上本地运行模型。新版Xcode推出全新的Foundation Models框架,允许开发者访问设备端的30亿参数语言模型。该框架通过名为“引导式生成”(guided generation)的Swift方法,让开发者使用@Generable宏注解,直接通过Swift结构体或枚举进行约束解码,简化AI功能集成。此外,框架支持工具调用,开发者可创建工具为模型提供特定信息源或服务。Xcode 26还带来Swift 6.2编程语言的新特性,提升了性能和并发能力。

https://machinelearning.apple.com/research/apple-foundation-models-2025-updates
Grok 3向Cline用户开放试用,xAI与Polymarket合作


xAI为Cline用户提供Grok 3免费试用,并与Polymarket合作开发预测分析引擎。

xAI与AI代码工具开发商Cline合作,为Cline用户提供为期两周的Grok 3模型免费访问权限。用户只需注册Cline账户,即可在Cline的提供商中选择并免费使用grok-3模型进行编码。

另外,xAI宣布与预测市场平台Polymarket建立合作伙伴关系,旨在将市场预测与X平台的数据及Grok的分析能力相结合,打造一个“硬核真相引擎”,以揭示塑造世界的因素。
Meta成立新AI实验室,致力于追求“超级智能”


Meta组建新AI实验室专注超级智能,提供高额薪酬吸引顶尖研究人才。

Meta公司正在组建一个新的AI研究实验室,专注于追求“超级智能”(Superintelligence)。此举旨在加速公司在通用人工智能(AGI)领域的进展。

据报道,为吸引顶尖人才,Meta推动一项薪酬计划,为该实验室的关键研究人员提供高达九位数的薪酬方案。这个新实验室的成立,凸显了Meta在激烈的人工智能竞赛中追赶竞争对手的决心。公司希望通过整合资源和提供极具吸引力的薪酬,招揽和留住全球最顶尖的AI研究人才,以在构建更先进、更通用的AI系统方面取得突破。
豆包App推出多项AI新功能与模型


豆包App优化图像编辑功能并计划发布全新视频生成模型。

字节跳动旗下的豆包App近期升级了“一句话P图”功能,基于最新图像编辑模型SeedEdit 3.0进行了全面优化。升级后,用户可实现一键添加或替换文字、将图像风格迁移为油画或动漫等艺术风格,以及对画面局部进行修改,同时保持主体稳定。

此外,豆包宣布将于6月11日的2025 FORCE原动力大会上,正式发布全新的豆包·视频生成模型。该模型具备多项先进特性,包括通过高效模型结构和多模态位置编码技术支持无缝的多镜头叙事;能响应精细指令,生成包含多主体、多动作和复杂运镜的视频内容;在动态效果、画面结构和真实感方面表现出色,崩坏率更低,支持生成写实、动漫、影视等多种风格的高品质视频。
科大讯飞宣布将于7月推出星火大模型X1升级版


科大讯飞计划7月发布星火X1大模型升级版,优化智能应用能力。

科大讯飞董事长刘庆峰在公司成立26周年的内部讲话中透露,讯飞星火大模型X1的升级版计划于今年7月正式推出。

他表示,现有星火X1(420版)在今年的高考多科目测试中表现出色,证明了其在数学、代码、逻辑推理、文本生成等通用任务上的显著进步。刘庆峰提到,尽管星火X1的模型参数比业界同类产品小一个数量级,但其整体性能可与OpenAI的o1和DeepSeek的R1相媲美。即将推出的升级版预计在现有基础上进行更深层次优化和功能扩展,进一步提升智能应用能力。
微软Edge浏览器增加AI历史记录搜索功能


微软Edge新增本地AI历史记录搜索功能,支持模糊搜索并确保数据隐私。

微软在Microsoft Edge浏览器中增加了一项AI历史记录搜索功能。该功能利用本地AI模型读取和处理用户的浏览记录,以支持模糊搜索,帮助用户快速找到特定的历史访问页面。

微软强调,所有数据均在本地处理,不会发送到微软服务器,并且用户可以随时选择禁用此功能。
开源社区及其他产品动态


开源社区更新包括OpenWebUI新版本、夸克内测功能及Genspark发布AI浏览器。

OpenWebUI发布了v0.6.14版本,增加了多项功能,包括自动“跟进”建议、OpenAI兼容的嵌入端点、模型固定以便快速访问、Ollama模型的“think”参数支持,以及对Pinecone和矢量搜索的优化。

夸克正在内测名为“深度研究”的新功能,目前每天提供三次使用机会。

Genspark发布了一款专为Mac用户设计的AI浏览器,集成了AI自动化、广告拦截和多种在线工具。该浏览器内置“超级智能体”,可自动执行比价、内容摘要等任务,并计划很快推出Windows版本。

https://www.genspark.ai/browser

作者@橘鸦Juya,如果AI早报对你有所帮助,欢迎点赞、关注、分享。
页: [1]
查看完整版本: OpenAI推出o3-pro并大幅降低o3价格【AI早报 2025-06-11】