国庆放长假,AI圈不休息,盘点一下国庆期间AI圈的大事儿
作者:微信文章国庆节长假马上就要结束了,一个八天的长假,不知道大家过得怎么样?希望没有被拥挤的人潮和车流影响出行的心情。在我们放假的这八天,科技行业最卷的AI圈显然没有休息,接下来我们就来盘点一下这些天都发生了些什么?
OpenAI发布Sora 2.0视频生成模型及Sora App上线:OpenAI于10月1日凌晨发布迄今最先进的视频生成模型Sora 2.0,同时推出同名社交应用“Sora”,用户可通过文本生成带声音的视频。Sora App上线两天内在美加地区iOS下载量达16.4万次,冲上美国App Store免费榜第三。
-- 点评:AI视频创作进入一个社交时代,让我们看看OpenAI的新玩法。
OpenAI推出GPT-5 Instant升级版:10月5日,OpenAI发布GPT-5模型升级版“GPT-5 Instant”,大幅加强了模型的共情理解和生成能力,可更温和地识别用户情绪并提供帮助。可以说,这一步让AI聊天更具“人味”,对话体验又进了一步。
-- 点评:这个对AI陪伴类应用不知道是福还是祸?不知道把GPT-5 Instant集成到企业服务机器人中是不是会有比人更好的效果?
OpenAI开放ChatGPT应用SDK:在10月7日的开发者大会上,OpenAI宣布向开发者开放ChatGPT平台,推出Apps SDK。开发者可以在ChatGPT内部直接构建完整的应用(含前端界面和后端逻辑),通过聊天方式调用外部数据和功能。
-- 点评: OpenAI从Plugin、到GPTS再到现在的Apps in ChatGPT,OpenAI开始逐渐了解生态玩法了。对于开发者来讲,显然不能错过这个新的流量机会。
OpenAI发布AgentKit智能体开发套件:同场发布的AgentKit是一套用于快速构建和部署AI智能体(Agent)的工具集。现场演示中,零售商Albertsons用它快速搭建商业分析智能体,在销量下降时自动分析历史趋势并给出建议。
-- 点评:今年是Agent爆发的一年,有生态野心的OpenAI开发一套智能体开发套件是必然的。
OpenAI升级Codex编码助手(GPT-5 Codex版):OpenAI宣布其AI编程助手Codex结束预览测试正式发布(GA),并由专为编程训练的全新GPT-5 Codex模型驱动。可以说,这意味着AI开始真正参与软件开发,自动化程度大幅提升,传统编程正在被重塑。
-- 点评:AI编程领域Claude是处于领先的,不知道GPT-5 CodeX能追上Claude Code吗?
Thinking Machines Lab推出Tinker微调工具:10月1日,由前OpenAI技术负责人Mira Murati领导的Thinking Machines Lab发布首个产品Tinker,一款自动化的AI模型微调工具。Tinker可帮助研究者和开发者轻松基于开源大模型(如Meta的LLaMA和阿里的Qwen)进行定制化训练。
-- 点评:Mira离职后创业的产品围绕开源微调,随着大模型能力的进一步增强,何时需要微调是所有AI应用团队的一个艰难的抉择。
微软推出Microsoft 365 Premium订阅:10月1日起,微软将个人版Copilot Pro整合进Office家族,推出每月$19.99的“Microsoft 365 Premium”订阅服务,包含Copilot聊天、图像生成、Researcher等AI功能。
-- 点评:AI在生产力工具领域的竞争日趋白热化,微软怎么可能放弃这个市场呢?对于一众创业公司,如何找细分和差异化仍旧是生存的核心。
NVIDIA与富士通达成AI基础设施合作:10月5日,英伟达宣布与日本富士通签署战略合作协议,将联合开发面向医疗、制造和机器人等领域的全栈AI基础设施。双方计划通过NVLink Fusion技术实现CPU/GPU高速互联,致力于2030年前完成晶片封装一体化,预计将能效提高两倍。值得注意的是,硬件巨头抱团攻克能耗和散热难题,有望加速下一代AI算力升级。
-- 点评:英伟达现在各种战略合作玩的飞起,全球第一股很会玩。
腾讯混元图像3.0问世并夺得LMArena冠军:10月5日,国际大模型竞技场LMArena最新榜单显示,腾讯于9月28日开源的混元图像3.0在26款模型的全球盲测中排名第一,被评为最佳综合文生图模型。
-- 点评:混元模型算是国庆节期间国内唯一上新闻的AI产品了,文生图模型卷到现在,就看谁的细节处理更好了。
谷歌推出Gemini 2.5 Compute Use: 在智能体时代,谷歌也在自己的Gemini 2.5模型中推出了利用API调用Compute Use的能力。开发者可以利用Gemini 2.5的API直接调用Compute Use工具实现界面操作,据说可以直接完成验证码的输入。Poke的测试说Gemini 2.5 Compute Use领先于其他的竞争对手。
-- 点评:大模型加上Compute Use或者Browser Use,这对传统的RPA企业会造成很大的影响。不过能让很多过去需要人机交互的场景用AI来彻底完成了。
总结
国庆节假期一共8天时间,不过这8天时间AI领域继续一贯的卷,各种大模型能力的进展让我们眼花缭乱。让我们看看接下来第四个季度AI会发展成什么样子吧。
页:
[1]