AI周报|全球AI热点速览
作者:微信文章一、上海交大AI智能体ML-Master登顶OpenAI MLE-bench,全球首创"探索-推理融合"范式2025年7月1日,上海交通大学人工智能学院Agents团队宣布,其研发的AI专家智能体"ML-Master"在OpenAI权威基准测试MLE-bench中夺冠,以29.3%的平均奖牌率大幅超越微软RD-Agent(22.4%)和OpenAI AIDE(16.9%),标志着中国在AI自主优化领域取得重大突破。
MLE-bench由75个真实Kaggle任务组成,模拟从数据准备到模型调参的全流程。ML-Master通过创新的"探索-推理深度融合"范式,结合蒙特卡洛树搜索的多轨迹探索、自适应记忆机制及可控推理技术,实现93.3%任务有效提交率,44.9%任务超越半数人类选手,仅需12小时完成测试,效率达基线两倍。尤其在复杂任务中,其中等难度奖牌率提升2.2倍,展现卓越泛化能力。
团队负责人介绍,ML-Master的突破验证了AI-for-AI(AI4AI)的技术潜力,其动态优化机制为AI系统自主演进提供了新范式。未来,该成果将集成至AI辅助学习与研究平台,并依托上海交大AI-X研究院构建跨领域智能体生态。 二、百度发布AI视频神器MuseSteamer,电影级画质+极速生成颠覆行业2025年7月2日,百度在AI Day上重磅推出自研多模态大模型MuseSteamer及AI视频平台「绘想」,标志着视频创作正式迈入电影级AI时代。 MuseSteamer支持连续10秒动态视频生成,画质达电影级水准,具备音视一体化能力,可灵活控制场景、动作及镜头语言。平台提供多版本选择:Turbo版、Lite版、Pro版及有声版(支持音效与台词一体化生成),满足不同场景需求。
实测显示,MuseSteamer在人物、动漫及场景还原上表现优异,动作一致性强,镜头语言精准,支持写实、赛博朋克、动漫等多样化风格。技术上,其依托亿级视频数据库与三级优化体系,结合DiT架构与Flow Matching框架,实现高清画质与物理运动规律的精准建模,并支持一体化有声视频生成。 目前,MuseSteamer优先服务B端广告主与内容创作者,大幅降低短剧、广告等制作成本,未来将向C端开放。百度此次布局,有望推动AI视频创作普惠化,引领行业变革。
三、智谱发布GLM-4.1V-Thinking系列模型,9B参数媲美72B大模型
2025年7月2日,智谱AI正式发布GLM-4.1V-Thinking系列多模态大模型,并率先开源GLM-4.1V-9B-Thinking版本。该模型通过引入课程采样强化学习(RLCS)策略,在多个复杂推理任务中实现能力突破,整体性能达到10B级别视觉语言模型的领先水平。
GLM-4.1V-9B-Thinking在18项权威评测中表现优异,可比肩甚至超越参数量高达72B的Qwen2.5-VL-72B。其核心能力包括视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等,广泛应用于多个领域。
该模型架构由视觉编码器、多层感知机适配器和语言解码器组成,采用AIMv2-Huge作为视觉编码器,GLM作为语言解码器,并引入三维卷积和双三次插值技术,提升处理效率和适应性。GLM-4.1V-Thinking的训练过程分为预训练、监督微调和强化学习三个阶段,特别构建了高质量的CoT训练集,强化模型的长篇因果推理能力。
智谱AI表示,GLM-4.1V-Thinking的发布标志着视觉大模型向高阶认知迈出了关键一步,未来将继续推动多模态大模型的研究与创新。
四、Meta成立超级智能实验室,挖角11位AI顶尖人才剑指Llama迭代
近日,Meta宣布正式成立「Meta超级智能实验室」,整合公司人工智能研究、基础设施及产品团队,由数据标注初创公司Scale AI前CEO Alexandr Wang担任首席人工智能官(CAIO),直接向CEO扎克伯格汇报。
扎克伯格在内部备忘录中表示,MSL将致力于开发Llama开源大模型及相关产品,并推进下一代模型的前沿研究,目标在未来一年内实现技术突破。他强调,发展超级智能是“人类新纪元的开端”,Meta将全力引领这一进程。
此次Meta从OpenAI、Anthropic、谷歌DeepMind等机构挖来11位顶尖人才,包括思维链强化学习技术开创者Trapit Bansal、GPT-4o语音模式共同创建者Shuchao Bi、谷歌Gemini预训练技术负责人Jack Rae等,涵盖模型开发、多模态系统、推理架构等关键领域。
Meta凭借Llama系列模型的亿级用户基础、强大的计算资源及智能眼镜等硬件布局,在AI领域具备独特优势。扎克伯格透露,团队仍在扩充,未来数周将有更多AI精英加入。消息公布后,Jack Rae等新成员已在社交媒体表达对项目的期待。
五、NLP泰斗Christopher Manning离开斯坦福 加盟AIX Ventures担任合伙人
2025年7月3日,国际自然语言处理(NLP)领域权威、斯坦福大学教授Christopher Manning宣布离开学术界,正式加入硅谷风投公司AIX Ventures担任普通合伙人,专注投资深度AI初创企业。
Manning是深度学习应用于NLP的先驱,在词向量模型GloVe、注意力机制、机器翻译等领域贡献卓著,其著作《统计自然语言处理基础》是该领域经典教材。他在斯坦福执教二十余年,培养了陈丹琦、王孟秋等杰出人才,并曾任斯坦福AI实验室主任及以人为本AI研究所副主任。
AIX Ventures创始合伙人Shaun Johnson表示,Manning的加入将极大增强公司对AI技术趋势的判断力,"顶尖AI工程师都渴望与他合作"。Manning本人也在社交媒体确认这一消息,称期待与创业者共同解决AI难题并推动创新产品落地。
此次转型标志着Manning从学术研究向产业投资的跨越。凭借在NLP领域的深厚积累,他将为AIX Ventures提供关键技术洞察,助力早期AI项目发展。他的学术荣誉包括ACL/AAAI/ACM会士、IEEE冯诺伊曼奖等,论文引用量超28万次。
页:
[1]