【AI周报|全球AI热点速览】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-7-3 15:48

AI周报|全球AI热点速览

作者：微信文章
一、上海交大AI智能体ML-Master登顶OpenAI MLE-bench，全球首创"探索-推理融合"范式2025年7月1日，上海交通大学人工智能学院Agents团队宣布，其研发的AI专家智能体"ML-Master"在OpenAI权威基准测试MLE-bench中夺冠，以29.3%的平均奖牌率大幅超越微软RD-Agent（22.4%）和OpenAI AIDE（16.9%），标志着中国在AI自主优化领域取得重大突破。

MLE-bench由75个真实Kaggle任务组成，模拟从数据准备到模型调参的全流程。ML-Master通过创新的"探索-推理深度融合"范式，结合蒙特卡洛树搜索的多轨迹探索、自适应记忆机制及可控推理技术，实现93.3%任务有效提交率，44.9%任务超越半数人类选手，仅需12小时完成测试，效率达基线两倍。尤其在复杂任务中，其中等难度奖牌率提升2.2倍，展现卓越泛化能力。
团队负责人介绍，ML-Master的突破验证了AI-for-AI（AI4AI）的技术潜力，其动态优化机制为AI系统自主演进提供了新范式。未来，该成果将集成至AI辅助学习与研究平台，并依托上海交大AI-X研究院构建跨领域智能体生态。二、百度发布AI视频神器MuseSteamer，电影级画质+极速生成颠覆行业2025年7月2日，百度在AI Day上重磅推出自研多模态大模型MuseSteamer及AI视频平台「绘想」，标志着视频创作正式迈入电影级AI时代。 MuseSteamer支持连续10秒动态视频生成，画质达电影级水准，具备音视一体化能力，可灵活控制场景、动作及镜头语言。平台提供多版本选择：Turbo版、Lite版、Pro版及有声版（支持音效与台词一体化生成），满足不同场景需求。

实测显示，MuseSteamer在人物、动漫及场景还原上表现优异，动作一致性强，镜头语言精准，支持写实、赛博朋克、动漫等多样化风格。技术上，其依托亿级视频数据库与三级优化体系，结合DiT架构与Flow Matching框架，实现高清画质与物理运动规律的精准建模，并支持一体化有声视频生成。目前，MuseSteamer优先服务B端广告主与内容创作者，大幅降低短剧、广告等制作成本，未来将向C端开放。百度此次布局，有望推动AI视频创作普惠化，引领行业变革。
三、智谱发布GLM-4.1V-Thinking系列模型，9B参数媲美72B大模型

2025年7月2日，智谱AI正式发布GLM-4.1V-Thinking系列多模态大模型，并率先开源GLM-4.1V-9B-Thinking版本。该模型通过引入课程采样强化学习（RLCS）策略，在多个复杂推理任务中实现能力突破，整体性能达到10B级别视觉语言模型的领先水平。

GLM-4.1V-9B-Thinking在18项权威评测中表现优异，可比肩甚至超越参数量高达72B的Qwen2.5-VL-72B。其核心能力包括视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等，广泛应用于多个领域。

该模型架构由视觉编码器、多层感知机适配器和语言解码器组成，采用AIMv2-Huge作为视觉编码器，GLM作为语言解码器，并引入三维卷积和双三次插值技术，提升处理效率和适应性。GLM-4.1V-Thinking的训练过程分为预训练、监督微调和强化学习三个阶段，特别构建了高质量的CoT训练集，强化模型的长篇因果推理能力。

智谱AI表示，GLM-4.1V-Thinking的发布标志着视觉大模型向高阶认知迈出了关键一步，未来将继续推动多模态大模型的研究与创新。

四、Meta成立超级智能实验室，挖角11位AI顶尖人才剑指Llama迭代

近日，Meta宣布正式成立「Meta超级智能实验室」，整合公司人工智能研究、基础设施及产品团队，由数据标注初创公司Scale AI前CEO Alexandr Wang担任首席人工智能官（CAIO），直接向CEO扎克伯格汇报。

扎克伯格在内部备忘录中表示，MSL将致力于开发Llama开源大模型及相关产品，并推进下一代模型的前沿研究，目标在未来一年内实现技术突破。他强调，发展超级智能是“人类新纪元的开端”，Meta将全力引领这一进程。

此次Meta从OpenAI、Anthropic、谷歌DeepMind等机构挖来11位顶尖人才，包括思维链强化学习技术开创者Trapit Bansal、GPT-4o语音模式共同创建者Shuchao Bi、谷歌Gemini预训练技术负责人Jack Rae等，涵盖模型开发、多模态系统、推理架构等关键领域。

Meta凭借Llama系列模型的亿级用户基础、强大的计算资源及智能眼镜等硬件布局，在AI领域具备独特优势。扎克伯格透露，团队仍在扩充，未来数周将有更多AI精英加入。消息公布后，Jack Rae等新成员已在社交媒体表达对项目的期待。

五、NLP泰斗Christopher Manning离开斯坦福加盟AIX Ventures担任合伙人

2025年7月3日，国际自然语言处理（NLP）领域权威、斯坦福大学教授Christopher Manning宣布离开学术界，正式加入硅谷风投公司AIX Ventures担任普通合伙人，专注投资深度AI初创企业。

Manning是深度学习应用于NLP的先驱，在词向量模型GloVe、注意力机制、机器翻译等领域贡献卓著，其著作《统计自然语言处理基础》是该领域经典教材。他在斯坦福执教二十余年，培养了陈丹琦、王孟秋等杰出人才，并曾任斯坦福AI实验室主任及以人为本AI研究所副主任。

AIX Ventures创始合伙人Shaun Johnson表示，Manning的加入将极大增强公司对AI技术趋势的判断力，"顶尖AI工程师都渴望与他合作"。Manning本人也在社交媒体确认这一消息，称期待与创业者共同解决AI难题并推动创新产品落地。

此次转型标志着Manning从学术研究向产业投资的跨越。凭借在NLP领域的深厚积累，他将为AIX Ventures提供关键技术洞察，助力早期AI项目发展。他的学术荣誉包括ACL/AAAI/ACM会士、IEEE冯诺伊曼奖等，论文引用量超28万次。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI周报|全球AI热点速览