新闻 发表于 2025-7-24 19:01

AI日报 | 2025年7月24日

作者:微信文章

AI日报
2025.7.24资讯速递
🧠 模型发布与结构创新

1. Meta 发布 MoE 大模型架构 LineFlow-2
新一代 Mixture-of-Experts 架构,采用流式激活路径调度,实现 token 粒度的专家动态路由,显著降低推理延迟。
🔹 采用异步专家选择器,兼容多模态
🔹 相比传统 MoE 模型推理速度提升 3.4 倍
🔹 支持 12B~180B 参数级别自适应缩放
🔗 https://ai.meta.com/blog/meta-lineflow-2-release/

2. Google 推出 Gemini Vision XL
专为高分辨率图像和视频设计的多模态模型,支持 32K 分辨率输入。
🔹 引入 Transformer + ConvNeXt 混合感知架构
🔹 图像 Caption、OCR 与物体跟踪任务精度超越 CLIP
🔹 已用于 Waymo 无人车系统内测
🔗 https://blog.google/ai/gemini-vision-xl-release/

3. Anthropic Claude 3.5 Pro 发布多模态 CoT
新版本内建图文共链式思维路径,在文生图与图推理中首次实现上下文一致性推演。
🔹 支持图片内容多轮反思生成
🔹 引入 Image Thought Tree 多模态逻辑链
🔹 开放 API 支持 SVG 模块级别结构化输出
🔗 https://www.anthropic.com/news/claude-35-multimodal-cot

4. OpenAI 微调 GPT-4o-128K 推理路径
GPT-4o 引入 Adaptive Routing Trees(ART),动态调度长上下文推理路径。
🔹 支持百万级 token 输入无性能劣化
🔹 提升长文档摘要与跨段推理能力
🔹 GPTs Store 已全面切换 ART 路由模式
🔗 https://openai.com/research/gpt4o-art-tree-update

5. DeepMind 发布 ReaLM 模型(Real World Language Model)
首个融合“世界建模+语言建模”的多模态推理模型。
🔹 可在 3D 模拟场景中执行语言驱动探索任务
🔹 强化学习融合图语言共模态记忆系统
🔹 被称为“语言领域中的 AlphaZero”
🔗 https://www.deepmind.com/blog/introducing-realm



🧪 推理技术与算力突破

6. Nvidia X-Tensor 推理引擎公测
新一代 GPU-aware 编译器,支持结构稀疏矩阵的动态图编译。
🔹 比 TensorRT 快 2.3 倍,延迟下降 45%
🔹 支持 Transformer block 内部 kernel inline 重写
🔹 已在 GPT-4、Gemini 上完成适配
🔗 https://developer.nvidia.com/blog/x-tensor-preview/

7. Cerebras 发布 Wafer-Scale AI Cluster-2
单芯片支持 1.2T token/s 推理能力,面向千亿参数推理集群。
🔹 全面替代传统 GPU 方式
🔹 支持并行分布式张量网格调度
🔹 每芯片内含 850,000 个核心
🔗 https://www.cerebras.net/news/cluster2-release/

8. 英特尔 Gaudi 3 微架构细节公开
针对 AI 高吞吐推理优化的新型神经加速芯片。
🔹 高速片上 interconnect 网络,低至 1us 延迟
🔹 支持 FP8、BF16、INT4 混合精度推理
🔹 目标挑战 Nvidia H100 数据中心市场
🔗 https://www.intel.com/content/www/us/en/newsroom/news/gaudi3-breakdown.html

9. Mistral 开源推理加速框架 JinaRT
轻量化 C++/Rust 混合框架,专注低延迟响应场景。
🔹 支持 ONNX、GGUF、LoRA 多模型兼容
🔹 兼容 iOS/NPU、小模型边缘部署
🔹 开发者社区一周内 Fork 破千
🔗 https://github.com/mistralai/jinart

10. 腾讯发布 AngelRT 神经网络即时推理引擎
融合“编译型 + 缓存图”机制,专为超长上下文设计。
🔹 跨语言异构执行器(Rust+CUDA+Java)
🔹 在 128K 上下文生成任务中延迟减少 62%
🔹 支持私有云 GPU 动态资源切片调度
🔗 https://cloud.tencent.com/product/angelrt



🧰 工具链与平台能力升级

11. HuggingFace Spaces 引入全局 Agent Graph 架构
Space 可定义多 Agent 模块,并以流程图形式串联执行。
🔹 首次支持 Agent 任务链并发调度
🔹 无需代码即可构建 Retrieval-Augmented Generation(RAG)流程
🔹 内建 300+ agent 模块组件
🔗 https://huggingface.co/spaces/agent-graph

12. LangChain 推出 LangGraph Cloud 版
全托管版多 Agent 协同系统上线,支持长时态任务与状态保存。
🔹 图计算思维构建复杂工作流
🔹 每个节点可挂接 LLM/函数/API
🔹 企业客户支持自定义状态缓存层
🔗 https://www.langchain.com/langgraph-cloud-release

13. Perplexity Dev Tools 全面升级
新增“多轮搜索管道编排”能力,正式开放 API 订阅。
🔹 支持搜索路径自动记录与提炼
🔹 可挂载自定义知识库优先级
🔹 搜索与 RAG 工作流融合一体化
🔗 https://docs.perplexity.ai/devtools-upgrade

14. OpenRouter 多模型一键部署平台上线
支持本地多模型热切换与优先级调度策略。
🔹 引入“LLM 路由策略 DSL”
🔹 可自定义 token 配额 + fallback 策略
🔹 同时支持 OpenAI、Anthropic、Mistral 等模型接入
🔗 https://openrouter.ai/blog/multi-llm-router

15. 清华发布 CogAgent:多模态 Agent 架构开源
支持文本、图像、知识图谱三模联动的 Agent 控制系统。
🔹 实现视觉问答、图文组合与图推理任务
🔹 引入动态图谱记忆调度模块
🔹 已接入通义千问作为基础模型引擎
🔗 https://github.com/THU-KEG/CogAgent
🌐 多模态、机器人与系统智能

16. Boston Dynamics 接入语音-行动-视觉三模 LLM 控制器
Spot 机器人现可通过自然语言控制完成复杂任务链。
🔹 引入三模态融合规划模块
🔹 支持“按语义划分动作流”操作
🔹 语音+图像结合精度达到 94.2%
🔗 https://www.bostondynamics.com/blog/spot-llm-update/

17. Meta 发布 RealAct 模拟交互环境
构建语言+视觉+行动闭环训练场景,用于多模态 Agent 微调。
🔹 支持动态人物、语义任务场景重构
🔹 用于训练“语言+图像+操作”型机器人智能体
🔹 RealAct 配套开放数据集与基准任务
🔗 https://ai.meta.com/datasets/realact/

18. xAI 推出 Grok-Agent 工业应用版
面向制造业与能源企业场景的 AI Agent 系统。
🔹 可接入 CAD、BOM 与传感数据
🔹 提供语义工单自动生成、故障预测分析
🔹 内部测试覆盖特斯拉自动化车间
🔗 https://x.ai/grok-agent-industrial



🧬 模型安全、数据治理与推理可信性

19. 微软发布 PromptGuard 推理审计组件
内嵌 LLM 防 Prompt Injection 与输出漂移模块。
🔹 可配置输出类型审查策略(如 PII、歧义)
🔹 对输入指令进行结构化语义拆解过滤
🔹 已整合进 Azure OpenAI 服务中
🔗 https://learn.microsoft.com/security/promptguard-overview

20. IBM 研究院开源 SafeLLM 评测框架
首次提供面向模型“安全性、稳定性、伦理性”的综合打分机制。
🔹 包括 37 个对抗攻击向量与偏见测试集
🔹 支持自定义评估维度权重
🔹 适配 HuggingFace 与本地模型部署流程
🔗 https://research.ibm.com/blog/safellm-framework

欢迎点赞收藏

持续关注每日AI前沿动态


- 立即扫码 -

重磅消息

你想赚钱吗?

你想获取一份丰厚的额外收入吗?

你想将手头现有资源变现吗?

赛凡智能云协作平台

现面向全国招募合作伙伴

平台稳|政策稳|产品稳|收益稳

抓住了就是机遇

赶快联系我们吧~

如何联系我们

1、文章底部写留言
如需获得更多招商相关信息,可直接点击文章底部“写留言”,留言方式为意向区域+联系方式,我们会在收到留言后的第一时间与您联系。

2、拨打客户服务热线
若您有意向,也可致电:010-8530-6624,我们精诚合作,互利共赢。

更多资讯,点击下方卡片关注赛凡智云协作平台


▲ 赛凡云盒,一款超好用的企业私有云盘
往期推荐阅读:

企业数据存储的几种方式

一键备份,本地内容轻松备份

企业该如何搭建私有云盘?

云盘的收费模式都有哪些?

企业云盘:外发资料如何管控?

页: [1]
查看完整版本: AI日报 | 2025年7月24日