【AI前沿速递:人工智能最新动态(0604)】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-6-5 07:41

AI前沿速递:人工智能最新动态(0604)

作者：微信文章
ChatGPT 迎来史诗级升级！记忆功能全面开放，免费用户也能享受智能对话新体验

2025 年 6 月 3 日起，OpenAI 宣布向所有 ChatGPT 免费用户开放升级后的记忆功能。升级后，ChatGPT 可自动引用用户历史对话内容，例如根据用户偏好推荐印度菜或调整写作风格，使回复更连贯、个性化。免费用户获得轻量级版本，支持短期对话连续性；付费用户（Plus/Pro）则拥有长期记忆能力，可引用更久远的对话记录。此外，用户可在设置中灵活管理记忆，包括删除特定内容或启用 “临时聊天” 模式保护隐私。此次更新标志着 ChatGPT 从单次交互向持续陪伴的转变，为教育、客服等场景带来更智能的体验。

Win11 24H2 重磅更新！Win+C 一键唤醒 ChatGPT，AI 助手无缝融入系统！

微软在 Windows 11 24H2 版本中推出新功能，允许用户通过「设置 - 个性化」将 Win+C 快捷键自定义为启动 ChatGPT。该功能已随 2025 年 5 月可选更新 KB5058499 推送给部分用户，预计 6 月补丁更新中扩大测试范围。目前支持 Build 26100.4202 及以上版本系统，Copilot 键可绑定 ChatGPT、Copilot 或 Microsoft 365 Copilot，但暂不支持其他应用。这一变化延续了 Win+C 快捷键从 Windows 8 到 Win11 的功能迭代，标志着 AI 工具与操作系统的深度融合。

10 分钟生成 8 页专业 PPT！Manus AI 工具颠覆幻灯片制作效率

AI 初创公司 Manus 推出全新功能 Manus Slides，用户输入提示词后，10 分钟内即可生成 8 页结构化 PPT，支持导出至 Google Slides。该工具依托 AI 代理能力，自动规划大纲、优化排版，支持即时编辑和多格式导出，适用于商务会议、教育课程等场景。实测显示其生成内容专业且支持二次修改，但存在导出后页面显示不全的问题。这一功能显著降低创作门槛，助力跨领域用户提升效率，进一步巩固了 Manus 在 AI 市场的竞争力。
阿里通义开源空间音频模型 OmniAudio，让 360° 视频 “声” 临其境阿里巴巴通义实验室发布空间音频生成模型 OmniAudio，可直接从 360° 全景视频生成 FOA 格式空间音频，实现 “所见即所听” 的沉浸式体验。该模型基于超大规模数据集 Sphere360（含 10.3 万 + 视频片段、288 类音频事件）训练，采用 “流匹配” 和 “打码” 技术优化空间感知能力，在客观指标和主观评测中全面超越现有方法。OmniAudio 已开源，将推动 VR 游戏、影视制作、虚拟旅游等领域的音画融合创新。
腾讯开源跨端开发神器！ovCompose+KuiklyBase 打通鸿蒙、iOS、安卓，性能与效率双突破！

腾讯近日开源 ovCompose 跨平台框架及 KuiklyBase 基础库，前者基于 Compose Multiplatform 生态，解决鸿蒙支持缺失与 iOS 混排难题，采用 Skia 自绘实现安卓、iOS、鸿蒙三端高性能渲染；后者提供统一底层基建，优化鸿蒙编译链与 Kotlin Native 适配，已在腾讯视频、QQ 浏览器等 10 + 应用落地。两者结合实现 “一码多端”，开发效率显著提升，ovCompose 更在腾讯视频鸿蒙版完成全跨端应用首秀，助力开发者构建全场景应用。

智源研究院开源轻量级 Video-XL-2，单卡处理万帧视频革新视频理解

智源研究院联合上海交通大学等机构发布新一代超长视频理解模型 Video-XL-2，在轻量级架构下实现三大突破：支持单卡处理万帧级视频，编码 2048 帧仅需 12 秒；在 MLVU、VideoMME 等主流评测基准上超越所有同参数规模开源模型，性能逼近 720 亿参数大模型；采用四阶段渐进式训练与双粒度解码机制，显著降低显存占用与计算成本。该模型已开源，可广泛应用于影视内容分析、监控异常检测等场景，为长视频理解提供高效解决方案。

AI 编程神器 YouWare 横空出世！零代码创作 + 一键部署，普通人也能玩转网页开发

YouWare 推出 AI 驱动的「氛围编程」平台，用户无需代码基础，通过自然语言描述或上传设计稿，即可利用自研 AI Agent 生成网页代码，并通过 Sandbox 引擎实现 5 秒快速预览和一键上线。平台支持二次创作（Remix）、作品分享和积分激励体系（100 Knot 兑换 1 美元），已汇聚数十万创意项目，涵盖游戏、工具、教育等领域。上线两个月估值达 8000 万美元，日均处理数千任务，目标让编程像拍照一样普及。

Character.AI 推出 AvatarFX 黑科技！静态图片人物秒变活，开口说话、唱歌互动超真实！

近日，AI 公司 Character.AI 发布革命性工具 AvatarFX，基于先进扩散模型与音频条件化技术，能将静态图片转化为可说话、唱歌的动态视频角色。用户只需上传图片并选择语音，即可生成高精度唇形同步、表情自然的视频，支持多角色对话与长序列叙事，甚至可处理动物面孔。该技术已应用于教育、娱乐、影视等领域，同时内置内容审核机制保障安全。这一突破为虚拟内容创作带来无限可能，但也引发隐私伦理争议。

英伟达中国特供 B30 AI 芯片亮相：多 GPU 扩展技术突破，性能与价格如何平衡？

英伟达针对中国市场推出降规版 AI 芯片 B30，基于 Blackwell 架构，采用 GDDR7 显存，售价 6500-8000 美元，显著低于 H20 的 1 万 - 1.2 万美元。该芯片首度支持多 GPU 扩展，可能通过 ConnectX-8 SuperNICs 技术或调整后的 GB202 芯片实现集群搭建。此举是应对美国出口限制的策略调整，旨在维持中国市场份额，同时满足本土 AI 算力需求。尽管性能有所降级，但 B30 凭借成本优势和多卡互联能力，有望在国内 AI 领域占据一席之地。

400+AI 模型解锁网络搜索！Exa 与 OpenRouter 联手引爆 RAG 革命，重塑 AI 应用格局

Exa 与 OpenRouter 达成合作，将超过 400 个 AI 模型接入 OpenRouter 平台，结合 Exa 的搜索能力，实现 RAG（检索增强生成）技术的突破性升级。用户可通过统一 API 调用多模态模型，结合实时网络搜索结果生成内容，显著提升准确性与时效性。平台支持动态路由优化，自动匹配模型性能与成本需求，已在跨境电商翻译、智能客服等场景中实现效率提升。此举推动 RAG 从企业级应用向消费级市场渗透，为开发者提供低成本、高灵活性的 AI 解决方案，加速 AI 技术在垂直领域的落地。

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI前沿速递:人工智能最新动态(0604)