AI前沿速递:人工智能最新动态(0604)
作者:微信文章ChatGPT 迎来史诗级升级!记忆功能全面开放,免费用户也能享受智能对话新体验
2025 年 6 月 3 日起,OpenAI 宣布向所有 ChatGPT 免费用户开放升级后的记忆功能。升级后,ChatGPT 可自动引用用户历史对话内容,例如根据用户偏好推荐印度菜或调整写作风格,使回复更连贯、个性化。免费用户获得轻量级版本,支持短期对话连续性;付费用户(Plus/Pro)则拥有长期记忆能力,可引用更久远的对话记录。此外,用户可在设置中灵活管理记忆,包括删除特定内容或启用 “临时聊天” 模式保护隐私。此次更新标志着 ChatGPT 从单次交互向持续陪伴的转变,为教育、客服等场景带来更智能的体验。
Win11 24H2 重磅更新!Win+C 一键唤醒 ChatGPT,AI 助手无缝融入系统!
微软在 Windows 11 24H2 版本中推出新功能,允许用户通过「设置 - 个性化」将 Win+C 快捷键自定义为启动 ChatGPT。该功能已随 2025 年 5 月可选更新 KB5058499 推送给部分用户,预计 6 月补丁更新中扩大测试范围。目前支持 Build 26100.4202 及以上版本系统,Copilot 键可绑定 ChatGPT、Copilot 或 Microsoft 365 Copilot,但暂不支持其他应用。这一变化延续了 Win+C 快捷键从 Windows 8 到 Win11 的功能迭代,标志着 AI 工具与操作系统的深度融合。
10 分钟生成 8 页专业 PPT!Manus AI 工具颠覆幻灯片制作效率
AI 初创公司 Manus 推出全新功能 Manus Slides,用户输入提示词后,10 分钟内即可生成 8 页结构化 PPT,支持导出至 Google Slides。该工具依托 AI 代理能力,自动规划大纲、优化排版,支持即时编辑和多格式导出,适用于商务会议、教育课程等场景。实测显示其生成内容专业且支持二次修改,但存在导出后页面显示不全的问题。这一功能显著降低创作门槛,助力跨领域用户提升效率,进一步巩固了 Manus 在 AI 市场的竞争力。
阿里通义开源空间音频模型 OmniAudio,让 360° 视频 “声” 临其境阿里巴巴通义实验室发布空间音频生成模型 OmniAudio,可直接从 360° 全景视频生成 FOA 格式空间音频,实现 “所见即所听” 的沉浸式体验。该模型基于超大规模数据集 Sphere360(含 10.3 万 + 视频片段、288 类音频事件)训练,采用 “流匹配” 和 “打码” 技术优化空间感知能力,在客观指标和主观评测中全面超越现有方法。OmniAudio 已开源,将推动 VR 游戏、影视制作、虚拟旅游等领域的音画融合创新。
腾讯开源跨端开发神器!ovCompose+KuiklyBase 打通鸿蒙、iOS、安卓,性能与效率双突破!
腾讯近日开源 ovCompose 跨平台框架及 KuiklyBase 基础库,前者基于 Compose Multiplatform 生态,解决鸿蒙支持缺失与 iOS 混排难题,采用 Skia 自绘实现安卓、iOS、鸿蒙三端高性能渲染;后者提供统一底层基建,优化鸿蒙编译链与 Kotlin Native 适配,已在腾讯视频、QQ 浏览器等 10 + 应用落地。两者结合实现 “一码多端”,开发效率显著提升,ovCompose 更在腾讯视频鸿蒙版完成全跨端应用首秀,助力开发者构建全场景应用。
智源研究院开源轻量级 Video-XL-2,单卡处理万帧视频革新视频理解
智源研究院联合上海交通大学等机构发布新一代超长视频理解模型 Video-XL-2,在轻量级架构下实现三大突破:支持单卡处理万帧级视频,编码 2048 帧仅需 12 秒;在 MLVU、VideoMME 等主流评测基准上超越所有同参数规模开源模型,性能逼近 720 亿参数大模型;采用四阶段渐进式训练与双粒度解码机制,显著降低显存占用与计算成本。该模型已开源,可广泛应用于影视内容分析、监控异常检测等场景,为长视频理解提供高效解决方案。
AI 编程神器 YouWare 横空出世!零代码创作 + 一键部署,普通人也能玩转网页开发
YouWare 推出 AI 驱动的「氛围编程」平台,用户无需代码基础,通过自然语言描述或上传设计稿,即可利用自研 AI Agent 生成网页代码,并通过 Sandbox 引擎实现 5 秒快速预览和一键上线。平台支持二次创作(Remix)、作品分享和积分激励体系(100 Knot 兑换 1 美元),已汇聚数十万创意项目,涵盖游戏、工具、教育等领域。上线两个月估值达 8000 万美元,日均处理数千任务,目标让编程像拍照一样普及。
Character.AI 推出 AvatarFX 黑科技!静态图片人物秒变活,开口说话、唱歌互动超真实!
近日,AI 公司 Character.AI 发布革命性工具 AvatarFX,基于先进扩散模型与音频条件化技术,能将静态图片转化为可说话、唱歌的动态视频角色。用户只需上传图片并选择语音,即可生成高精度唇形同步、表情自然的视频,支持多角色对话与长序列叙事,甚至可处理动物面孔。该技术已应用于教育、娱乐、影视等领域,同时内置内容审核机制保障安全。这一突破为虚拟内容创作带来无限可能,但也引发隐私伦理争议。
英伟达中国特供 B30 AI 芯片亮相:多 GPU 扩展技术突破,性能与价格如何平衡?
英伟达针对中国市场推出降规版 AI 芯片 B30,基于 Blackwell 架构,采用 GDDR7 显存,售价 6500-8000 美元,显著低于 H20 的 1 万 - 1.2 万美元。该芯片首度支持多 GPU 扩展,可能通过 ConnectX-8 SuperNICs 技术或调整后的 GB202 芯片实现集群搭建。此举是应对美国出口限制的策略调整,旨在维持中国市场份额,同时满足本土 AI 算力需求。尽管性能有所降级,但 B30 凭借成本优势和多卡互联能力,有望在国内 AI 领域占据一席之地。
400+AI 模型解锁网络搜索!Exa 与 OpenRouter 联手引爆 RAG 革命,重塑 AI 应用格局
Exa 与 OpenRouter 达成合作,将超过 400 个 AI 模型接入 OpenRouter 平台,结合 Exa 的搜索能力,实现 RAG(检索增强生成)技术的突破性升级。用户可通过统一 API 调用多模态模型,结合实时网络搜索结果生成内容,显著提升准确性与时效性。平台支持动态路由优化,自动匹配模型性能与成本需求,已在跨境电商翻译、智能客服等场景中实现效率提升。此举推动 RAG 从企业级应用向消费级市场渗透,为开发者提供低成本、高灵活性的 AI 解决方案,加速 AI 技术在垂直领域的落地。
页:
[1]