我爱免费 发表于 2025-5-18 22:37

本周AI简报:AI正重塑企业竞争格局(2025.5.12-2025.5.18)

作者:微信文章
“AI正重塑企业竞争格局,关键在于如何整合AI而非是否取代人类。”



01
【国内】
深圳因科美公司发布AI音频引擎产品“DMC600”,可以轻松消除300多种不想要的杂音,比如咳嗽、敲键盘、敲桌子,甚至连翻书这种轻微的声音,都能够“一键消除”。

中信证券研报称,2025年有望成为AI应用落地的元年,AI Agent应用场景有望迎来快速爆发。管理软件或是AI Agent落地的最佳场景之一,具备长期行业积累的传统行业龙头公司具备显著优势。

腾讯混元图像2.0模型发布,其具有实时生图、超写实画质两大特点,生图速度达毫秒级,远超行业领先模型,改变了传统交互方式。图像生成质量高,避免了AIGC图像的“AI味”,真实感强、细节丰富。

MiniMax推出通用AI智能体平台MiniMax Agent,能高效便捷地处理多种任务,如生成音频、市场研究、文档验证、旅行规划、社交媒体分析、专利识别、投资策略分析以及创意内容创作等。用户仅需输入任务描述,平台会根据任务类型提供相应解决方案。



问小白推出“学术搜索”功能,基于谷歌学术数据库,可检索海量权威文献。功能搭载DeepSeek R1/V3、Qwen3等模型,具备智能检索能力,能将用户问题转化为中英检索词,提高检索质量。
https://mmecoa.qpic.cn/mmecoa_png/clbHvhtD6Lbw7Bb7QianLTIErLDOMyicRNPTIv8777Ph3w3pfS0bDPky6ic4zicfMF5ibNxSploxjynfOcx6QBp0D7A/640?wx_fmt=png&tp=webp&wxfrom=10005&wx_lazy=1

Manus推出图像生成Agent功能。如上传产品照片,Manus能依据市场趋势设计新茶饮品牌,创建上市计划,制作吸引人的在线销售列表和网站。可调用多种工具协同工作。

MiniMax发布TTS系统 MiniMax Speech 02,具有强大的泛化能力,可驾驭32语种、不同口音、情绪的人声,核心创新在于内在的Zero-Shot能力,通过“会学习的音色提取器”与AR Transformer协同,实现任意语言、口音、音色的无限组合。

通义万相VACE开源,支持480P和720P分辨率,可一站式完成文生视频、图像参考生成、局部编辑与视频扩展等任务,无需频繁切换工具。核心技术是多模态输入机制,集文本、图像、视频、Mask和控制信号于一体,支持多种单任务能力自由组合。

阶跃星辰开源3D大模型Step1X-3D,总参数量达4.8B,由几何模块1.3B和纹理模块3.5B组成。模型基于超500万原始数据筛选出200万高质量样本训练,采用3D原生两阶段架构,解耦几何与纹理表征,生成高保真、可控的3D内容。

Qwen推出智能助理系统Deep Research(深入研究),系统可规划复杂研究任务,结合互联网海量信息,多步骤搜索分析总结,十几分钟生成详尽报告,附清晰引用来源。基于Qwen模型,融合多种能力,实现研究闭环。

Manus全面开放,用户无需等待即可注册,每天可免费执行一项任务。另外还推出每月19美元、39美元或199美元的付费订阅计划,提供额外权限、功能及优先服务。

全球首个专业设计Agent——Lovart发布,仅需一句话即可完成从创意拆解到专业交付的整个视觉流程,单次可执行上百步,最多产出40张设计成品图;图像、视频、音乐自由调度,集成多种前沿AI模型。Lovart的出现标志着AI在设计领域从“图像生成器”向“设计执行官”的转变。

昆仑万维开源Matrix-Game大模型,是工业界首个开源的10B+空间智能大模型,专为游戏世界建模的交互式世界基础模型。具备细粒度用户交互控制、高保真视觉与物理一致性、多场景泛化能力等优势,在Minecraft世界生成任务上全面超越现有开源基线模型。

QwenChat上线网页开发功能,用户只需输入一句自然语言指令,可生成结构清晰、风格美观的网站页面代码,支持直接预览。


Kimi 与小红书达合作,用户可通过小红书官方账号进入Kimi对话,并一键生成笔记。此次合作是Kimi拓展流量的尝试,也是小红书利用AI提升体验的探索。


快手推出AI作图工具Poify,帮助商家和创意工作者快速生成高质量图片内容。Poify具备AI模特试衣、换背景影棚风格、局部重绘等功能,支持文生图和图生图,能生成奇幻场景。商家可上传衣服原图并设置尺寸,快速生成模特试衣图。

智谱清言推出新功能,用户可以在清言App内直接上传微信文件,享受便捷的文件管理和溯源功能。另外智能体社区上线,为用户打造了一个交流平台,可以轻松发帖,与创作者直接对话,分享使用心得。

字节开源的8B规模代码模型系列Seed-Coder,适用于代码补全、指令遵循和复杂推理任务。模型采用“模型中心”数据处理方式,通过自身生成和筛选高质量数据,减少人工预处理工作量,上下文长度达32K,性能在同等规模开源模型中领先。





02
【国际】研究表明AI能独立自发组成社会。伦敦大学的科学家将目前全球流行的AI大型语言模型置于一个去中心化的交流环境中,模拟人类社会的群体互动场景。实验中,AI模型被分成不同规模的小组,每组从24个到200个不等。沙特宣布政府支持成立AI公司Humain,并规划未来五年投资100亿美元,部署500兆瓦AI算力。AI 教父辛顿:医疗保健对 AI 的需求无限,未来每个人都有私人医生。诺奖得主斯宾塞:开源大模型越来越多,中美AI差距迅速缩小。2025年人形机器人行业迎来“爆单潮”,乐聚机器人一季度订单增长200%,预计全年交付量达千台;宇树、松延动力等企业也面临订单激增。工业、科研和商业服务成为主要应用场景,但供应链管理和交付能力成为挑战。OpenAI最新研究揭示:AI推理能力与资金投入呈正比,投入越多性能越强。OpenAI首席经济学家强调,AI正重塑企业竞争格局,关键在于如何整合AI而非是否取代人类。这场技术革命将深刻影响经济和社会结构。Windsurf推出专为软件工程设计的AI模型系列:SWE-1、SWE-1-lite和SWE-1-mini。其涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率和用户体验。OpenAI推出GPT-4.1模型,其GPT-4.1擅长编程任务,能精确遵循指令,避免冗长输出,相比GPT-4o效率更高、输出更稳定,整体性能更优。
DeepMind推出AlphaEvolve,能发明新算法、改进芯片设计、解疑难数学题。其结合了大型语言模型的创造性与自动化评估器的验证能力,通过进化框架改进最有潜力的想法。


Notion推出AI会议笔记工具AI Meeting Notes,可转录会议内容并提供讨论要点摘要,用户还能在转录时做笔记。

美国商务部废除拜登签署的《AI扩散规则》,并加强对全球芯片出口管制。规则原定于2025年5月15日生效,但被认为会扼杀美国创新并损害外交关系。与此同时,美国商务部发布新规,禁止全球使用华为昇腾AI芯片,并警告使用美国AI芯片训练和干扰中国人工智能模型的潜在后果。

维基百科公布新 AI 战略:利用 AI 提升志愿者时间利用效率,而非取代人工。该战略通过AI自动化繁琐任务,如为版主和巡查员提供辅助工作流支持,提高信息可发现性,自动翻译和改编内容,以及扩大新志愿者入职培训规模。
页: [1]
查看完整版本: 本周AI简报:AI正重塑企业竞争格局(2025.5.12-2025.5.18)