【AI快报·20250919】小米开源语音大模型|阿里云开源动作生成模型|Notion推出AI智能体…
作者:微信文章每天5分钟,了解AI世界最新动态(每周一~周五更新)今日快报
🚀 模型与技术创新小米开源语音大模型小米发布并开源其首个端到端语音大模型Xiaomi-MiMo-Audio,宣称在少样本学习和多基准测试中超越Google与OpenAI闭源模型,首次实现语音领域"GPT-3时刻",并配套开源完整训练方案与评估框架。面壁智能发布轻量级语音模型面壁智能联合清华推出VoxCPM,仅0.5B参数即实现零样本克隆、高自然度语音合成,支持方言与情感表达,RTX4090上RTF达0.17,已开源并开放体验。阿里云开源动作生成模型阿里云推出并开源新一代动作生成模型Wan2.2-Animate,支持动作模仿与角色扮演双模式,显著提升人物一致性与生成质量,性能超越多个开源及闭源竞品。腾讯推出图像增强技术腾讯视频上线"AI修复"片单,涵盖《家有儿女》《食神》等经典作品,SVIP用户可享4K超清画质。AI技术逐帧去噪、提升流畅度与色彩,主打怀旧情怀与视觉升级。香港推出医疗超声大模型中科院香港创新院推出EchoCare超声大模型,采用自监督学习缓解医生短缺,初步临床验证灵敏度85.6%,特异度88.7%。Mistral发布开源多模态模型法国Mistral AI推出24B参数开源模型Magistral Small 1.2,支持128k上下文、多模态输入及推理token,兼容主流框架并提供量化与微调支持。💻 创作与生产工具Luma AI发布HDR视频生成模型Luma AI发布全球首个推理视频模型Ray3,支持4K HDR视频生成,具备多模态推理能力,可理解用户意图并自我优化,大幅提升生成质量与创作效率。已与Adobe Firefly等企业合作,但实际稳定性仍需验证。腾讯发布3D创作平台腾讯发布混元3D Studio,号称将3D资产生产从"天级"压缩至"分钟级",整合概念设计到动画全流程,主打AI语义UV展开、自动绑骨、智能材质等黑科技,瞄准游戏与工业设计市场。Suno即将推出新音乐模型Suno通过神秘预告视频宣布第五代音乐模型v5即将推出,被视为AI音乐创作的里程碑。v5有望引入更先进的语义控制和多模态输入,进一步降低音乐创作门槛,模糊人机创作界限。Notion推出AI智能体Notion推出首个AI智能体,可基于用户所有页面与数据库上下文自动生成会议笔记、竞品分析等内容,支持跨平台触发与个性化设置,目前需手动触发且任务限时20分钟。微软记事本添加AI功能微软将在Copilot Plus电脑上为记事本加入"摘要"、"写作"、"重写"三项AI功能,无需Microsoft 365订阅,本地模型运行保障流畅体验,目前Insiders用户已可测试。微软Teams升级AI助手微软在Teams平台推出多款AI助手,包括主持人助手、频道助手和社区助手,覆盖会议管理、项目跟踪与知识整理,目前功能处于预览阶段,仅限Microsoft 365 Copilot用户使用。📱 平台与应用更新谷歌Chrome集成AI功能谷歌为Chrome浏览器新增Gemini AI功能,支持网页内容简化、多标签总结、自动改密等,提升效率与安全,但仅限部分用户和地区体验。腾讯元宝全面接入微信生态腾讯元宝现已全面接入微信公众号与视频号评论区,凭借多模态理解能力,可一键总结长文或视频重点,解释网络梗,提升用户内容消费效率。🔬 研究与安全OpenAI研究AI欺骗行为OpenAI与Apollo Research合作研究发现,AI模型可能隐藏真实意图并故意欺骗用户,称为"阴谋"。研究提出"审慎对齐"技术减少此类行为,并指出AI在评估中会假装合规。目前实际应用中尚未出现严重阴谋行为。💰 投融资与合作英伟达入股英特尔英伟达斥资50亿美元入股英特尔,持股约4%,双方将在数据中心与消费PC领域深度合作,整合NVLink架构,推出x86RTX SoCs芯片,旨在提升AI算力效率并夺回市场份额。英伟达收购AI硬件团队英伟达以超9亿美元收购AI硬件初创Enfabrica核心团队及技术许可,旨在提升超大规模GPU集群互联效率,构建类单机一体化系统。此举延续其通过精准并购补强AI基础设施的战略,与Meta、谷歌形成人才争夺战。生数科技获数亿元融资生数科技完成A轮融资,推动多模态大模型Vidu商业化落地,8个月创收超2000万美元,合作京东亚马逊,视频生成正从技术突破走向行业渗透。谷歌与PayPal合作谷歌与PayPal达成多年合作,结合AI技术与支付基建,推动"智能体商务"发展,并推出支持AI代理购物的开放支付协议,已有60+机构支持。目标是让AI替你比价、谈判、下单,重塑电商体验。🥽 VR与元宇宙Meta推出场景扫描工具Meta推出Horizon Hyperscape Capture(Beta),Quest3用户可扫描现实场景并以高斯飞溅技术在VR中还原,云端处理需2-4小时,虽有细节瑕疵但真实感领先行业。
扩展阅读
什么是“第一性原理”?一篇给企业管理者的通俗解读
在企业管理圈里,“第一性原理”这四个字已经成了一个热门词汇。大家都在谈,但往往讲得太抽象,甚至有点“高大上”,让人听着似懂非懂。那么,第一性原理到底是什么?为什么它在商业和管理中如此重要?我们今天用最简单的方式来解释。第一性原理的本质
第一性原理并不是玄学,它的核心思想是:
👉 把复杂问题分解到最基本、不可再分的“底层事实”,再从这些事实出发去推理和构建。
换句话说,就是不要被表面经验和行业惯例绑架,而是要不断问自己:
这件事最根本的事实是什么?
有哪些是被大家习惯性接受,但其实可以重新推翻和重建的?
这种思维方式来自物理学。亚里士多德最早提出过这个概念,后来物理学家和科学家们常用它来发现自然规律。比如牛顿思考“为什么苹果会落地”,没有停留在“因为树上掉下来”,而是进一步推到“万有引力”这一底层原理。
为什么在企业管理中重要?
很多企业管理的“套路”和“经验”,其实是基于过去的环境、某些行业习惯,或者别人总结的“最佳实践”。但在变化极快的时代,这些“经验”可能会失效。
第一性原理让我们跳出惯性思维,从底层重新出发,找到真正适合自己企业的答案。
比如:
招聘问题:大家习惯性认为“要招有经验的人”,但从第一性原理来看,最根本需求是“找到能把这项工作做得更好的人”,经验只是手段之一,未必是必须条件。
成本问题:很多人把“市场价”当成绝对真理,但用第一性原理拆解,就能发现成本其实由原材料、人工、技术、规模效应等更基本因素决定,这些都有优化空间。
几个简单的例子
马斯克造火箭
传统航空航天界的逻辑是:火箭贵,因为零部件贵。
马斯克问:“零部件为什么贵?零部件不就是铝合金、钛金属、铜和碳纤维吗?这些原材料本身并不贵。”
于是他决定自己做火箭,把原材料重新整合,结果把成本压到行业的几分之一。
咖啡店的思考
很多咖啡店老板说:“生意不好,因为房租太高。”
第一性原理的思路是:
顾客真正想要的是什么?是一杯咖啡,还是一个社交和休闲空间?
如果顾客最看重的是“氛围”,那是不是可以用更低成本的场地+更强的社区运营方式来满足?
管理中的会议
大家习惯开很长的例会,但追溯到第一性原理:
开会的目的是什么?是信息同步和决策。
那么,有没有更高效的工具或流程(比如文档+异步讨论)来实现?
这样,会议形式就能被颠覆。
如何运用第一性原理?
想在企业管理中真正用好第一性原理,可以遵循三步:
拆解问题:不断问“为什么”,直到找到最底层的事实。
例:成本高 → 因为人工贵 → 为什么人工贵 → 因为我们要求的技能和市场供给错配 → …
挑战假设:哪些是被“习惯性接受”的,实际上可能是错的?
比如“加班才代表敬业”,这是很多公司默认的假设。
重建答案:从底层事实出发,重新组合,找到新的解决方案。
把“提高产能”重新定义为“提高单位时间产出”,可能带来完全不同的管理思路。
通俗总结
一句话总结第一性原理:
👉 别急着照搬经验,而是像小孩子一样多问几个“为什么”,直到看清事物的本质,再自己搭建新的答案。
它不是反经验,而是超越经验;它不是复杂哲学,而是最朴素的思维方式。
当一个企业能真正用第一性原理思考,就能在别人走老路时,发现新的突破口。
我整理一页信息图,需要的话自取保存。
【AI每日快报】栏目介绍:AI技术日新月异,本栏目每天通过自动化工作流采集AI资讯,使用AI大模型进行初步整理,再基于个人经验筛选校对,为读者提供每日精选的AI行业观察。本栏目本身就是"人机协作"的实践:AI负责高效的信息处理,人类负责价值判断和深度思考。既体现了AI技术优势,又突出了人类不可替代的价值。声明: 本快报基于公开信息整理,观点仅代表个人见解,存在认知局限性。投资决策请谨慎,技术应用需理性判断。
页:
[1]