新闻 发表于 2025-12-16 22:46

AI资讯日报 2025/12/17 阿里推出Wan 2.6视频及图像模型

作者:微信文章
AI_INSIGHT_DAILY

AI资讯日报
2025/12/17

TODAY'S SUMMARY // 今日摘要

阿里Wan2.6模型支持角色扮演十五秒视频原生音画同步
英伟达发布Nemotron3系列Nano模型三十亿参数吞吐量提升四倍
ChatGPT上线分支聊天功能支持多线程对话避免信息遗漏
北大团队揭示LLM细致平衡现象通过势函数生成内容
DeepSeek与Qwen并列开源模型榜首超半数为中国团队
PRODUCT UPDATES // 产品与功能更新

1. 阿里通义万相💫再升级。
阿里推出Wan 2.6视频及图像模型(AI资讯),国内首个支持🚀角色扮演功能。单次视频可达**15秒**,原生音画同步且支持自定义音频(✧∀✧)。还新增分镜级控制、多人场景拍摄及**指令遵循能力大幅提升**,文生图精准捕捉风格细节,适用短剧制作。



2. 英伟达发布Nemotron 3系列。
Nemotron 3包含**Nano(300亿参数)**、Super及Ultra三款🔥开源模型,采用Mamba-Transformer混合MoE架构。Nemotron 3 Nano激活仅32亿参数(AI资讯),吞吐量比上代提升**4倍**,支持百万Token上下文(✧∀✧)。已在Hugging Face开放下载(AI资讯),附带3万亿Token训练数据集Taobao-MM及NeMo Gym强化学习库。

3. ChatGPT新增分支聊天功能。
OpenAI在iOS和Android端上线🎨分支对话功能,用户可创建多个并行对话分支,在原讨论基础上探索新方向(AI资讯)。该功能适合商业策略、创意写作等多线程场景(✧∀✧),避免线性对话中信息遗漏,提升💡整体互动性与创造力。



4. 快手KAT-Coder-Pro V1登顶榜单。
快手Agentic Coding模型KAT-Coder-Pro V1(AI资讯)在Artificial Analysis评测中拿下**64分**🚀,超越Claude4.5Sonnet进入总榜Top10。在非推理模型榜单中排名**第一**,Token消耗量远低于同性能模型,实现高性价比表现(✧∀✧)。

5. Gemini新增图片标记功能。
Google Gemini支持上传图片时🎨添加文字和画线标记,精准控制物体位置及修改内容。标记完成后自动去除所有标注(AI资讯),通用提示词为:"按照标记修改,删除标记",极大提升图像编辑💡精度。


RESEARCH // 前沿研究

1. 北大物理系揭示LLM动力学。
北京大学物理学院团队通过最小作用量原理(AI资讯)首次发现LLM生成中的**细致平衡现象**🔥。研究表明LLM通过隐式学习势函数而非规则集生成内容,其行为类似热力学平衡系统(✧∀✧)。Claude-4倾向快速收敛,GPT-5 Nano更愿探索状态空间,该理论将AI研究从"炼丹术"提升为💡可量化科学。

2. 哈佛分析Perplexity使用数据。
哈佛研究(AI资讯)基于数亿条查询显示,Perplexity用户**55%为个人使用**,30%专业场景。生产力/工作流占查询量**36%**🚀,学习研究占21%。用户随时间从简单任务转向复杂任务,提供真实Agent使用画像(✧∀✧)。

3. 斯坦福提出多模态DiffFusion框架。
新框架通过扩散模型实现恶劣天气下3D目标检测(AI资讯)🌧️。Diffusion-IR修复图像,PCR补偿LiDAR数据,BAFAM模块实现动态多模态融合及双向BEV对齐。在三大公开数据集��展现**最优鲁棒性**,零样本测试证明泛化能力(✧∀✧)。

4. Causal LLMs文本分类研究。
研究对比(AI资讯)嵌入式与指令式两种fine-tuning策略💡。嵌入式方法结合4-bit量化和LoRA,在单GPU上训练8B参数模型,F1分数显著优于指令式方法🚀。在专有数据集及WIPO-Alpha多标签任务中,性能甚至超越BERT等领域模型(✧∀✧)。

5. Google Cloud发布AlphaEvolve。
AlphaEvolve是Gemini驱动的编码Agent(AI资讯)🔥,专注高级算法设计。通过LLM提出代码修改建议,反馈循环进化算法效率💡。目前处于私有预览阶段,承诺提升代码质量。
INDUSTRY IMPACT // 行业展望与社会影响

1. OpenAI与Anthropic成立基金会。
两家公司联合Block在Linux Foundation下成立Agentic AI基金会(AI资讯)🚀,专注建立Agent互操作性标准。捐赠资金支持跨工具、跨仓库的安全可靠Agent生态,行业领袖对齐Agent互操作方向(✧∀✧)。

2. Stripe推出Agentic Commerce套件。
Stripe新服务(AI资讯)支持企业通过单一集成向多个AI Agent销售🎯。涵盖产品发现、Agent结账、支付及欺诈检测,可在Stripe Dashboard统一管理💡。AI原生商务基础设施正式商用,兼容现有商务栈(✧∀✧)。

3. 中国信通院上线CAIVD专业库。
工信部指导下,CAIVD人工智能安全漏洞库(AI资讯)正式运行🔒。该库是"1总库+5专业库"体系的第六个成员,专注AI产品漏洞收集与验证。建立产品提供者、厂商、科研机构与用户的🚀协作网络,规范漏洞发布渠道(✧∀✧)。访问地址:ai.nvdb.org.cn

4. 国产开源模型并列第一。
AI研究员Nathan Lambert发布的开源大模型榜单(AI资讯)显示,DeepSeek、Qwen及Kimi被评为影响力**并列第一**🏆。榜单涵盖35家机构,超半数为中国团队。DeepSeek R1超越顶级闭源模型,Qwen衍生数十款跨领域版本💡,Kimi推出全球首个万亿参数开源模型(✧∀✧)。



5. 前CIA官员重提远控工具。
前CIA官员Kiriakou在LADbible视频(AI资讯)中称情报机构可远控手机、电视和汽车🔒。Hacker News讨论指出这是对2017年Vault 7泄露的重述,并非新证据。评论质疑Kiriakou技术时效性及媒体炒作倾向💡,建议公众参考原始泄露文档而非个人陈述(✧∀✧)。
OPEN SOURCE // 开源TOP项目

1. ConvertX自托管文件转换器。
ConvertX(AI资讯)支持**1000+格式**💾转换,完全自托管部署。体积小巧,无需依赖第三方服务🚀,适合个人及企业搭建私有文件转换平台(✧∀✧)。已获**⭐11.2k**关注。

2. MDN Web Docs内容仓库。
MDN内容仓库(AI资讯)是MDN Web Docs官方源码库📚,收录**14000+页**HTML、CSS、JS、HTTP及Web API文档。开发者可直接贡献内容💡,已获**⭐10.2k**关注(✧∀✧)。

3. hashcards纯文本间隔重复系统。
hashcards(AI资讯)是基于纯文本的🎴间隔重复学习工具。无需复杂配置,支持Markdown格式卡片🚀,轻量级部署(✧∀✧)。已获**⭐629**关注。

4. SPEC-AGENTS规范驱动开发框架。
SPEC-AGENTS(AI资讯)是零配置的🛠️规范驱动开发工具。通过自然语言沟通,将开发分为不同阶段💡,支持多编程工具切换且不丢失进度。文档驱动工作流实现可追溯闭环,让普通用户享受成熟软件开发流程(✧∀✧)。

5. Nvidia收购SchedMD并开源。
Nvidia收购Slurm主力开发商SchedMD(AI资讯)🔥,承诺继续开源中立运营。Slurm是高性能计算和AI领域的**标杆**工作负载管理系统💡。同步发布Alpamayo-R1推理视觉模型及Cosmos世界模型宽松许可,布局物理AI生态(✧∀✧)。
SOCIAL MEDIA // 社媒分享

1. 阿里Agent化合订本观察。
社区讨论(AI资讯)指出蚂蚁系产品Agent化最积极🚀,因其工具属性重结果而非过程。淘宝Agent化需平衡"入口属性"广告收入💡,微信因依赖互动"使用过程"积极性较低(✧∀✧)。用户认为这不是战略克制,而是商业模式制约。

2. AI监督的自动化讽刺。
1983年论文(AI资讯)预言的自动化问题在AI Agent上应验🔥:技能退化、记忆提取困境、监控疲劳等。论文指出培训无法替代实战💡,AI犯错时人类难以保持警觉。最糟糕的是AI界面是"最差异常检测设计"(✧∀✧),洋洋洒洒文字中藏着致命错误。

3. Claude Code新确认机制。
用户分享(AI资讯)Claude Code新版本的确认机制交互体验舒适🎨。Agent执行前会展示详细操作预览,用户可逐项审核并确认💡,避免意外修改(✧∀✧)。



4. AGI讨论不应被视为科幻。
Reddit讨论(AI资讯)认为将AGI讨论归为科幻是"完全不严肃"🔥。即便持怀疑态度的专家也认为未来十到二十年可能实现AGI💡,这与时间旅行、火星人等真正科幻概念完全不同(✧∀✧)。


OTHERS VERSION // AI资讯日报多渠道版

🎙️ 小宇宙

来生小酒馆

>> 立即收听



📹 抖音

自媒体账号

>> 立即观看



>> 浏览网页版日报



[ DATA SHARD DETECTED ]

>_

访问网页版↗️

https://ai.hubtoday.app/

>_

阿里通义万相💫再升级。

https://www.xiaohu.ai/c/xiaohu-ai/wan-2-6

>_

英伟达发布Nemotron 3系列。

https://www.jiqizhixin.com/articles/2025-12-16-7

>_

英伟达发布Nemotron 3系列。

https://huggingface.co/nvidia

>_

ChatGPT新增分支聊天功能。

https://www.aibase.com/zh/news/23721

>_

快手KAT-Coder-Pro V1登顶榜单。

https://www.aibase.com/zh/news/23729

>_

Gemini新增图片标记功能。

https://m.okjike.com/originalPosts/6941226b36c01015fac9979b

>_

北大物理系揭示LLM动力学。

https://www.jiqizhixin.com/articles/2025-12-16-8

>_

哈佛分析Perplexity使用数据。

https://www.reddit.com/r/artificial/comments/1pnf368/its_been_a_big_week_for_agentic_ai_here_are_10/

>_

斯坦福提出多模态DiffFusion框架。

https://arxiv.org/abs/2512.13107

>_

Causal LLMs文本分类研究。

https://arxiv.org/abs/2512.12677

>_

中国信通院上线CAIVD专业库。

https://www.aibase.com/zh/news/23731

>_

国产开源模型并列第一。

https://www.aibase.com/zh/news/23705

>_

前CIA官员重提远控工具。

https://newshacker.me/story?id=46276875

>_

ConvertX自托管文件转换器。

https://github.com/C4illin/ConvertX

>_

MDN Web Docs内容仓库。

https://github.com/mdn/content

>_

hashcards纯文本间隔重复系统。

https://github.com/eudoxia0/hashcards

>_

SPEC-AGENTS规范驱动开发框架。

https://m.okjike.com/originalPosts/69412979d124ce959a40884a

>_

Nvidia收购SchedMD并开源。

https://www.aibase.com/zh/news/23722

>_

阿里Agent化合订本观察。

https://m.okjike.com/originalPosts/6941451728fa6ac7346dfd22

>_

AI监督的自动化讽刺。

https://x.com/dotey/status/2000796152921293156

>_

Claude Code新确认机制。

https://x.com/hongming731/status/2000727149750427898

>_

AGI讨论不应被视为科幻。

https://www.reddit.com/r/artificial/comments/1po1393/dismissing_discussion_of_agi_as_science_fiction/

AI INSIGHT DAILY2025.12.17

NEVER FADE AWAY
页: [1]
查看完整版本: AI资讯日报 2025/12/17 阿里推出Wan 2.6视频及图像模型