【AI 日报】2025年6月11日|多模态爆发日!视频生成提速84倍,小鹏芯片挑战英伟达霸主
作者:微信文章⏰ 今日关键词:
视频生成加速 × 推理模型混战 × 进化搜索算法 × 国产AI芯片突围
📹 一、火山引擎发布豆包视频生成模型升级版
→ 无缝多镜头叙事+多动作运镜
全新豆包视频模型支持复杂场景多主体互动,人物动作自然连贯,多镜头切换时主体细节(如服饰、发饰)高度一致。基于DiT架构优化,新增变焦/环绕/平摇等专业运镜语言,可生成3D动画、国画、电影级等多种风格视频,适配电商营销、微短剧等场景。企业API调用成本低至0.015元/千tokens,5秒1080P视频仅需3.67元。
🇫🇷 二、Mistral推出首款推理模型Magistral
→ 专攻欧洲语言逻辑与数学编码
法国AI实验室Mistral发布Magistral系列,包含:
- Magistral Small:24B参数开源版(Apache 2.0许可)
- Magistral Medium:企业专供版,推理吞吐量达竞品10倍,支持阿拉伯语/俄语/中文等8种语言逻辑链
在AIME数学测试中准确率73.6%(较前代提升50%),但被指未与DeepSeek-R1最新版(87.5%)对比。
🚀 三、港大×英伟达革新图像生成技术
→ 高分辨率生成提速84倍!
GSPN(通用空间传播网络) 突破Transformer计算瓶颈:
✅ 二维线性传播:保留空间结构,计算复杂度降至√N级
✅ 实时生成16K图像:单卡支持电影级分辨率渲染
✅ 免位置嵌入:避免混叠失真,适配自动驾驶/医疗影像
在Stable Diffusion中替换自注意力层后,16K×8K图像生成速度提升84倍。
🧬 四、港科大×快手推出进化搜索算法
→ 小模型逆袭大模型!
EvoSearch技术模拟生物进化:
- 变异操作:在噪声层与去噪中间态注入可控扰动
- 适应度评估:动态筛选高质量样本繁衍子代
仅用1.3B参数视频模型Wan 1.3B+EvoSearch,生成质量超越14B参数的Wan 14B基准模型,打破“参数至上”铁律。
🚗 五、小鹏发布自研图灵AI芯片
→ 算力对标英伟达Thor
关键参数:
- 750 TOPS算力:单颗替代三颗Orin-X芯片
- 本地运行30B大模型:驱动智能座舱GPT-4级交互
- 双NPU+双ISP:黑夜/雨雾环境感知精度提升40%
计划Q2量产装车,减少对英伟达依赖,同步支持飞行汽车与机器人。
📸 六、百度网盘上线AI相机
→ 拍存管一体
集成OCR文字提取、多语言翻译、智能扫描等功能,可识别复杂光线场景(逆光/暗光)。用户拍摄文档后直接生成结构化报告,接入百度文库生态。
🍎 七、苹果开放Foundation Models框架
→ 免费调用端侧AI算力
开发者可在Xcode 26中:
🔧 调用iPhone/Mac本地模型运行大模型推理
🤖 集成ChatGPT API实现代码生成/文档自动编写
免云端API费用,加速AI功能嵌入App进程。
技术不死,进化不止!明天见~ 👋
页:
[1]