【25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航】萍聚社区-德国热线-德国实用信息网人工智能

多客科技 发表于 2025-6-7 00:40

25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航

作者：微信文章
25年06月07日，AI每日快讯，阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航

阿里巴巴6月6日开源Qwen3-Embedding向量模型，性能超谷歌OpenAI获SOTA ：阿里巴巴于6月6日正式开源基于千问3底座的Qwen3-Embedding向量模型系列，专为文本检索、排序等任务优化。该模型性能较前版提升超40%，在MTEB等榜单超越谷歌、OpenAI等顶尖模型，获SOTA最佳性能。Qwen3-Embedding支持超100种语言，含编程语言，具多语言检索能力。此次共开源9款不同尺寸模型，已在魔搭、Hugging Face等平台可用，并提供API服务。AMD收购AI初创公司Brium 聚焦优化AI推理打破Nvidia依赖：半导体巨头AMD近日宣布收购专注于AI软件优化的初创公司Brium，具体金额未公开。Brium致力于优化AI推理在多种硬件上的性能。AMD希望通过此举构建开放、高性能的AI软件生态系统，并解决AI软件高度依赖Nvidia硬件的现状，以增强自身在AI市场的竞争力。这是AMD在过去两年内的第四次战略收购，显示其正大力投资以推动开放源代码AI发展。OpenAI学院印度分院成立与IndiaAI合作普及AI技能：OpenAI于本周四与IndiaAI正式启动“OpenAI学院印度分院”，这是其教育平台首次国际落地。旨在向印度学生、开发者、教师、企业等群体普及AI技能。通过谅解备忘录，提供线上线下混合教学，贡献内容至印度平台，并在6城市办研讨会。计划包括为50家初创提供10万美元API积分、组织覆盖2.5万学生的黑客马拉松，以及培训100万教师使用生成式AI工具，加速本地AI创新。上海AI实验室发布机器人具身智能大脑VeBrain框架：上海人工智能实验室发布VeBrain具身智能大脑框架，旨在让机器人实现“看到-思考-行动”。该框架统一了感知、推理与控制，克服现有模型在物理交互上的短板。通过60万数据集训练，VeBrain在多模态、空间推理及机器人控制（如四足机器人任务提升50%）测试中表现出色，推动机器人与物理世界的交互。高德上线全链路AI导航智能体：结合智能眼镜开启AR导航新时代：高德地图于2025年4月14日推出全球首个地图AI导航智能体NaviAgent。该智能体采用“思考-预判-行动”模式，具备超视距感知能力。高德进一步将NaviAgent与智能眼镜及AR技术结合，提供AR导航、高阶HUD、空间感知等功能，带来全新出行体验。它能根据用户情绪互动，并实时预警风险。高德已与Rokid等伙伴合作，共建“AI+AR”导航新生态，旨在将导航升级为用户的智慧伙伴。智源发布RoboOS/RoboBrain 2.0：开源推动具身智能生态：2025北京智源大会上，北京智源人工智能研究院正式开源发布具身智能操作系统RoboOS 2.0和升级版大模型RoboBrain 2.0。RoboOS 2.0响应时延缩至3ms内，端云通信效率提升27倍，增强多机器人协作；RoboBrain 2.0任务规划准确率提升74%。两大平台均支持多本体协同，大幅降低开发门槛。智源已与全球20多家企业合作，共建开放协同的智能机器人生态。ElevenLabs发布AI语音模型Eleven v3 ：ElevenLabs 发布最新AI语音模型Eleven v3（Alpha版），号称最具表现力。支持70+语言，能处理复杂对话并精确控制情感。面向创作者与开发者，六月Alpha公测享80%优惠，API将开放。谷歌发布AI学习工具Portraits ：谷歌于2025年6月5日推出AI产品Portraits，提供与虚拟专家对话的个性化学习体验。首批专家教授沟通与领导力，用户可通过互动提升技能。目前仅限美国IP测试，未来计划全球推广，旨在用AI革新教育。英伟达发布Llama Nemotron Nano VL ：英伟达于2025年6月5日推出Llama Nemotron Nano VL视觉-语言模型，针对文档级图文理解。该模型基于Llama 3.1，处理多页文档，支持16K上下文。在表格、数据提取等文档任务表现出色，开放许可供商业使用。00后数学家洪乐潼创AI公司无产品估值3亿：00后数学家洪乐潼创立AI公司Axiom，专注于严谨数学证明AI。公司尚无产品，但已获3亿至5亿美元估值，计划融资5000万美元，目标对冲基金。市场高度认可创始人背景及垂直AI潜力。微软Athena AI智能体整合至Teams并开源，效率提升显著：微软于2025年6月4日宣布将AI智能体Athena整合至Teams应用，并已在GitHub开源。此举旨在优化团队协作与开发工作流程，提升效率。Athena能自动化处理代码审查、任务管理等，提供实时项目状态更新。微软内部测试显示，Athena已服务逾2000工程师，效率提升达30%，加速了交付周期。开源特性允许各规模团队定制，推动AI技术创新。蚂蚁国际发布AI金融平台Alipay+ GenAI Cockpit ：蚂蚁国际推出AI金融平台“Alipay+ GenAI Cockpit”，作为AI即服务，旨在助金融科技公司构建AI代理和原生金融服务。平台整合支付、合规、风控等流程，基于超20个大模型。预计2025年6月起在东南亚、南亚向外部客户部署，推动金融业进入AI原生新阶段。智源大会发布悟界系列大模型：在第七届北京智源大会上，智源研究院重磅发布了“悟界”系列大模型。这批模型涵盖原生多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能框架RoboOS/RoboBrain以及微观生命模型OpenComplex2等。此举标志着人工智能领域的技术新进展，旨在推动AI在医疗、教育等重要领域的应用落地，展现了智源研究院的实力和雄心。字节跳动发布SeedEdit3.0新图像编辑模型：6月6日，字节跳动Seed团队推出新一代图像编辑模型SeedEdit3.0。该模型基于Seedream3.0，在主体保持、背景细节及指令遵循上显著进步，支持4K分辨率，擅长复杂编辑如人像、背景、光影变换，并在真人评测中可用率达56.1%。推理速度优化至10秒级。技术报告已公开，即梦网页端已灰度测试，豆包App将上线。（99字）Luma AI发布视频改造神器：Luma AI推出革命性“Modify Video”功能，允许用户在保留原视频动作和运镜的同时，自由修改场景、角色和环境。该功能通过高级技术实现高精度控制，效果超越竞品，大幅降低专业视频制作门槛，让普通用户也能轻松创作类似电影特效的视频。PixVerse中国版“拍我AI”正式发布：海外受欢迎的AI视频平台PixVerse正式在中国推出国内版“拍我AI”，已同步上线App和网页版。它基于PixVerse V4.5算法，让用户通过文字或图像快速生成高质量AI视频，无需专业技能。旨在赋能国内创作者和企业，提供便捷高效工具，推动AI视频技术本土化。OpenAudio S1-Mini开源：轻量高效多语言TTS模型：Fish Audio 开源其文本转语音模型 OpenAudio S1-Mini。该模型仅0.5B参数，基于超200万小时数据训练，支持14种语言和50多种情感。现已在 Hugging Face 上免费提供非商业使用，大幅降低开发者门槛，挑战现有商业模型。Suno AI增音轨导出功能与唱片公司协商版权争议：Suno AI音乐工具近期升级，新增音轨拆分导出（最多12个）和歌词替换功能，增强创作灵活性。同时，Suno正与索尼、环球、华纳等唱片公司就训练数据版权问题进行协商，探讨通过授权合作解决争议，为AI音乐发展铺路。Hugging Face开源轻量机器人AI模型SmolVLA，可在MacBook运行：Hugging Face发布了开源轻量级机器人AI模型SmolVLA，仅4.5亿参数。该模型可以在MacBook等消费级硬件上运行，推理单张图片仅需约1.23GB GPU显存，显著降低了机器人技术门槛。基于LeRobot数据集训练，SmolVLA旨在普及视觉-语言-行动(VLA)模型应用，加速通用机器人智能体研究，并已成功用于控制机械臂等任务。博世联手阿里云，通义大模型打造智能座舱新体验：德国科技巨头博世与阿里云合作，将通义大模型应用于汽车智能座舱。该方案提升智能感知和3D数字人交互体验，通过云边混合计算实现多模态控制（语音、手势、面部），并支持知识问答和同声传译。这使得座舱能智能调整环境、提供信息帮助，标志着智能汽车正向个性化、智能化的移动空间发展。Trae集成Gemini 2.5 Pro，AI前端开发能力显著提升：Trae平台宣布完成更新，现已支持Google最新发布的Gemini 2.5 Pro Preview（I/O版）模型。此次升级大幅提升了平台在前端开发和UI设计领域的AI能力。Gemini 2.5 Pro在WebDev Arena和LMArena编码基准测试中均名列榜首，尤其WebDev Arena Elo分高达1443，领先其他模型。该模型在代码生成、UI设计及视频理解（VideoMME 84.8%）方面表现卓越，并已在Trae平台免费开放给用户体验。Diffusion Studio Pro发布：AI驱动、本地免费视频编辑新工具：AI驱动的视频编辑工具Diffusion Studio Pro正式亮相，提供本地优先、浏览器端的非线性编辑体验。它集成超过16种生成式AI模型，并通过智能代理实现自动化工作流，还提供视觉构图反馈。该工具最大亮点是本地优先设计保护隐私，并提供免费无限层级，大幅降低专业工具门槛。X平台用户赞其为“视频编辑的未来”，预示其对现有市场的潜在影响，推动编辑工具智能化普及。

关注我 mytoolsAI，带你了解每日最新人工智能，AI信息！

整理 | alice、Nash

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航