多客科技 发表于 2025-6-7 00:40

25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航

作者:微信文章
25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航



阿里巴巴6月6日开源Qwen3-Embedding向量模型,性能超谷歌OpenAI获SOTA   :阿里巴巴于6月6日正式开源基于千问3底座的Qwen3-Embedding向量模型系列,专为文本检索、排序等任务优化。该模型性能较前版提升超40%,在MTEB等榜单超越谷歌、OpenAI等顶尖模型,获SOTA最佳性能。Qwen3-Embedding支持超100种语言,含编程语言,具多语言检索能力。此次共开源9款不同尺寸模型,已在魔搭、Hugging Face等平台可用,并提供API服务。AMD收购AI初创公司Brium 聚焦优化AI推理打破Nvidia依赖:半导体巨头AMD近日宣布收购专注于AI软件优化的初创公司Brium,具体金额未公开。Brium致力于优化AI推理在多种硬件上的性能。AMD希望通过此举构建开放、高性能的AI软件生态系统,并解决AI软件高度依赖Nvidia硬件的现状,以增强自身在AI市场的竞争力。这是AMD在过去两年内的第四次战略收购,显示其正大力投资以推动开放源代码AI发展。OpenAI学院印度分院成立 与IndiaAI合作普及AI技能:OpenAI于本周四与IndiaAI正式启动“OpenAI学院印度分院”,这是其教育平台首次国际落地。旨在向印度学生、开发者、教师、企业等群体普及AI技能。通过谅解备忘录,提供线上线下混合教学,贡献内容至印度平台,并在6城市办研讨会。计划包括为50家初创提供10万美元API积分、组织覆盖2.5万学生的黑客马拉松,以及培训100万教师使用生成式AI工具,加速本地AI创新。上海AI实验室发布机器人具身智能大脑VeBrain框架   :上海人工智能实验室发布VeBrain具身智能大脑框架,旨在让机器人实现“看到-思考-行动”。该框架统一了感知、推理与控制,克服现有模型在物理交互上的短板。通过60万数据集训练,VeBrain在多模态、空间推理及机器人控制(如四足机器人任务提升50%)测试中表现出色,推动机器人与物理世界的交互。高德上线全链路AI导航智能体:结合智能眼镜开启AR导航新时代:高德地图于2025年4月14日推出全球首个地图AI导航智能体NaviAgent。该智能体采用“思考-预判-行动”模式,具备超视距感知能力。高德进一步将NaviAgent与智能眼镜及AR技术结合,提供AR导航、高阶HUD、空间感知等功能,带来全新出行体验。它能根据用户情绪互动,并实时预警风险。高德已与Rokid等伙伴合作,共建“AI+AR”导航新生态,旨在将导航升级为用户的智慧伙伴。智源发布RoboOS/RoboBrain 2.0:开源推动具身智能生态   :2025北京智源大会上,北京智源人工智能研究院正式开源发布具身智能操作系统RoboOS 2.0和升级版大模型RoboBrain 2.0。RoboOS 2.0响应时延缩至3ms内,端云通信效率提升27倍,增强多机器人协作;RoboBrain 2.0任务规划准确率提升74%。两大平台均支持多本体协同,大幅降低开发门槛。智源已与全球20多家企业合作,共建开放协同的智能机器人生态。ElevenLabs发布AI语音模型Eleven v3   :ElevenLabs 发布最新AI语音模型Eleven v3(Alpha版),号称最具表现力。支持70+语言,能处理复杂对话并精确控制情感。面向创作者与开发者,六月Alpha公测享80%优惠,API将开放。谷歌发布AI学习工具Portraits   :谷歌于2025年6月5日推出AI产品Portraits,提供与虚拟专家对话的个性化学习体验。首批专家教授沟通与领导力,用户可通过互动提升技能。目前仅限美国IP测试,未来计划全球推广,旨在用AI革新教育。英伟达发布Llama Nemotron Nano VL   :英伟达于2025年6月5日推出Llama Nemotron Nano VL视觉-语言模型,针对文档级图文理解。该模型基于Llama 3.1,处理多页文档,支持16K上下文。在表格、数据提取等文档任务表现出色,开放许可供商业使用。00后数学家洪乐潼创AI公司 无产品估值3亿:00后数学家洪乐潼创立AI公司Axiom,专注于严谨数学证明AI。公司尚无产品,但已获3亿至5亿美元估值,计划融资5000万美元,目标对冲基金。市场高度认可创始人背景及垂直AI潜力。微软Athena AI智能体整合至Teams并开源,效率提升显著:微软于2025年6月4日宣布将AI智能体Athena整合至Teams应用,并已在GitHub开源。此举旨在优化团队协作与开发工作流程,提升效率。Athena能自动化处理代码审查、任务管理等,提供实时项目状态更新。微软内部测试显示,Athena已服务逾2000工程师,效率提升达30%,加速了交付周期。开源特性允许各规模团队定制,推动AI技术创新。蚂蚁国际发布AI金融平台Alipay+ GenAI Cockpit   :蚂蚁国际推出AI金融平台“Alipay+ GenAI Cockpit”,作为AI即服务,旨在助金融科技公司构建AI代理和原生金融服务。平台整合支付、合规、风控等流程,基于超20个大模型。预计2025年6月起在东南亚、南亚向外部客户部署,推动金融业进入AI原生新阶段。智源大会发布悟界系列大模型   :在第七届北京智源大会上,智源研究院重磅发布了“悟界”系列大模型。这批模型涵盖原生多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能框架RoboOS/RoboBrain以及微观生命模型OpenComplex2等。此举标志着人工智能领域的技术新进展,旨在推动AI在医疗、教育等重要领域的应用落地,展现了智源研究院的实力和雄心。字节跳动发布SeedEdit3.0新图像编辑模型:6月6日,字节跳动Seed团队推出新一代图像编辑模型SeedEdit3.0。该模型基于Seedream3.0,在主体保持、背景细节及指令遵循上显著进步,支持4K分辨率,擅长复杂编辑如人像、背景、光影变换,并在真人评测中可用率达56.1%。推理速度优化至10秒级。技术报告已公开,即梦网页端已灰度测试,豆包App将上线。(99字)Luma AI发布视频改造神器   :Luma AI推出革命性“Modify Video”功能,允许用户在保留原视频动作和运镜的同时,自由修改场景、角色和环境。该功能通过高级技术实现高精度控制,效果超越竞品,大幅降低专业视频制作门槛,让普通用户也能轻松创作类似电影特效的视频。PixVerse中国版“拍我AI”正式发布:海外受欢迎的AI视频平台PixVerse正式在中国推出国内版“拍我AI”,已同步上线App和网页版。它基于PixVerse V4.5算法,让用户通过文字或图像快速生成高质量AI视频,无需专业技能。旨在赋能国内创作者和企业,提供便捷高效工具,推动AI视频技术本土化。OpenAudio S1-Mini开源:轻量高效多语言TTS模型   :Fish Audio 开源其文本转语音模型 OpenAudio S1-Mini。该模型仅0.5B参数,基于超200万小时数据训练,支持14种语言和50多种情感。现已在 Hugging Face 上免费提供非商业使用,大幅降低开发者门槛,挑战现有商业模型。Suno AI增音轨导出功能 与唱片公司协商版权争议:Suno AI音乐工具近期升级,新增音轨拆分导出(最多12个)和歌词替换功能,增强创作灵活性。同时,Suno正与索尼、环球、华纳等唱片公司就训练数据版权问题进行协商,探讨通过授权合作解决争议,为AI音乐发展铺路。Hugging Face开源轻量机器人AI模型SmolVLA,可在MacBook运行   :Hugging Face发布了开源轻量级机器人AI模型SmolVLA,仅4.5亿参数。该模型可以在MacBook等消费级硬件上运行,推理单张图片仅需约1.23GB GPU显存,显著降低了机器人技术门槛。基于LeRobot数据集训练,SmolVLA旨在普及视觉-语言-行动(VLA)模型应用,加速通用机器人智能体研究,并已成功用于控制机械臂等任务。博世联手阿里云,通义大模型打造智能座舱新体验:德国科技巨头博世与阿里云合作,将通义大模型应用于汽车智能座舱。该方案提升智能感知和3D数字人交互体验,通过云边混合计算实现多模态控制(语音、手势、面部),并支持知识问答和同声传译。这使得座舱能智能调整环境、提供信息帮助,标志着智能汽车正向个性化、智能化的移动空间发展。Trae集成Gemini 2.5 Pro,AI前端开发能力显著提升:Trae平台宣布完成更新,现已支持Google最新发布的Gemini 2.5 Pro Preview(I/O版)模型。此次升级大幅提升了平台在前端开发和UI设计领域的AI能力。Gemini 2.5 Pro在WebDev Arena和LMArena编码基准测试中均名列榜首,尤其WebDev Arena Elo分高达1443,领先其他模型。该模型在代码生成、UI设计及视频理解(VideoMME 84.8%)方面表现卓越,并已在Trae平台免费开放给用户体验。Diffusion Studio Pro发布:AI驱动、本地免费视频编辑新工具   :AI驱动的视频编辑工具Diffusion Studio Pro正式亮相,提供本地优先、浏览器端的非线性编辑体验。它集成超过16种生成式AI模型,并通过智能代理实现自动化工作流,还提供视觉构图反馈。该工具最大亮点是本地优先设计保护隐私,并提供免费无限层级,大幅降低专业工具门槛。X平台用户赞其为“视频编辑的未来”,预示其对现有市场的潜在影响,推动编辑工具智能化普及。

关注我 mytoolsAI,带你了解每日最新人工智能,AI信息!

整理 | alice、Nash
页: [1]
查看完整版本: 25年06月07日,AI每日快讯,阿里开源向量模型/AMD购优化AI/OpenAI印度分院/具身智能大脑/高德AI导航