新闻 发表于 2025-6-10 13:20

AI-资讯 2025-06-10

作者:微信文章
阿里开源千问3向量模型,性能大幅提升,挑战谷歌和OpenAI



阿里巴巴于6月6日宣布开源其最新研发的千问3向量模型Qwen3-Embedding,该模型在性能上实现了显著提升,超越了谷歌、OpenAI和微软等国际巨头的同类产品,荣获当前最佳性能(SOTA)。Qwen3-Embedding基于千问3底座构建,适用于文本表征、检索和排序等多种任务,支持超过100种语言,展现了强大的多语言处理能力。这款模型共有9个不同尺寸和版本,开发者可根据实际需求灵活选择,轻松实现高效工作。自4月29日开源以来,千问3大模型已在多个国际榜单上崭露头角,取得了令人瞩目的成绩。

智源研究院推出Emu3等“悟界”系列大模型



在第七届“北京智源大会”上,智源研究院隆重发布了“悟界”系列大模型,包括Emu3、见微 Brainμ、RoboOS2.0、RoboBrain2.0和OpenComplex2。这些模型覆盖了多模态智能技术,旨在推动人工智能在医疗、教育、环境监测等领域的应用。 Emu3和见微 Brainμ分别专注于多模态理解和脑科学研究,而RoboOS2.0和RoboBrain2.0则聚焦于具身智能。OpenComplex2则致力于构建微观生命模型。此次发布不仅展示了智源研究院的技术实力,也为人工智能的未来发展提供了新的思路。 通过这些创新模型,“悟界”系列为人工智能技术的应用开辟了新的可能性,有望在多个领域带来革命性的变革。

Phonely公司AI代理准确率高达99%,客户难辨真人



Phonely 与 Groq 和 Maitai 合作,在 AI 电话支持方面取得了重大突破,将响应时间缩短了 70% 以上,准确率提升至 99.2%,比 GPT-4 高出 4.5 个百分点。这得益于 Groq 的 LoRA 技术,该技术能够实现专用 AI 模型之间的即时切换,且无延迟,以及 Maitai 的优化平台,该平台能够针对每个请求动态选择和优化模型。这些进步解决了语音 AI 中的“四秒问题”,即延迟会让自动对话显得不自然。这些改进对呼叫中心具有变革性影响,本月就有一家客户用它取代了 350 名人工客服。该技术在预约安排和潜在客户资格审核方面表现出色,在特定用例中展现出卓越性能。这些性能提升的背后是 Groq 的专用 AI 推理芯片,称为 LPU,它提供了硬件基础。基于云的基础设施支持可扩展性,系统设计具有低功耗和高性能的特点,对企业来说成本效益高。迈泰的代理层编排技术能够实现当天部署人工智能,解决了集成时间过长这一常见问题。此次合作表明,人工智能系统正朝着专业化、任务特定的方向发展,逐渐摆脱单一通用模型的模式。此次合作的成功可能会在自动化客户互动方面确立新的性能和响应标准,并验证人工智能基础设施公司携手合作解决复杂部署难题这一新兴模式。

智源发布RoboOS2.0与RoboBrain2.0:首个支持MCP机制的机器人



在北京智源人工智能研究院于2025北京智源大会上的精彩亮相中,两款重磅产品震撼发布:具身智能操作系统RoboOS2.0与升级版大模型RoboBrain2.0,均已全面开源。RoboOS2.0凭借MCP机制,实现了无服务器本体部署和免适配小脑技能注册,显著提升了系统性能,响应时延降至3毫秒以下,端云通信效率更是提升了27倍。此外,它还引入了时空场景图共享与任务闭环反馈机制,大大增强了多机器人协作能力。 RoboBrain2.0作为开源的具身大脑大模型,具备多本体环境动态建模与跨本体协同任务规划能力,任务规划准确率较上一代提升了74%。目前,这两个项目已与全球20多家具身智能企业携手合作,共同推动智能机器人生态的发展。 此次发布不仅展示了智源研究院在具身智能领域的卓越成就,也为全球智能机器人技术的发展注入了新的活力。

OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音



OpenAudio 推出了开源 TTS 模型 S1-Mini,这是一个从4B参数的S1模型精简而来的轻量级版本,仅包含0.5B参数。尽管参数大幅减少,S1-Mini 依然支持14种语言和多种情感表达,包括笑声和喊叫等特殊音效,展现出强大的表现力。其开源发布标志着AI语音技术的进一步民主化,降低了开发门槛,为小型团队和独立开发者提供了高品质语音合成的可能性。S1-Mini 的多语言支持使其在全球市场具有竞争优势,尤其在非英语语言的语音生成领域展现出潜力。 AIbase 认为,S1-Mini 的发布将进一步推动开源 TTS 技术在全球的普及与创新。此外,S1-Mini 的轻量化设计使其适用于教育领域的语言学习工具、娱乐行业的音频书和播客生成,以及交互式应用的语音合成。Fish Audio 计划持续优化 S1-Mini 的性能,并可能推出支持更多语言和实时应用的版本,为开发者提供高效工具,推动开源生态的发展。 S1-Mini 不仅在技术上实现了突破,还为全球开发者提供了更多可能性。它的轻量化设计和多语言支持使其在教育、娱乐和交互式应用等多个领域展现出巨大潜力,有望成为开源 TTS 技术的新标杆。

Anthropic 推出用于美国国家安全的 Claude AI 模型



Anthropic 最近推出了专为美国国家安全客户定制的 Claude AI 模型。这一宣布正值美国关于 AI 监管的争议时期,Anthropic 首席执行官 Dario Amodei 倡导透明度规则而非监管暂停。这些模型已经部署,并经过了与其它 Claude 模型相同的严格安全测试。这一宣布引发了人们对 AI 在国家安全、战略规划和防御操作中角色的讨论。

谷歌重磅新作!Portraits让你与虚拟专家对话,解锁沟通与领导力秘籍



谷歌推出了一款名为Portraits的AI产品,允许用户与虚拟专家进行实时对话,提供沉浸式对话学习体验,帮助用户提升沟通技巧和领导力。Portraits的核心功能在于其交互性和实践性,用户不仅能获取理论知识,还能通过模拟对话练习实际场景中的沟通策略。 目前,该产品仅对美国IP用户开放测试,未来计划扩展至全球市场。应用场景广泛,包括职场、教育和内容创作等领域,为职场人士、教育工作者和学生提供了新的学习机会。 AIbase认为,Portraits的交互式学习模式不仅提升了学习的趣味性,还大幅降低了获取高质量教育资源的门槛。随着技术迭代和市场扩展,Portraits有望成为AI驱动教育的重要工具,与其他AI学习平台如Coursera的AI助手或Duolingo的互动课程展开竞争。

PixVerse国内版“拍我AI”正式发布,解锁AI视频创作新玩法



PixVerse国内版“拍我AI”正式发布,提供一键生成高质量AI视频的功能,支持短视频、动画和影视级特效创作,涵盖多种风格和应用场景。该平台继承了PixVerse在海外市场的核心技术优势,视频生成质量和稳定性达到行业领先水平。通过智能分析用户输入的文本或图像,“拍我AI”能够生成流畅、自然的视频内容,尤其在处理复杂场景时表现优异。此外,平台在用户体验上进行了本地化优化,界面简洁直观,支持中文输入和实时预览功能,便于国内用户上手。 PixVerse海外版已拥有超1600万月活跃用户,“拍我AI”的推出有望进一步扩大这一用户基础。该平台适用于内容创作者、企业及游戏爱好者,助力短视频制作、二次创作和营销视频制作,推动短视频、电商和教育等行业的数字化转型。与Runway、Synthesia等国际竞争对手相比,“拍我AI”在本地化支持和价格策略上更具优势。AIbase预计,“拍我AI”将推动AI视频技术在中国的应用落地。AIbase将持续关注其功能迭代与市场表现。

Diffusion Studio Pro:AI驱动本地视频编辑工具



AI驱动的本地视频编辑工具Diffusion Studio Pro正式发布,它结合了CapCut的便捷性和Cursor的智能性,提供了一种全新的本地优先、基于浏览器的非线性编辑体验。这款工具集成了超过16种生成式AI模型,涵盖了视频生成、图像优化、音频增强等多功能,支持自动化素材处理和智能剪辑,特别适合专业视频制作和短视频内容创作。 Diffusion Studio Pro采用免费无限层级模式,大幅降低了创作门槛,吸引了大量用户的关注。其强大的多模态AI能力,使其在短视频到专业级视频制作的广泛场景中都能游刃有余,未来有望成为AI驱动视频编辑的行业标杆。
页: [1]
查看完整版本: AI-资讯 2025-06-10