AI商业洞察 | AI分析150万条玩家对话,Creativ助游戏公司洞察品牌情绪
作者:微信文章AI+商业
AI商业洞察
英伟达新一代Blackwell芯片登顶MLPerf基准测试,引领AI训练性能
6月4日,英伟达宣布其新一代Blackwell芯片在最新MLPerf AI训练基准测试中全面领先,特别是在最具挑战性的Llama 3.1 405B语言模型预训练测试中表现卓越,性能相比前代架构提升2.2倍。
本次测试中,英伟达成为唯一在所有MLPerf v5.0项目中提交结果的公司,涵盖大语言模型、推荐系统、多模态AI等任务。公司使用搭载Blackwell GPU的Tyche和Nyx超级计算平台参测,并与CoreWeave及IBM合作,总计使用2,496颗GPU和1,248颗Grace CPU。
Blackwell架构采用液冷设计、13.4TB内存、第五代NVLink互联及Quantum-2 InfiniBand网络,大幅提升训练效率。配合NeMo Framework等软件栈,显著加速多模态模型训练,为“AI工厂”中生成式和推理型AI提供强大支撑。
英伟达强调,随着AI模型训练从“投资阶段”进入部署和推理阶段,Blackwell将成为AI基础设施核心。此次基准测试的全面领先,彰显英伟达从GPU供应商向构建完整AI数据中心的“AI工厂”转型的实力与雄心。
Ai2发布RewardBench 2,助力企业评估AI模型实际表现
近日,艾伦人工智能研究所(Ai2)推出全新升级的AI奖励模型评估工具RewardBench 2,旨在帮助企业更准确地判断AI模型在真实场景中的表现和与企业价值的契合度。
RewardBench 2通过更具挑战性的分类任务、复杂评分体系和六大评估维度(事实性、指令遵循、数学能力、安全性、专注度和判断力),提高了模型对人类偏好的理解力。Ai2表示,新版本采用未公开的人类提示语,并测试了多种热门模型,包括GPT-4.1、Claude、Gemini、Llama 3.1等。结果显示,Llama 3.1 Instruct表现最优,而Skywork数据在安全性方面贡献突出,Tulu则在事实性方面成绩亮眼。
Ai2强调,RewardBench 2不仅适用于强化学习训练(RLHF)中的奖励模型设计,也适用于模型筛选与推理性能评估,能有效辅助企业选择最适合其目标和场景的AI模型。该工具提供了一种多维度、贴近实际的评价方法,有望缓解AI模型在生产环境中“失灵”的问题。
Phonely AI语音客服突破99%准确率,客户难辨真假人声
近期,语音AI公司Phonely与芯片制造商Groq及推理优化平台Maitai合作,推出新一代AI语音客服系统,实现99.2%的对话准确率,并将响应时间缩短逾70%,大幅超越GPT-4o的表现。该系统通过Groq的“零延迟LoRA热切换”技术,可在毫无延迟的情况下即时切换多种专用AI模型,而Maitai则作为中间代理层,实时优化模型选择与性能。
Phonely创始人博德韦斯(Bodewes)表示,新技术已使用户难以分辨通话对象是否为AI。在测试中,超过70%的来电者无法察觉对话者为人工智能。一家大型呼叫中心更在本月全面用Phonely替代350名人工坐席,提升了32%的潜在客户转化率。
此次突破不仅大幅降低企业部署AI客服的成本与复杂性,还标志着多模型、低延迟AI基础设施的落地,为客户服务自动化设立了新的行业标准,或将加速传统客服向智能化转型的进程。
Epic公布2025《虚幻引擎》最新进展,《巫师4》技术演示惊艳亮相
Epic Games在佛罗里达奥兰多举办的Unreal Fest上发布“2025年虚幻引擎发展现状”,CEO 官蒂姆・斯维尼(Tim Sweeney)登台揭示了众多重磅技术更新。CD Projekt Red携手Epic展示了基于Unreal Engine 5.6打造的《巫师4》技术演示,展现了女主Ciri在Kovir地区的冒险,场景在PS5上以60帧运行,并支持光追和纳米植被等新技术。
此外,MetaHuman平台正式脱离测试阶段,用户可在引擎内创建高拟真数字人,并可在Unity等其他引擎中使用。UEFN平台持续壮大,至今已为创作者发放7.22亿美元,玩家总游戏时长达112亿小时。6月起将新增乐高编辑器、鱿鱼游戏、星球大战等IP内容。
Epic还宣布推出AI助手、AI NPC工具、场景图系统等新功能,提升开发效率。Epic Games Store收入分成机制优化,并将支持iOS与Android自助发布,进一步拓展开发者生态。该发布展示了Epic在引擎、内容创作与平台生态的全面推进。
AI分析150万条玩家对话,Creativ助游戏公司洞察品牌情绪
近日,市场情报新创公司Creativ利用AI对150万条来自Reddit、YouTube、Discord和新闻评论中的玩家对话进行情绪分析,洞察17家顶级游戏发行商的品牌表现。该分析覆盖2024年11月至2025年4月,数据来源超过9,300个。
Creativ CEO Wes Morton(韦斯·莫顿)表示,公司通过大型语言模型(LLM)识别玩家的真实情绪,能准确解析游戏圈特有的俚语与讽刺表达。与传统分析不同,LLM能更准确地把握语境与潜台词,识别正负面评论。
分析显示,玩家对平台独占、货币化策略、行业并购等议题反应强烈,特别批评了Activision Blizzard、EA、Ubisoft等公司破坏玩法的收费模式。Netflix因电视剧《猎魔人》换角,也间接受到玩家批评,影响了整个《巫师》系列的口碑。
Creativ指出,AI能更快速处理大量数据,为游戏公司提供及时、深入的品牌和内容反馈,有助于精准调整策略与产品方向。
CockroachDB分布式向量索引应对企业AI数据爆炸挑战
6月3日,Cockroach Labs发布CockroachDB 25.2版本,重点提升分布式SQL数据库在AI时代的向量搜索能力和整体效率。随着企业AI应用规模急剧扩大,数据访问不仅要求丰富,还需高效、稳定和精准。CockroachDB新引入基于微软研究的C-SPANN算法的分布式向量索引,支持跨地域、海量向量数据的快速相似性检索,解决了传统单节点向量数据库难以扩展的问题。
该版本还带来41%的性能提升和核心安全功能升级,包括行级安全和可配置密码套件,帮助企业满足日益严格的合规要求。通过缓冲写入和通用查询计划,优化分布式节点间的读写效率,特别适应智能体AI代理驱动的实时、高并发操作,满足“运营大数据”场景的低延迟与高一致性需求。
Cockroach Labs联合创始人兼CEO 斯宾塞·金博尔(Spencer Kimball)表示,未来AI代理的爆发式数据访问将远超传统人类操作,企业需提前布局分布式数据库架构,兼顾传统SQL和向量检索,确保关键业务系统的韧性和扩展性。CockroachDB 25.2被视为企业应对AI数据增长挑战的有力技术选择。
编辑 | 钱丽娜
排版 | 杨一萍
校对 | 袁海鸣
|中经传媒智库CBJTHINKTANK原创文章|
往期推荐
AI商业洞察 | 谷歌大脑创始人吴恩达称AI将彻底改变战场
你有在看吗↓
页:
[1]