多客科技 发表于 2025-8-29 16:38

AI资讯:OpenAI扫描用户对话;微软发自研语音与通用模型;全球首个老年痴呆脑机接口落地等AI资讯

作者:微信文章
点击蓝字



关注我们

点击🎧收听今日AI资讯



OpenAI 将扫描用户对话



OpenAI 在最新博客中坦言,在处理用户心理健康危机方面存在失误,并介绍了 ChatGPT 的一系列改进措施。ChatGPT 从 2023 年初就开始训练,不提供自我伤害指导,会用支持性语言回应。系统自动阻止违反安全训练的回应,对未成年人保护更严格,阻止自残图像输出。若用户表达自杀意图,会引导其寻求专业帮助,如在美国推荐拨打 988 热线,英国联系 Samaritans 等。当检测到用户计划伤害他人,对话将转由专业团队审查,确认存在严重身体伤害威胁时,会移交执法部门,但目前自残案件出于隐私考虑,不会转交警方。OpenAI 还与多国医生及专家小组合作,确保方法符合最新研究和最佳实践。



微软发布自研语音模型和通用模型



8 月 29 日,微软旗下 AI 研究机构微软 AI 推出两款全自研 AI 模型。MAI-Voice-1 是语音生成模型,已应用于 Copilot Daily 和 Podcasts,用户可在 Copilot Labs 体验。它生成速度快,微软称单块 GPU 上一秒就能输出一分钟音频,且定制化程度超高。用户能选择情绪模式、声音模板,有超 40 种语体风格可选,如喜悦、愤怒等情绪模板,还能模仿机器人、海盗等角色,每个角色说话方式独特,不过暂不支持中文输出。MAI-1-preview 是混合专家模型,在约 1.5 万颗英伟达 H100 GPU 上完成预训练和后训练,主打指令遵循和日常问题解答,已在 LMArena 内盲测,未来几周将应用于 Copilot 部分文本场景优化体验。



OpenAI 推出 GPT-RealTime 语音合成模型



凌晨,OpenAI 发布为开发者打造的语音转语音模型 GPT-RealTime,更新多项 API 功能。该模型被称为迄今最先进的语音合成模型,在音频质量、理解和遵循用户指令等方面大幅改进。它能自然朗读重复字母数字,无缝切换语言,捕捉笑声等非语言信号。新增 Cedar 和 Marin 两个语音,还优化了现有的 8 种语音效果。在 Big Bench Audio 等基准测试中准确率显著提升。OpenAI 改进函数调用,异步函数调用不再中断会话流程。Realtime API 直接处理和生成音频,减少延迟,保留语音细微差别。新功能包括远程 MCP 服务器支持、图像输入、SIP 电话呼叫支持等。价格方面,相比旧模型,GPT-RealTime 每百万 token 价格下调 20%。



xAI推出代码模型



马斯克的xAI 推出 Grok Code Fast 1,作为 Grok 4 的代码版本,专为 “agentic 编程” 打造,通过 AI 自动执行编程任务提升效率。xAI 认为现有大语言模型并非为智能体编码工作流量身定制,所以构建了更灵活、响应快的 Grok Code Fast 1。它从零开始训练,采用新架构,经专门预训练语料库和高质量数据集筛选。训练中与合作伙伴完善其在平台上的表现,已熟练掌握 grep、终端和文件编辑等工具使用,能融入开发者日常工作。目前在 GitHub Copilot 等多个平台免费提供一周试用,此前已以 “Sonic” 代号在部分平台上线。模型在 SWE-Bench-Verified 完整子集测试中获 70.8% 得分,接近 Claude 4 系列。



Meta 力争年底前推出新一代 Llama 4.X AI 模型



Meta 正全力加速下一代 AI 模型 Llama 4.X 的开发进程。内部 “TBD” 团队在超级智能实验室中夜以继日地攻坚,目标明确且坚定,即确保 Llama 4.X 能在 2025 年年底前达到可投入生产的成熟状态。这一模型的研发对于 Meta 在 AI 领域的持续竞争力至关重要,有望在自然语言处理、智能交互等多个领域带来显著突破与创新应用,虽然目前关于模型具体特性与优势的细节尚未完全披露,但科技行业已对其满怀期待,其一旦推出,预计将对 AI 产业格局产生重要影响,引发新的技术变革与市场竞争。



全球首个老年痴呆脑机接口临床应用落地



由广州医科大学附属脑科医院等合作研发的“5G 脑心动车” 正式发布,这标志着全球首个老年痴呆脑机接口临床应用成功落地。该系统具备强大功能,可实现脑电信号的穿戴式便捷检测与精准智能分析。借助先进的 AI 技术,能够辅助医生进行诊断,为患者生成高度个性化的干预策略。通过对老年痴呆患者脑电信号的持续监测与分析,有助于早期发现病情变化,及时调整治疗方案,为改善老年痴呆患者的生活质量、延缓病情发展提供了全新且有效的途径,为全球老年痴呆症的治疗与干预开辟了新的方向。



“仿真宁夏暨 AI 仿真开源”平台发布



在2025 第七届中国 - 阿拉伯国家博览会新品发布会上,“仿真宁夏暨 AI 仿真开源” 平台重磅发布。该平台依托中国电信天翼云等强大资源,集成了宁夏全域的地理、气象以及社会经济数据。其创新性地首次将 AI 仿真技术大规模应用于城市治理领域,能够通过对城市运行的全方位模拟与仿真,为城市规划、交通管理、公共资源配置等提供科学、精准的决策支持。借助 AI 仿真技术,可提前预测城市发展中可能出现的问题,优化城市管理策略,提升城市治理效率与质量,促进城市的可持续发展。



2025中国国际大数据产业博览会开幕



博览会正式面向社会公众开放,“人工智能 +” 元素在本届展会中格外夺目,超过六成的数字经济相关产品和服务方案都与 “人工智能 +” 紧密相连。国家数据局在会上宣布启动高质量数据集建设先行先试工作等一系列新政策新举措。这将推动大数据与人工智能深度融合,加速数据要素流通,促进人工智能技术在各行业的创新应用。展会现场汇聚了众多前沿科技成果与创新解决方案,为产学研各界搭建了交流合作平台,助力数字经济产业蓬勃发展,推动人工智能技术在更广泛领域实现落地应用与创新突破。



阿里云百炼部分模型计费调整



8月29日03:00起,阿里云百炼对部分模型调用计费做出重要调整,从限时免费转变为发放限时免费额度。调整后,用户可获得100万免费token额度,在额度使用完后,平台会自动停止服务。这一变化意味着阿里云在成本控制与服务优化方面的战略调整。此前的限时免费模式虽能吸引大量用户尝鲜,推动模型的市场推广,但长期来看可能带来成本压力。而调整为免费额度模式,既能保障新用户和轻度用户的基本使用需求,也能引导用户更合理地使用模型资源。对于开发者和企业而言,这一调整促使他们更精准地规划token使用,提高资源利用效率。后续,阿里云或许还会围绕token额度推出更多增值服务或付费方案,以满足不同用户的多样化需求,持续探索云服务的商业价值与用户体验的平衡点。



湖南举办数博会专场推介会并首发《湖湘文库》AI版



8月29日,第十五届中国国际数字出版博览会期间,湖南展团专场推介会成功举行,现场首发的《湖湘文库》AI版成为焦点。该产品以大型典籍丛书《湖湘文库》为基础,深度融合人工智能技术,打造“五大板块”,重塑文化体验。借助AI技术,不仅能实现纸质与数字阅读的无缝切换,还能将古籍转化为通俗易懂的表达,帮助大众更好地理解湖湘文化。同时,现场还举行了湘豫动漫游戏产业合作等项目签约仪式,促进了区域间文化产业的交流与合作。此次推介会,集中展示了湖南在数字出版领域的创新成果,推动了湖湘文化的数字化传承与发展,也为湖南文化产业与其他地区的协同发展搭建了新的桥梁,对提升湖湘文化影响力、助力数字出版产业升级意义重大。



百度云智大会开幕,千帆平台升级



百度智能云千帆平台升级到4.0 版本,打造以 Agent 为核心的一站式企业级服务平台。模型库提供超 150 个模型,新增定制专精模型并发布精调新方法;Agent 编排框架升级,推出多智能体协作模式;升级数据智能服务平台;实现全链路检测。此外还亮相了一见视觉大模型平台新能力以及 “吴彦祖数字英语教练”。



欢迎关注我们的公众号[我的AI爸爸],我们会定期分享关于AI的文章和免费工具。欢迎关注获取更多AI内容。

https://mmbiz.qpic.cn/mmbiz_png/Ljib4So7yuWghNpLLXxzNoCLN0hVnyU8YWmVDP3OwzHmaA2GMJmRF2c2Q4BVDnicOrUUuPViaicMInj14b9OsY3AMg/640?wx_fmt=png&from=appmsg&wxfrom=5&wx_lazy=1&tp=webp

往期回顾

01

秒创 AI 成片教程:从文案输入到视频生成操作说明

02

快文 CopyDone:让营销内容创作效率翻倍的 AI 神器
页: [1]
查看完整版本: AI资讯:OpenAI扫描用户对话;微软发自研语音与通用模型;全球首个老年痴呆脑机接口落地等AI资讯