我爱免费 发表于 2025-9-17 04:04

9月17日AI资讯

作者:微信文章
看到大模型的能力加强了很多,简单梳理了一下底层逻辑:

这些内容看似都缺一不可,但我认为用户和反馈是能力进化的最重要的因素!欢迎讨论。今日资讯:
TOP1: MIT与IBM推出LLM高效缩放定律MIT和IBM Watson AI Lab联合发布新框架,通过部分训练(仅一半进度)即可可靠预测大语言模型(LLM)最终性能。该方法遵循功率定律,帮助研究者优化训练预算,避免数百万美元计算浪费。该进展将加速LLM开发,预计降低门槛,提升模型预测准确性。

TOP2: LLM缩放提升大脑-like语言处理能力Nature Computational Science刊登研究显示,LLM参数从7.7亿增至650亿时,其注意力模式与人类阅读时的眼动和fMRI脑活动对齐度呈幂律改善。指令调优无效,纯缩放更接近人类双侧颞顶网络处理。65B模型减少“琐碎”注意力,提升自然语言理解。该发现强化缩放对认知模拟的重要性。

TOP3: Figure AI融资10亿美元,估值飙至390亿人形机器人初创Figure AI完成10亿美元融资,估值达390亿美元,成为顶级AI独角兽。该轮资金将推进通用机器人开发,结合LLM实现自主任务执行,如工厂协作。投资者包括微软和OpenAI,此举标志机器人与大模型深度融合,加速“代理AI”商业化。

TOP4: 微软300亿美元投资英国AI基础设施微软宣布300亿美元注入英国AI运算与基础设施,与英国首相Keir Starmer及特朗普顾问合作,聚焦AI、量子计算与核能。该投资包括数据中心扩张,支持百万token级LLM训练。旨在巩固美英AI联盟,应对全球竞争,推动可持续计算。)

TOP5: 小语言模型(SLM)革命兴起,成本降10-30倍2025年SLM成为焦点,Apple MLX与Google Gemma领衔,模型可在手机/笔记本离线运行,成本较LLM降10-30倍。边缘AI市场预计从210亿增至1430亿美元。该趋势强调“更小更智能”,适用于实时应用,推动AI从云端向设备端迁移。
页: [1]
查看完整版本: 9月17日AI资讯