AI存储需求调研
作者:微信文章AI存储需求调研
在AI基础设施迅猛发展的当下,存储需求已成为行业关注的焦点。GPU等计算资源固然重要,但SSD和HDD等存储介质的成本、供给和替代方案同样影响着大厂的Capex规划。本文基于业内专家的深度访谈,剖析AI时代存储市场的痛点与机遇,从涨价趋势、替代策略到多模态模型的影响,一一展开探讨。无论你是AI从业者还是投资者,这份调研报告将为你提供宝贵洞见。
AI服务器存储配置的演变趋势
在当前AI Infra设计中,一个典型服务器通常配备固定容量的SSD,例如一台搭载H100的服务器可能配备3.8TB SSD和4张卡,形成标准配比。未来,服务器内部SSD数量不一定会增加,而是通过提升单张SSD容量来应对需求增长。例如,从当前的8TB逐步升级到16TB或32TB。一旦本地存储不足,数据可迁移至外部HDD进行冷存储。这种策略不仅优化了空间利用,还降低了整体成本。
专家指出,随着AI模型的复杂化,存储容量需求将持续上涨,但通过技术迭代(如更大容量SSD),大厂能有效控制硬件扩张。
SSD涨价的影响与低成本应对策略
近期SSD价格上涨已成为行业共识,云厂商正积极寻求降本方案。尽管涨价对云服务成本构成压力,但大厂不会轻易放缓AI Infra建设步伐。访谈中,专家提到一种新兴技术——MRDIMM(Multi-Ranked DIMM),它能提供更高带宽并部分替代昂贵DRAM,用于KV Cache等存储功能,从而均衡涨价带来的成本压力。
对于SSD和HDD的替代方案,专家强调国产大容量存储的潜力。目前,海外品牌性能优越但价格较高,国产替代品若在成本上更具竞争力,将成为补充选项。大厂通常锁定半年至一年的合约价格,但合约到期后仍需面对市场波动。即使SSD价格翻倍,其在服务器总成本中的占比仅约0.5%,远低于GPU,因此不会显著影响Capex计划。互联网巨头面临项目压力,在可承受范围内会继续投资。
数据中心扩展性:SSD与HDD的灵活配置
已建数据中心并非一成不变。专家解释,硬盘支持热插拔,可逐步扩展容量,前提是服务器预留足够插槽。DRAM同样可升级为更高规格。对于存储服务器,通过机架扩展(如从6个单元增至8个),可实现无缝扩容。OpenAI等公司用户从1亿月活激增至7亿时,可在原有架构上增加存储,而非一味新建数据中心。这种预留接口的设计,确保了AI Infra的弹性。
SSD与HDD的价差与互补关系
SSD和HDD属于分层存储体系,非简单替代。HDD适用于冷数据(如PB级长期备份),价格约15-20美元/TB,加载时间可达几分钟。SSD则针对热/温数据,提供TB/s级吞吐和毫秒级延迟,价格在60美元/TB以上。价差在2-3倍视为合理。
如果HDD价格大幅上涨,SSD可向下兼容替代HDD(类似于高标号汽油替低标号),但反之不行。采购策略需动态调整,按数据冷热分层规划,避免因价格波动导致业务短板。云计算厂商不会偏向单一类型,而是均衡补齐,确保整体负载稳定。
存储成本传导:从云厂商到C端用户
AI对话次数增加会推高存储用量,叠加涨价,成本最终会传导。云厂商面向B端收取按TB计费的存储费用,企业则通过调整C端订阅价(如GPT Plus)来分担。免费用户存储有限(约1000条数据),付费用户可享3年以上周期。未来,产品可能引入“存储包”模式,根据用量额外收费,否则删除旧数据。这有助于平台控制亿级用户带来的存储压力。
AI存储需求 vs. 传统互联网:级别跃迁
相较短视频、游戏等传统应用,AI对存储的拉动更剧烈。传统互联网以对象存储为主(如用户上传文件),可容忍分钟级延迟,主要依赖HDD(温/冷数据)。AI时代强调实时交互、长期记忆,热数据激增,对IOPS和带宽要求达毫秒级。
专家量化:传统APP一年PB级存储已足,但AI支撑百万C端用户需EB级。数据产生逻辑从“上传文件”转向“token消耗”,峰值更高。多模态模型(如G5的2.2万亿参数)进一步放大需求,输入/输出token达十万级,显存占用翻倍。DRAM和SSD需求将超语言模型,HDD则因冷数据备份(3-8份)而主导总量。
压缩方面,AI token数据压缩比约1:2,低于传统1:10,以确保快速解压。当前国内AI日均数据:SSD达PB级,HDD入EB级,并持续增长。
市场供给与涨价趋势
HDD目前缺货严重,供应商报价谨慎。下半年,SSD涨价弹性更大(需求增长快),HDD有存量缓冲。Capex中,存储占比约8-10%(100亿中8-9亿),品牌以三星、美光等海外为主,国产份额渐增。主控芯片需求同步上涨,国产如阿里自研IC正加速布局。
结语:AI存储的机遇与挑战
AI存储需求正从TB/PB跃迁至EB级,涨价虽是痛点,但通过国产替代、分层存储和新技术(如MRDIMM),大厂能有效应对。未来,多模态时代将进一步拉动HDD(冷数据主导)和NAND(实时需求),投资者需关注供给链动态。存储不仅是成本,更是AI体验的核心支撑。
页:
[1]