找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 100|回复: 0

AI算力反内卷:DeepSeek用1%的成本,预演产业未来?

[复制链接]
发表于 2025-9-20 01:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
当所有目光聚焦于GPU军备竞赛时,一场关于“效率”的革命,可能正悄然改变牌桌上的游戏规则。
2025年的今天,当我们谈论人工智能时,脑海中浮现的第一个词或许是——昂贵”

从英伟达GPU的“一卡难求”,到科技巨头动辄数十亿、上百亿美元的算力投资,整个行业似乎都陷入了一场“军备竞赛”:谁拥有更多的计算资源,谁就能训练出更强大的模型,谁就能在AI的牌桌上占据主导地位。

这种“大力出奇迹”的模式,简单、直接,但也筑起了一道普通玩家难以逾越的资本高墙。然而,就在这场豪赌愈演愈烈之际,一个来自中国的团队——深度求索(DeepSeek AI),向业界展示了另一条路径,一条可能通往“普惠AI”的道路。他们的最新成果,不仅仅是一个技术突破,更像是一个深刻的经济信号,预示着AI产业的底层逻辑或许正在发生改变。

一、一个惊人的数字:成本直降99%

首先,让我们来看一组来自公开研究的关键数据。

在AI大模型领域,Meta的开源模型Llama系列一直是行业的重要标杆。训练一个像Llama 2 70B(700亿参数)这样的高质量模型,业内估计需要数千万美元的投入。

而DeepSeek团队公布了他们训练自家DeepSeek-V2模型的数据:他们以远低于主流模型的成本,训练出了一个综合性能可以与Llama 3 70B相媲美的模型。根据一些技术分析解读,其有效训练成本可能不到Llama 2 70B的1%

这是一个什么概念?

打个比方,如果说之前造一辆高性能跑车(顶级AI模型)的成本是2000万,现在有人用一种创新的生产线,花20万就造出了一辆性能不相上下的跑车。这对于整个汽车产业(AI产业)的冲击,无疑是颠覆性的。

w1.jpg

那么,DeepSeek是如何做到的?

二、技术解密:从“通才”到“专家委员会”的智慧

要理解DeepSeek的“省钱秘诀”,我们需要了解一个专业词汇:MoE(Mixture of Experts,专家混合模型)

别被这个名字吓到,它的原理非常直观。
    传统大模型:      像一个无所不知的“通才”博士。无论你问他天文学、历史还是编程,他都会调动大脑的全部知识储备来回答你。这样做虽然知识渊博,但每次思考都“全力以赴”,能量消耗巨大(计算成本高)。MoE模型:       则像一个“专家委员会”。这个委员会里有经济学家、物理学家、程序员、艺术家等多位专家。当一个关于经济的问题进来时,系统会智能地只激活“经济学家”这位专家来回答。其他专家则“待机休息”,不消耗能量。

DeepSeek-V2的创新之处在于,它设计了一套极为高效的“专家委员会”架构。在训练和推理(即模型工作)时,它只需要激活一小部分参数(比如15%),就能达到甚至超过传统模型100%参数全开的效果。

这就好比,你只需要支付一位专家的“出场费”,就能享受到整个顶级委员会的服务。 这种“稀疏激活”(Sparsely Activated)的机制,是其能够大幅降低训练和使用成本的核心所在。

三、经济学视角:AI产业的逻辑演进与“中国机遇”

DeepSeek的突破,为我们观察AI产业,乃至A股市场的相关板块,提供了一个全新的、超越“算力崇拜”的宏观视角。

1. 产业价值链的重心转移

过去,AI产业的逻辑链条相对简单:

旧逻辑: 雄厚资本 → 采购大量GPU(算力) → 训练出大模型 → 获得市场优势

在这个逻辑下,价值的重心高度集中在上游的芯片制造商(如英伟达)和中游的云服务巨头。

而DeepSeek所代表的新路径,则揭示了另一条逻辑链:

新逻辑: 算法创新 → 提升训练效率 → 用更少算力训练出强大模型 → 应用成本大幅降低 → 推动下游应用大爆发

在这个新逻辑下,算法和技术创新的价值被空前放大。它意味着,单纯的资本和硬件优势,不再是唯一的护城河。拥有顶尖算法能力的公司,可以用更少的资源实现“弯道超车”。

2. 对投资的启示:寻找“效率倍增器”

对于关注中国股市的投资者而言,这个变化提供了一个思考框架的转变。过去,市场的热点往往围绕着“算力概念股”,比如服务器、光模块、IDC(数据中心)等,逻辑是谁为“卖铲子”的生意供货。

而新逻辑的出现,提醒我们可以关注另外两类潜在的价值洼地:
    拥有高效模型训练能力的公司:      那些在算法、模型架构上有深度积累,能够实现“四两拨千斤”的AI技术公司,它们的长期价值可能被低估。下游应用层的“淘金者”:      当AI模型的使用成本从“奢侈品”变为“日用品”时,最大的受益者将是广大的应用层企业。无论是工业制造、生物医药、文创内容还是金融科技,谁能率先利用低成本、高性能的AI能力赋能自身业务,谁就可能迎来“戴维斯双击”(业绩与估值双提升)。



维度

旧有逻辑(算力为王)

新兴逻辑(效率致胜)

核心驱动力

资本投入、硬件规模

算法创新、技术效率

产业价值重心

上游硬件(GPU)、中游云平台

中游模型技术、下游应用场景

市场关注焦点

谁拥有更多算力资源?

谁能更高效地利用算力?谁的应用场景最先落地?

企业竞争优势

资金壁垒

技术壁垒、生态壁垒

超越内卷,奔向星辰大海

DeepSeek的探索,就像在一条拥挤的、靠“烧钱”开路的赛道旁边,开辟出了一条更智能、更高效的新航线。它向世界证明,AI的发展不只有“华山一条路”。

这场由算法效率驱动的变革,对于正在全力发展新质生产力的中国而言,意义尤为深远。它意味着我们可以不仅仅依赖硬件的追赶,更可以通过软件和算法的创新,在全球AI格局中找到独特的位置。
当AI的能力不再是少数巨头的“专利”,而是成为像水和电一样的基础设施时,一个由无数创新应用构成的“万亿级”市场才会真正开启。这,或许才是DeepSeek低成本训练背后,最激动人心的未来图景。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-9-20 12:35 , Processed in 0.107676 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表