AI产品经理如何理解deepseek爆火?
作者:微信文章春节期间读了《深度学习革命》,集中的回顾了深度学习过去几十年发展的历史。惊奇的发现,自从2012年起多少也被卷入了深度学习革命中。
本科毕业论文是通过模式识别算法识别手势;硕士毕业后,短暂的C端产品经历,接触到了深度学习在内容推荐领域的应用;之后的工作直接加入到AI浪潮中,直至今日都是在做将AI应用到更多场景和领域的工作。
不得不感慨,硕士毕业时当时遗憾错过移动互联网最高速增长期,而在同时一直都在AI革命的全球化浪潮中。Deepseek爆火无疑是将在「深度学习革命」历史中浓墨重彩的一笔,本篇探讨下deepseek带来的影响。
眼花缭乱
春节假期早早回老家了几天,在每天应酬中,逐步发现deepseek发布扩散和影响越来越大。deepseek-v3发布同时上线app和web端,并且宣称比肩OpenAI-O3推理模型,同时训练成本只是友商的N分之一。
很快引发了全球讨论,尤其是训练成本的降低,促使全球开发者和投资人开始思考,之前靠堆算力推进AI技术发展的逻辑是否不成立了。进一步带来的影响是,投资者判断未来对GPU算力需求可能缩减,这直接造成垄断GPU 90%以上市场的英伟达股价应声下跌20%。
随着微软、谷歌、亚马逊三大云厂商财报的发布,云计算业务增长不及预期,低训练成本方案可能也会带来潜在算力需求下降,三大云厂商股价也出现不同程度的下跌,尤其是谷歌主营搜索业务有被颠覆的风险,股价下跌更加剧烈。
在此之前,特朗普上任总统后,计划推进美国AI革命的「星际之门」计划,继续推进堆算力保障美国AI竞争力的范式,deepseek新方案的出现无疑对星际之门计划造成打击。美国各界也从起初认为deepseek有抄袭或违规蒸馏问题,到承认deepseek成果令人印象深刻,美国云厂商和硬件厂商争先上架支持deepseek。
与朋友交流,春节假期前后的日子不过十天左右,但仿佛过去了很久。并且由于deepseek成果出现在中国,在国内影响和传播范围远大于前年chatgpt。
一缕微光
这一轮大模型革命,起于OpenAI发布的chatgpt,之后meta、谷歌等公司发布各自大模型,其中meta的llama开源生态战略促进了大模型技术的广泛传播,大模型领域原始创新和引领都掌握在美国企业手中,中国更多扮演的是追随者的角色,国内开发者也习惯了美国有突破,我们做应用的分工。
借助技术上的先发优势,美国企业逐步通过宣扬scaling Law(规模法则)的大模型创新逻辑,通过海量资本投入逐步构建起技术壁垒。
大模型训练和推理的海量算力需求,带动了从CPU到GPU的算力革命。去年参观某国内超算中心,超算运营方表示他们花了十几年规划和建设超算中心,如今建成后,算力的范式变了,让他们备感尴尬。海量算力需求促进了英伟达的垄断地位。
AI技术进步,带动了B端和C端应用企业的进一步发展,微软、谷歌、亚马逊、meta、特斯拉、salesforce都受到了不同程度的AI价值加持。美股七姐们以及一众美国企业,受益于硬件、模型、应用组成的成体系的AI革命影响,股价不断走高,并且形成螺旋上升的趋势。
deepseek在性能比肩OpenAI的前提下,训练成本更低,带动API定价也可以更低。深扒deepseek技术逻辑,R1和R1-zero尝试了不经过监督微调,更多尝试强化学习方案,这种方案可以有效降低过去监督微调只给大模型正样本造成的幻觉问题。deepseek也尝试了绕过英伟达cuda生态从更底层对硬件使用效率做了优化。
不难看出,deepseek没有太多理论上的创新,更多是从工程实践的创新,从而引领了全球低成本训练高性能模型的浪潮,但这在AI过往历史中已经实现了0的突破,产生了广泛的影响,带来了一缕微光。
影响发酵
deepseek的爆火打破了过往由美国主导的通过搞巨额投资堆算力的AI研发模式,微软、谷歌仍然延续高数据中心投入,投资人用脚投票体现在股价下跌上。
性价比与开源策略,对OpenAI商业模式构成严重打击。OpenAI当年成立初衷是为了避免大公司对AI垄断,如今屠龙少年已变成恶龙,靠着技术领先性和闭源,构建商业模式。deepseek的出现,导致OpenAI高定价不可持续,chatgpt用户也出现了转移,进而也会促使投资重估OpenAI的护城河和合理估值。
deepseek的爆火,让业界人们发现,OpenAI领先了几年,会因为更加有优势的技术出现,而出现用户与客户转移问题,在技术进步面前,单纯的基于大模型的API或工具应用,很难谈壁垒和护城河,进一步来讲,商业模式构建更具挑战。
在一定资金、人才、算力情况下,追寻AGI、探索技术最前沿的路上,deepseek之前没有世界级的大佬,而是很多应届生和实习生。让很多企业开始思考,AI创新是否需要引入成名的专家,而不是更具创意和拼劲的年轻人。
对于大模型赛道,如果做不出世界top级的成果,跟随投入的意义不是很大,去年底大模型五小龙有几家已经放弃了训练基模。技术一直在快速迭代,给大模型训练从业者带来的压力是,如果做不出世界级的成果就算失败。
深度学习革命历史上,有无数从业者对标人脑在做研究和追寻AGI。假期虽然被deepseek亮眼的成果震撼,但从第一性原理思考,人脑只需要很低的功率训练和推理,未来追寻AGI的星辰大海仍然广阔。
「产品经理读书会」
专注于爱读书爱思考的产品人提供读书推荐、产品思考、以书会友的环境
欢迎爱读书的产品人分享产品道路上的感悟
欢迎关注公众号:产品经理读书会
https://mmbiz.qpic.cn/mmbiz_jpg/XZicHk2KASRicEpyCXAfic5O5W3KRwaxX6yel9wsxFCWNbicqrAPicTtg8Z6XB9c3Z1sjKjbtXEyHMRXToFia0nibGzgQ/640?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp
长按二维码关注我们
改变世界
页:
[1]