DeepSeek，从追赶者到追杀者

蓝狐工商代办昨天 6 抢沙发

默认

摘要： ...

微信号：MD80086
添加微信好友, 获取更多信息
复制微信号

本文来自微信公众号：未尽研究（ID：Weijin_Research），作者：未尽研究，题图来源：视觉中国

当美国用户涌入一款便宜、好用的推理大模型后，华尔街对 AI 的狂热瞬间变为恐慌。一夜之间，英伟达市值跌去 6000 亿美元，创下美国公司最大单日跌幅历史纪录。

DeepSeek 从追赶者变成了追杀者，将中国与美国这一轮 AI 上的差距，从两三年缩短至不足两三个月。硅谷巨头们都感受到了背后越来越近的杀气。应用、大模型与算力的叙事逻辑正在改写。

OpenAI 难逃 " 创新者的困境 "。就算它每一步都没做错，仍然面临被技术更灵活、价格更低廉的对手颠覆的可能。英伟达证实，DeepSeek 使用的 GPU 完全符合出口标准，否认了 ScaleAI 的 5 万张 H100 的说法。

去年圣诞节前，OpenAI 刚展示了 o3，DeepSeek 就在一个月后推出了 R1，迅速逼得前者的 mini 版本免费。奥特曼在社交媒体平台上吹嘘自己刚发布的智能体 Operator，底下都是追问 DeepSeek 的——硅谷的心智正在改变。

OpenAI、DeepMind 与 Anthropic 都着力于原始创新阶段，需要基础研发更大比重的支出，早期的持续探索和反复试错，失败率很高。追赶者则享受着算力通缩、路径复现的红利。但是，算力是资源，也就带有资源的诅咒。OpenAl 已经习惯于堆叠算力的 " 暴力美学 "，正式发布下一代基础模型一再延期，已经让市场陷入焦虑。

DeepSeek 无限逼近，让开源模型和闭源模型一样好，并且效率还更高，让更多企业可以用少于以往十分之一的成本构筑应用，给了创新者越来越大的商品化压力。

一般来说，创新者以更高的成本，获得技术的先发优势，就会推出差异性的产品，在一段时间内获得市场垄断优势，以补偿其创新的成本并获得超额利润。但 AI 领域激烈的竞争，追赶者快速逼近甚至实现反超，把领先的创新者逼入越来越短的时间与越来越窄的空间，它们很快被追赶者替代，付出的十倍于追赶者的成本最终可能无法挽回地沉没。

用户声称正在无缝切换至 DeepSeek 的移动应用；AMD 已经把 DeepSeek-V3 集成到 MI300X 上；Perplexity 也将 DeepSeek-R1 引入了搜索。

但 DeepSeek 只是证明了另一条途径是可行的，并没有否认 OpenAl 的路径不再会量变引发新的质变。算力长期以来都是硅谷创新 " 苦涩的教训 "。无论是 OpenAI，还是 DeepSeek，大概率手中还握有更大的底牌。DeepSeek 昨晚趁势开源了多模态的 Janus-Pro，击败了 OpenAI 的 DALL-E 3 和 Stable Diffusion，又逼了 OpenAI 一把。

DeepSeek 在 2025 年的第一个月，以一种颠覆性的方式为行业定义了全年的重要创新方向。推理模型的竞争已经提前打响，推理侧的训练和计算，以及更集约的算法，正在重新定义下一代大模型。

DeepSeek 的创新，是中国创新的写照。它采用的混合专家模型（MoE）、多头潜注意力（MLA）、多令牌预测（MTP）、长链式推理（CoT）、DualPipe 算法等设计；依赖强化学习（RL）而不加入监督微调（SFT）的训练尝试；在数据精度（FP8 混合精度）、底层通信等方面优化，都不是从 0 到 1 的创新。但 DeepSeek 通过这些技术重新组合、进化，形成了一整套从底层创新到最终产品的 " 中间技术 "。

DeepSeek 的成功，为中国企业在算力约束下开辟自己的技术路线定下了基调。蒸馏可以走很长的路，纯粹的强化学习也正在重新吸引研究者。分布广泛的高质量数据、相对轻量的推理模型、丰富的实体经济场景，都更有利于中国产业 +AI 的创新。AI 企业创新和应用，将出现中国范式。中国企业在 AI 的全球扩散中将发挥更重要的作用，中国的 AI 行业的创新价值，也值得在今年重估。

在算力储备富裕的情况下，开源的更集约的探索路线，也意味着更为多元的发散的创新。美国高校与研究者已经将 DeepSeek 视为新的研究对象。向更高效的路线投入更多算力，意味着抬高了原以为即将触及的天花板，还有可能把下一代模型的能力，再往上提升一个数量级。在这个意义上，中国也仍将追求更强大的算力硬件的自主。

苹果是昨晚少数市值收涨的美国科技巨头。更小的参数规模，更低精度的推理，显著降低了算力与内存需求，使得端侧推理更加可行；而苹果拥有最好的硬件，最完善的应用生态，并对引入大模型服务持开放态度。其他美国巨头将不得不应对来自中国的价格战。

杰文斯悖论将主导下一阶段的 AI 叙事。尽管在短期内，DeepSeek 的效率和广泛可用性，给英伟达最乐观的增长前景带来了严重的质疑，但英特尔前 CEO 基辛格、微软 CEO 纳德拉，都重提了英国工业革命期间的经济学家杰文斯的发现：当煤炭的使用效率不断提升时，对煤炭的需求不仅没有下降，反而在煤炭的应用和相关领域产生了大量的创新，渗透到各行各业，导致煤炭的消耗量上升。杰斯悖论在能源电力领域得到了完全的验证，长期来看，在 AI 与算力领域也将重演。

在加速计算逐步占据主流的深度学习 " 黄金 10 年 "，GPU 的效率提升了千倍。但智能算力的需求在绝对数量和相对占比的意义上，不但没有减少，反而在加速增长，每个季度翻番。在 DeepSeek 之前，它是训练需求推动的，大型智算集群不断涌现；之后，将是推理需求推动的，海量应用即将涌现。如果考虑到未来的物理 AI，世界对于算力的需求几乎是无限的。

从长期来自，DeepSeek 的创新，正是推动了 AI 计算成本的下降，每秒处理更多的 tokens，单位成本、单位能耗能产生更多的 Flops；它降低了 AI 技术门槛，会加快 AI 应用的涌现，也会让更多的行业采纳 AI。

但算力长期增长的市场逻辑，不一定能支撑着芯片企业中短期内的估值逻辑。英伟达从去年底开始就面临前所未有的竞争威胁，当前股价暗示的增长轨迹不断承压，终于在 DeepSeek 冲击下，市场开始抛售这种不确定性。当市场利润的大部分从流入芯片转向流入应用，供需关系的逆转也将反映在利润率之上。这是 AI 创新进入应用阶段的标志性事件。

每个人都在接受这样一种观念：一场全球竞赛正在发生，我们不能输掉它。在地缘竞争的催化下，DeepSeek 在美国的硅谷与华尔街引发强震，余震也已经传导至华盛顿。

上周，达沃斯论坛的共识是，美国在人工智能全球竞争上的最大问题是，是否有足够的承包商来建设高达 5000 亿美元的星际之门计划这样庞大的项目；今天，特朗普在佛罗里达州说，DeepSeek 带来的变化是积极的，为美国敲响了警钟，需要专注于竞争以赢得胜利。

文章版权及转载声明

作者:蓝狐工商代办本文地址：http://daiban08.com/post/50416.html发布于昨天
文章转载或复制请以超链接形式并注明出处宜春市宿贝商贸有限公司_电商代办营业执照_代办工商营业执照注册_电商营业执照代办_个体工商户营业执照代办

打赏