本文作者:蓝狐工商代办

新报告估计DeepSeek硬件支出可能高达5亿美元

新报告估计DeepSeek硬件支出可能高达5亿美元摘要: ...

鞭牛士报道,2 月 1 日消息,据 CNBC 报道,中国的 DeepSeek 成为本周科技界最大的话题,许多业内人士和华尔街人士都关注一个数字:600 万美元。

微信号:MD80084
添加微信好友, 获取更多信息
复制微信号

DeepSeek 在关于其最新人工智能模型的论文中表示,DeepSeek 包含一个明确的警告,称该数字仅包括模型的官方训练,不包括与架构、算法或数据的先前研究和消融实验相关的成本。

本周早些时候,DeepSeek 的 AI Assistant 取代 OpenAI 的 ChatGPT,成为美国苹果应用商店下载次数最多的免费应用程序。全球科技股遭遇抛售,芯片制造商英伟达和博通周一总市值蒸发了 8000 亿美元。

半导体研究和咨询公司 SemiAnalysis 的一份新报告为 DeepSeek 的开支提供了更多背景信息。

该公司估计,DeepSeek 的硬件支出在公司历史上远高于 5 亿美元,并补充说研发成本和总拥有成本相当高。

SemiAnalysis 写道,为模型生成训练所需的合成数据需要大量的计算。

报道称,Anthropic 的 Claude 3.5 Sonnet 训练成本数千万美元,但指出 Anthropic 从亚马逊筹集了数十亿美元和谷歌,这表明运营这些模型和公司需要多少钱。

SemiAnalysis 表示:这是因为他们必须进行实验、提出新的架构、收集和清理数据、支付员工工资等等。

DeepSeek 自己的论文并未包含对其计算成本的估计。该公司没有立即回应置评请求。

SemiAnalysts 写道:需要明确的是,DeepSeek 的独特之处在于他们率先实现了这种成本和能力水平。

该公司补充说,DeepSeek 的 R1 是一个非常好的模型,并且如此迅速地赶上推理前沿确实令人印象深刻。

本周,专家和分析师对 DeepSeek 模型的质量大加赞赏,并指出考虑到美国 三年内三次限制对华芯片出口,该模型令人印象深刻。这引发了人们的担忧,即美国 在一个预计十年内收入将超过 1 万亿美元的 市场上落后于其主要对手 。

伯恩斯坦分析师在周一的一份报告中写道,根据我们(周末)看到的许多(偶尔歇斯底里的)热门言论,其影响范围从这真的很有趣到这是我们所知的人工智能基础设施综合体的丧钟。

DeepSeek 成立于 2023 年,创始人是专注于人工智能的量化对冲基金 High-Flyer 的联合创始人梁文峰。据报道,这家人工智能初创公司于 2023 年 4 月从对冲基金的人工智能研究部门中脱颖而出,专注于大型语言模型和通用人工智能(AGI)——人工智能的一个分支,它在广泛的任务上等同于或超越人类智力,OpenAI 和其他公司正在追求这一目标。

杰富瑞 ( Jefferies ) 分析师表示,DeepSeek 仍由 High-Flyer 全资拥有并获得资助。

本月初,DeepSeek 发布了 R1,该模型可与 OpenAI 的 o1 相媲美,由此引发的讨论开始升温。R1 是开源的,这意味着任何 AI 开发人员都可以使用它。

OpenAI 首席执行官 Sam Altman 公开称赞了该模型,但该公司也表示,有证据表明 DeepSeek 不正当地收集了 OpenAI 数据来构建其产品。

在周四由 OpenAI 于华盛顿特区举办的一场活动上,奥尔特曼表示,DeepSeek 显然是一个很棒的模型。

他说:这提醒我们竞争的水平以及人工智能获胜的必要性。

他说,这也表明了对推理的兴趣水平,对开源的兴趣水平。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,3人围观)参与讨论

还没有评论,来说两句吧...