新闻中心
News
联系我们
 

电 话:86-755-82910368

传 真:86-755-82910673

邮 箱:sail-group@sail-group.com.cn

邮 编:518001

DeepSeek 21天估值翻5倍,资本在赌什么?

时间:26-05-25 来源:深维AI观

DeepSeek 21天估值翻5倍,资本在赌什么?

2026年5月,据多家媒体报道,国家大基金正在领投DeepSeek首轮融资。

21天前,这家公司的估值还停留在100亿美元左右。21天后,估值飙升至约515亿美元,折合人民币超3500亿。单轮融资目标500亿人民币。

国家大基金领投,腾讯等多家公司在洽谈入股。这配置,AI圈头一回见。

你说DeepSeek强不强?强。但它值3500亿人民币吗?

(截至发稿,DeepSeek及梁文锋未对上述融资消息作出官方回应。以下分析基于公开报道和技术资料。)

先说说这钱从哪来。国家大基金投什么,从来不看哪个赛道热。半导体投过,新能源投过,现在轮到AI。腾讯等公司在洽谈入股也好理解,手握12亿微信月活,缺的就是底层大模型能力。

但关键是速度。21天,估值从100亿美元飙到515亿美元。据媒体报道,所有流程被压缩到了极限。

不是DeepSeek找钱,是钱在找DeepSeek。晚一天可能就挤不进去了。

—— 接近交易的投资人(据媒体报道)

资本怕什么?怕错过。那DeepSeek到底做了什么,让资本这么疯狂?

2024年12月26日,V3模型发布。据DeepSeek官方技术报告,训练成本557.6万美元。

我再说一遍,557.6万美元。

Meta训练Llama 3花了数亿美元,GPT-4据外界估算超1亿美元。DeepSeek用不到600万,训练出接近GPT-4水平的模型。

怎么做到的?V3用了MoE架构。简单说,模型总参数量大,但每次推理只激活一小部分"专家"。就像200人的公司,财务问题只叫财务部5个人开会,不是全员到齐。

AI技术

DeepSeek的技术突破引发全球关注

MoE不是新概念。DeepSeek真正狠的是工程优化,解决了MoE长期存在的"专家崩塌"问题,让每分算力都花在刀刃上。

更狠的是开源。V3发布当天,模型权重和技术报告全公开,扔Hugging Face上谁都能下。团队内部争议很大,"花这么多钱训练的模型,凭什么白送?"

开源不是做慈善,是建护城河。

—— 梁文锋,DeepSeek创始人

梁文锋的逻辑是:模型能力差距在快速缩小,未来壁垒不在模型本身,在生态。谁的开发者多,应用场景丰富、社区活跃,谁才能活到最后。V3发布后一个月,Hugging Face下载量破百万,GitHub涌现大量开源项目。生态确实在长。

除了MoE,DeepSeek还有一张底牌:MLA架构。

传统Transformer里,注意力机制的显存占用跟上下文长度成正比。上下文越长,显存吃得越猛。很多大模型处理长文本时要么卡死,要么报错,显存不够了。

MLA把KV缓存压缩到低维潜在空间。效果是在几乎不损失能力的前提下,显存占用大幅降低。翻译成大白话:原来8张A100才能跑的模型,现在2张就够了。

75%

部署成本降幅。对于企业客户来说,这意味着部署成本直接降了四分之三。

在算力受限的中国市场,这意味着你不用像美国公司那样疯狂堆GPU,也能做出足够强的大模型。这不是弯道超车,是换了一条赛道跑。

聊完技术,回到那个问题:为什么是21天?

V3发布前,资本市场对中国大模型的认知是"差一代"。能力追不上GPT-4,成本也没低多少,靠本地化服务和政策保护活着。V3发布后,这个叙事被打破了。

技术社区反应最快。Hugging Face首周下载破百万,GitHub衍生项目雨后春笋。Reddit的r/LocalLLaMA板块,连续三天热帖都是V3。

企业客户跟进。V3发布后,大量企业主动接洽DeepSeek,其中不少是跨国公司。他们之前只用OpenAI和Anthropic的模型,第一次认真考虑中国大模型。

资本市场最后反应过来。技术突破被验证,商业化路径清晰,估值重估顺理成章。那21天,本质上是一场抢跑。国家大基金抢布局,腾讯等公司抢合作,其他机构怕上不了车。

投的不是3500亿的 DeepSeek,赌的是两年后的万亿级。

—— 参与融资洽谈的投资人(据媒体报道)

这话听着像VC标准话术,但这次赌注确实比往常大得多。因为DeepSeek走了一条新路。

过去几年中国AI主要走两条路。一条是跟随者路线,OpenAI做什么我们做什么,永远追赶。一条是应用层路线,不做基础模型做上层应用,但基础模型每迭代一次,应用层护城河就被冲薄一次。

DeepSeek走的是第三条路:在基础模型层面做差异化创新,用架构优化和工程能力弥补算力差距,用开源生态建护城河。

DeepSeek架构

DeepSeek代表中国AI走出差异化路线

这条路能不能走通?现在下结论还太早。但至少证明了一件事:中国AI不需要模仿美国。不是不想,是模仿不了,也没必要。芯片受限,资金规模有差距,在这些约束下,DeepSeek找到了用更少资源做出更强模型的路。

这比任何估值数字都重要。

当然,3500亿人民币估值听着风光,真正的考验现在才刚开始。

老话说得好,估值是纸上的数字,现金流才是命。DeepSeek面前至少有四道坎:技术层面V3与GPT-4o仍有差距;商业层面开源变现模式未验证;竞争层面大厂不会坐视;地缘政治层面监管压力只会增不会减。

梁文锋在内部说过一句话:我们要做的不是中国的 OpenAI,是世界的DeepSeek。这话有底气,也有风险。底气来自技术路线差异化。风险在于,世界的DeepSeek需要面对的,远不止技术挑战。

21天,100亿美元到515亿美元。

数字背后是中国AI行业一次路线切换。当算力不再是唯一硬通货,当开源生态成为新护城河,当国家队和产业资本开始联手下注,游戏规则正在被改写。

DeepSeek最终能不能成为下一个巨头?没人知道。但它至少证明了一件事:在这场AI长跑里,中国公司有机会找到自己的节奏,而不是一直跟着别人的步子跑。

这才是这轮融资,真正值钱的地方。

源自--深维AI

   
上一篇 下一篇
市场在狠狠惩罚不豪赌AI的投资人没有上一篇