DeepSeek 21天估值翻5倍,资本在赌什么?
时间:26-05-25 来源:深维AI观
DeepSeek 21天估值翻5倍,资本在赌什么?
2026年5月,据多家媒体报道,国家大基金正在领投DeepSeek首轮融资。
21天前,这家公司的估值还停留在100亿美元左右。21天后,估值飙升至约515亿美元,折合人民币超3500亿。单轮融资目标500亿人民币。
国家大基金领投,腾讯等多家公司在洽谈入股。这配置,AI圈头一回见。
你说DeepSeek强不强?强。但它值3500亿人民币吗?
(截至发稿,DeepSeek及梁文锋未对上述融资消息作出官方回应。以下分析基于公开报道和技术资料。)

先说说这钱从哪来。国家大基金投什么,从来不看哪个赛道热。半导体投过,新能源投过,现在轮到AI。腾讯等公司在洽谈入股也好理解,手握12亿微信月活,缺的就是底层大模型能力。
但关键是速度。21天,估值从100亿美元飙到515亿美元。据媒体报道,所有流程被压缩到了极限。
不是DeepSeek找钱,是钱在找DeepSeek。晚一天可能就挤不进去了。
—— 接近交易的投资人(据媒体报道)
资本怕什么?怕错过。那DeepSeek到底做了什么,让资本这么疯狂?
2024年12月26日,V3模型发布。据DeepSeek官方技术报告,训练成本557.6万美元。
我再说一遍,557.6万美元。

Meta训练Llama 3花了数亿美元,GPT-4据外界估算超1亿美元。DeepSeek用不到600万,训练出接近GPT-4水平的模型。
怎么做到的?V3用了MoE架构。简单说,模型总参数量大,但每次推理只激活一小部分"专家"。就像200人的公司,财务问题只叫财务部5个人开会,不是全员到齐。
AI技术
DeepSeek的技术突破引发全球关注
MoE不是新概念。DeepSeek真正狠的是工程优化,解决了MoE长期存在的"专家崩塌"问题,让每分算力都花在刀刃上。
更狠的是开源。V3发布当天,模型权重和技术报告全公开,扔Hugging Face上谁都能下。团队内部争议很大,"花这么多钱训练的模型,凭什么白送?"
开源不是做慈善,是建护城河。
—— 梁文锋,DeepSeek创始人
梁文锋的逻辑是:模型能力差距在快速缩小,未来壁垒不在模型本身,在生态。谁的开发者多,应用场景丰富、社区活跃,谁才能活到最后。V3发布后一个月,Hugging Face下载量破百万,GitHub涌现大量开源项目。生态确实在长。
除了MoE,DeepSeek还有一张底牌:MLA架构。
传统Transformer里,注意力机制的显存占用跟上下文长度成正比。上下文越长,显存吃得越猛。很多大模型处理长文本时要么卡死,要么报错,显存不够了。
MLA把KV缓存压缩到低维潜在空间。效果是在几乎不损失能力的前提下,显存占用大幅降低。翻译成大白话:原来8张A100才能跑的模型,现在2张就够了。
75%
部署成本降幅。对于企业客户来说,这意味着部署成本直接降了四分之三。
在算力受限的中国市场,这意味着你不用像美国公司那样疯狂堆GPU,也能做出足够强的大模型。这不是弯道超车,是换了一条赛道跑。
聊完技术,回到那个问题:为什么是21天?
V3发布前,资本市场对中国大模型的认知是"差一代"。能力追不上GPT-4,成本也没低多少,靠本地化服务和政策保护活着。V3发布后,这个叙事被打破了。
技术社区反应最快。Hugging Face首周下载破百万,GitHub衍生项目雨后春笋。Reddit的r/LocalLLaMA板块,连续三天热帖都是V3。
企业客户跟进。V3发布后,大量企业主动接洽DeepSeek,其中不少是跨国公司。他们之前只用OpenAI和Anthropic的模型,第一次认真考虑中国大模型。
资本市场最后反应过来。技术突破被验证,商业化路径清晰,估值重估顺理成章。那21天,本质上是一场抢跑。国家大基金抢布局,腾讯等公司抢合作,其他机构怕上不了车。
投的不是3500亿的 DeepSeek,赌的是两年后的万亿级。
—— 参与融资洽谈的投资人(据媒体报道)
这话听着像VC标准话术,但这次赌注确实比往常大得多。因为DeepSeek走了一条新路。
过去几年中国AI主要走两条路。一条是跟随者路线,OpenAI做什么我们做什么,永远追赶。一条是应用层路线,不做基础模型做上层应用,但基础模型每迭代一次,应用层护城河就被冲薄一次。
DeepSeek走的是第三条路:在基础模型层面做差异化创新,用架构优化和工程能力弥补算力差距,用开源生态建护城河。
DeepSeek架构
DeepSeek代表中国AI走出差异化路线
这条路能不能走通?现在下结论还太早。但至少证明了一件事:中国AI不需要模仿美国。不是不想,是模仿不了,也没必要。芯片受限,资金规模有差距,在这些约束下,DeepSeek找到了用更少资源做出更强模型的路。
这比任何估值数字都重要。
当然,3500亿人民币估值听着风光,真正的考验现在才刚开始。
老话说得好,估值是纸上的数字,现金流才是命。DeepSeek面前至少有四道坎:技术层面V3与GPT-4o仍有差距;商业层面开源变现模式未验证;竞争层面大厂不会坐视;地缘政治层面监管压力只会增不会减。
梁文锋在内部说过一句话:我们要做的不是中国的 OpenAI,是世界的DeepSeek。这话有底气,也有风险。底气来自技术路线差异化。风险在于,世界的DeepSeek需要面对的,远不止技术挑战。
21天,100亿美元到515亿美元。
数字背后是中国AI行业一次路线切换。当算力不再是唯一硬通货,当开源生态成为新护城河,当国家队和产业资本开始联手下注,游戏规则正在被改写。
DeepSeek最终能不能成为下一个巨头?没人知道。但它至少证明了一件事:在这场AI长跑里,中国公司有机会找到自己的节奏,而不是一直跟着别人的步子跑。
这才是这轮融资,真正值钱的地方。
源自--深维AI观
| 上一篇 | 下一篇 |
|---|---|
| 市场在狠狠惩罚不豪赌AI的投资人 | 没有上一篇 |