热点分析-深圳市世纪海翔投资集团有限公司

新闻中心

News

联系我们

电话：86-755-82910368

传真：86-755-82910673

邮箱：sail-group@sail-group.com.cn

邮编：518001

精彩视频

Wonderful video
投诉与咨询

Complaints and advice
人才招聘

Recruitment

首页- 新闻中心- 热点分析

DeepSeek 21天估值翻5倍，资本在赌什么？

时间：26-05-25 来源：深维AI观

DeepSeek 21天估值翻5倍，资本在赌什么？

2026年5月，据多家媒体报道，国家大基金正在领投DeepSeek首轮融资。

21天前，这家公司的估值还停留在100亿美元左右。21天后，估值飙升至约515亿美元，折合人民币超3500亿。单轮融资目标500亿人民币。

国家大基金领投，腾讯等多家公司在洽谈入股。这配置，AI圈头一回见。

你说DeepSeek强不强？强。但它值3500亿人民币吗？

（截至发稿，DeepSeek及梁文锋未对上述融资消息作出官方回应。以下分析基于公开报道和技术资料。）

先说说这钱从哪来。国家大基金投什么，从来不看哪个赛道热。半导体投过，新能源投过，现在轮到AI。腾讯等公司在洽谈入股也好理解，手握12亿微信月活，缺的就是底层大模型能力。

但关键是速度。21天，估值从100亿美元飙到515亿美元。据媒体报道，所有流程被压缩到了极限。

不是DeepSeek找钱，是钱在找DeepSeek。晚一天可能就挤不进去了。

—— 接近交易的投资人（据媒体报道）

资本怕什么？怕错过。那DeepSeek到底做了什么，让资本这么疯狂？

2024年12月26日，V3模型发布。据DeepSeek官方技术报告，训练成本557.6万美元。

我再说一遍，557.6万美元。

Meta训练Llama 3花了数亿美元，GPT-4据外界估算超1亿美元。DeepSeek用不到600万，训练出接近GPT-4水平的模型。

怎么做到的？V3用了MoE架构。简单说，模型总参数量大，但每次推理只激活一小部分"专家"。就像200人的公司，财务问题只叫财务部5个人开会，不是全员到齐。

AI技术

DeepSeek的技术突破引发全球关注

MoE不是新概念。DeepSeek真正狠的是工程优化，解决了MoE长期存在的"专家崩塌"问题，让每分算力都花在刀刃上。

更狠的是开源。V3发布当天，模型权重和技术报告全公开，扔Hugging Face上谁都能下。团队内部争议很大，"花这么多钱训练的模型，凭什么白送？"

开源不是做慈善，是建护城河。

—— 梁文锋，DeepSeek创始人

梁文锋的逻辑是：模型能力差距在快速缩小，未来壁垒不在模型本身，在生态。谁的开发者多，应用场景丰富、社区活跃，谁才能活到最后。V3发布后一个月，Hugging Face下载量破百万，GitHub涌现大量开源项目。生态确实在长。

除了MoE，DeepSeek还有一张底牌：MLA架构。

传统Transformer里，注意力机制的显存占用跟上下文长度成正比。上下文越长，显存吃得越猛。很多大模型处理长文本时要么卡死，要么报错，显存不够了。

MLA把KV缓存压缩到低维潜在空间。效果是在几乎不损失能力的前提下，显存占用大幅降低。翻译成大白话：原来8张A100才能跑的模型，现在2张就够了。

75%

部署成本降幅。对于企业客户来说，这意味着部署成本直接降了四分之三。

在算力受限的中国市场，这意味着你不用像美国公司那样疯狂堆GPU，也能做出足够强的大模型。这不是弯道超车，是换了一条赛道跑。

聊完技术，回到那个问题：为什么是21天？

V3发布前，资本市场对中国大模型的认知是"差一代"。能力追不上GPT-4，成本也没低多少，靠本地化服务和政策保护活着。V3发布后，这个叙事被打破了。

技术社区反应最快。Hugging Face首周下载破百万，GitHub衍生项目雨后春笋。Reddit的r/LocalLLaMA板块，连续三天热帖都是V3。

企业客户跟进。V3发布后，大量企业主动接洽DeepSeek，其中不少是跨国公司。他们之前只用OpenAI和Anthropic的模型，第一次认真考虑中国大模型。

资本市场最后反应过来。技术突破被验证，商业化路径清晰，估值重估顺理成章。那21天，本质上是一场抢跑。国家大基金抢布局，腾讯等公司抢合作，其他机构怕上不了车。

投的不是3500亿的 DeepSeek，赌的是两年后的万亿级。

—— 参与融资洽谈的投资人（据媒体报道）

这话听着像VC标准话术，但这次赌注确实比往常大得多。因为DeepSeek走了一条新路。

过去几年中国AI主要走两条路。一条是跟随者路线，OpenAI做什么我们做什么，永远追赶。一条是应用层路线，不做基础模型做上层应用，但基础模型每迭代一次，应用层护城河就被冲薄一次。

DeepSeek走的是第三条路：在基础模型层面做差异化创新，用架构优化和工程能力弥补算力差距，用开源生态建护城河。

DeepSeek架构

DeepSeek代表中国AI走出差异化路线

这条路能不能走通？现在下结论还太早。但至少证明了一件事：中国AI不需要模仿美国。不是不想，是模仿不了，也没必要。芯片受限，资金规模有差距，在这些约束下，DeepSeek找到了用更少资源做出更强模型的路。

这比任何估值数字都重要。

当然，3500亿人民币估值听着风光，真正的考验现在才刚开始。

老话说得好，估值是纸上的数字，现金流才是命。DeepSeek面前至少有四道坎：技术层面V3与GPT-4o仍有差距；商业层面开源变现模式未验证；竞争层面大厂不会坐视；地缘政治层面监管压力只会增不会减。

梁文锋在内部说过一句话：我们要做的不是中国的 OpenAI，是世界的DeepSeek。这话有底气，也有风险。底气来自技术路线差异化。风险在于，世界的DeepSeek需要面对的，远不止技术挑战。

21天，100亿美元到515亿美元。

数字背后是中国AI行业一次路线切换。当算力不再是唯一硬通货，当开源生态成为新护城河，当国家队和产业资本开始联手下注，游戏规则正在被改写。

DeepSeek最终能不能成为下一个巨头？没人知道。但它至少证明了一件事：在这场AI长跑里，中国公司有机会找到自己的节奏，而不是一直跟着别人的步子跑。

这才是这轮融资，真正值钱的地方。

源自--深维AI观

上一篇	下一篇
市场在狠狠惩罚不豪赌AI的投资人	没有上一篇