昨天写了 V4 私有化部署的云实例 TCO 测算,后台炸了一波消息——
「我们不想租云,我们想直接买断 GPU 服务器,自己放机房。能不能算算买断要多少钱?」
行,今天就把买断这条路掰开算。
国内能买到的高端推理 GPU 只有 H20——我拿到了浪潮两款主力机型的渠道报价,价格和配置表都整理好了,直接取用。

一、为什么是 H20?没得选
先回答一个绕不开的问题:为什么不直接买 H100?
答案很残酷:买不到。 H100、H200 受美国对华出口管制限制,国内正规渠道根本采购不了。灰色渠道风险极高,企业级部署不可能赌在这上面。
目前国内能稳定采购、有正规渠道支持、能开票能售后的 NVIDIA 高端推理 GPU,就是 H20。 没有第二个选项。
H20 有两个显存版本:141GB(HBM3e)和 96GB(HBM3)。 前者单卡贵但显存充裕,后者性价比高但显存略紧。这两个版本分别对应了浪潮的两款主力服务器。
二、两套方案:高配 vs 标配,我都拿到了渠道报价
我从渠道拿到了 2026 年 4 月的最新报价,以下均为每台(8 卡配置)的买断单价:

方案一:浪潮 NF5688M7(高配)
| 组件 | 配置 |
|---|---|
| GPU | H20 141G × 8 卡 |
| 总显存 | 1,128 GB/台 |
| CPU | 8558P × 2 |
| 内存 | 64G × 32(2,048 GB) |
| 系统盘 | 960G × 2 |
| 数据盘 | 3.84T U.2 × 2 |
| 网络 | 25Gbps 2Port |
| 买断价 | ¥240万/台(需预付全款) |
方案二:浪潮 NF5688G7(标配)
| 组件 | 配置 |
|---|---|
| GPU | H20 96G × 8 卡 |
| 总显存 | 768 GB/台 |
| CPU | 8480+ × 2 |
| 内存 | 64G_4800 × 16(1,024 GB) |
| 系统盘 | SSD 960G × 1 |
| 网络 | 10G 2P X710 MM |
| 买断价 | ¥190万/台(现货) |
两个关键差异: M7 的显存比 G7 多出 360GB(+47%),单价贵 50 万。但 G7 的好处是——现货可发,不用等。
三、模型适配:V4-Flash 一台够,V4-Pro 四台起步
买多少台服务器,取决于你要跑哪个模型:
| 模型 | 所需显存 | NF5688M7(1,128GB/台) | NF5688G7(768GB/台) |
|---|---|---|---|
| V4-Flash(284B) | ~250 GB | ✅ 1台即可 | ✅ 1台即可 |
| V4-Pro(1.6T) | ~1,300 GB | ✅ 4台(4,512GB) | ✅ 4台(3,072GB) |
V4-Flash 只需约 250GB 显存,两套方案任选一台都绰绰有余。 这是买断最划算的选择——190 万买一台 NF5688G7,768GB 显存跑 V4-Flash,还剩 500 多 GB 余量给 KV Cache 和并发。
V4-Pro 则需要 4 台起步,显存需求约 1,300GB。M7 方案总显存 4,512GB 余量更大,G7 方案 3,072GB 也刚好够用。

四、V4-Pro 买断总价:760 万 vs 960 万
这是大家最关心的数字——部署 V4-Pro 1.6T 需要 4 台服务器,两套方案总价差 200 万:

| 方案 | 单台价格 | 服务器数量 | 部署总价 |
|---|---|---|---|
| NF5688M7 × 4 | ¥240万 | 4台 | ¥960万 |
| NF5688G7 × 4 | ¥190万 | 4台 | ¥760万 |
| 总价差 | ¥50万/台 | — | ¥200万(省21%) |
200 万的差价,核心区别只在 GPU 显存版本:141G vs 96G。 对于跑 V4-Pro 来说,G7 的 3,072GB 总显存够用,M7 的 4,512GB 是”富余量”。除非你计划未来在同一集群上跑更大的模型或需要更高的并发吞吐,否则 G7 方案性价比明显更高。
五、选型建议:我的判断
算完这笔账,我的建议很明确:
大多数企业 → 选 NF5688G7。 ¥190万/台,性价比首选。768GB 显存跑 V4-Flash 绰绰有余,4 台跑 V4-Pro 也没问题。现货可发,没有等待周期。
预算充足、追求极致性能 → 选 NF5688M7。 ¥240万/台,1,128GB 显存为更大模型和更高并发预留了充足空间。25Gbps 高速网络适合多机组网。但需要预付全款。
如果你只想跑 V4-Flash——190 万买一台 G7 就完事了。 一台机器、一个模型、一次买断,数据永远不出你的机房。

六、买断 vs 云租赁:到底选哪条路?
很多人会问:买断服务器和租云实例,到底哪个划算?
我的逻辑很简单:
| 维度 | 买断 | 云租赁 |
|---|---|---|
| 一次性投入 | 高(190-960万) | 低(月付) |
| 长期成本 | 可控(硬件折旧) | 持续累加 |
| 数据主权 | 完全私有 | 依赖云厂商 |
| 灵活性 | 低(固定配置) | 高(弹性扩缩) |
| 运维 | 自建团队 | 厂商托管 |
金融、政务、医疗等对数据主权有硬要求的行业——买断是唯一选择。 数据不出机房,审计可追溯,合规无死角。
初创公司、业务量波动大的场景——云租赁更灵活。 先用 API 验证商业模式,跑通了再考虑买断。
最优解仍然是混合策略: 核心数据走买断服务器(V4-Flash 私有化),峰值负载和复杂推理调 V4-Pro API。两条腿走路,不把鸡蛋放一个篮子里。
写在最后
从前天写 V4 技术解读,到昨天做云实例 TCO,到今天算买断报价——三篇文章串起来,就是一份完整的 DeepSeek-V4 私有化部署决策手册。
190 万买一台 G7 跑 V4-Flash,760 万买四台跑 V4-Pro——这些数字不是从 PPT 里抄来的,是实打实的渠道报价。 拿去跟你的 CTO 和采购部对,直接进入选型阶段。
我一个人打造的 Zaokit AI 正在内测,2026年4月30日前1000名用户赠送价值150RMB的Pro计划,助力大家高效完成图文创作和PPT生成,唯一网站:zaokit.app。
别再问"私有化部署贵不贵"了。价格表我都给你算好了——贵不贵,取决于你的数据值不值这个价。