SemiAnalysis · 翻译解读 · 2026-05-11

AI Value Capture：当话语权从基础设施层转移到模型层

Anthropic ARR 从 $9B 飙到 $44B，推理毛利率从 38% 涨到 70%。Token 变贵了，Token 也变便宜了。而 Nvidia 和 TSMC——两个最大的瓶颈——还没有涨价。为什么？

$44B+ Anthropic ARR，从年初 $9B 飙升

32x GB300 vs H100 吞吐量差距（FP4）

70%+ AI Labs 推理毛利率，从 38% 起步

~40% Nvidia VR NVL72 理论涨价空间

Magazine Article

AI 行业一天的变化抵得上其他行业一年。从 2023 到 2025，所有价值被基础设施层捕获。但从 2025 年底开始，价值以惊人速度向模型层集中。

"SemiAnalysis has reached as high as $10.95 million dollar annual spend rate on Anthropic Claude tokens, but the value we derive allows us to outcompete all our competitors and gain market share."

SemiAnalysis 在 Claude token 上的年化消费已达 1095 万美元，但从中获取的价值让他们能超越所有竞争对手。

价值暴涨

Token 的价值质变

Agentic AI 让每个 token 能执行的工作量发生了质变——过去几十个人时、花费数千美元的任务，现在几分钟、几美元的 token 就能搞定。

成本暴跌

Token 的生产成本暴跌

Blackwell 吞吐量是 Hopper 的 30 倍。同一块 B300 加上软件优化，吞吐量能从 1k 涨到 14k tokens/sec/GPU。算上 FP4 差距达 32 倍。

利润飙升

模型厂商的毛利率飙升

Opus 4.5 定价砍了 3 倍，但毛利率反而上升——成本降得更多，用量从 Sonnet 转向更高价的 Opus。

"If Anthropic let us pay $150/$750 for Mythos fast, we would."

如果 Anthropic 让我们付 $150/$750 来用 Mythus fast，我们会付的。

SOCAMM：Rubin 的定价密码

SOCAMM（System-On-Chip Attached Memory Module）是基于 LPDDR 的可插拔内存模块，是理解 Nvidia 定价策略的关键变量。

内存定价

$8 → $13+/GB

SOCAMM 合同价 2026 Q1 约 $8/GB，年底可能超 $13/GB。Nvidia 可在 SOCAMM 上加 60% 毛利，客户也会接受。

Capex per Watt

$37.4W → $38.1W

VR NVL72 的 capex/watt 只从 GB300 的 $37.4/W 微涨到 $38.1/W——尽管芯片 TDP 几乎翻倍（1400W → 2300W）。

"One Chart to Rule Them All"

成本定价是地板，价值定价是天花板。VR NVL72 的定价落在接近地板的位置，Nvidia 有约 40% 的涨价空间。

定价框架	VR NVL72 价格	逻辑
成本定价（地板）	$4.92/hr/GPU	Neocloud 需 ≥15.6% IRR 才部署，5 年期 15% 预付
价值定价（天花板）	$12.25/hr/GPU	按 $/PFLOP 等价换算，租户在 Rubin 和 GB300 间无差异
当前定价	$4.90/hr/GPU	$0.28/PFLOP，比 GB300 降 60%，低于趋势线
潜在定价	$8.00/hr/GPU	Neocloud 赚 38% IRR，$0.46/PFLOP，仍低于趋势

"The larger the gap between the current pricing curve and the top left corner, the more room there is for AI Cluster providers like Nvidia to increase system pricing."

当前定价曲线与左上角之间的差距越大，Nvidia 等 AI 集群供应商提高系统定价的空间就越大。

为什么 Nvidia 没涨价

反垄断顾虑 — GPU、互连和软件统治地位已引发监管关注
生态战略 — 像央行一样运作，不完全榨取价值来培育生态
长期锁死 — 短期让利确保下游持续投资，防止客户转向替代方案

为什么应该涨价

需求远超供给 — N3 利用率将超 100%，DRAM 已超 90%
40% 涨价空间 — 涨价后 Neocloud 仍能赚超额回报
SOCAMM 独立定价 — 内存可从系统板中拆分，灵活调价

Socratic Dialogue

谁在 AI 价值链上赚到了钱？通过师生对话，理解 Token 经济学的核心矛盾。

师

SemiAnalysis 说 Anthropic 的 ARR 从 $9B 飙到 $44B。你觉得这个数字意味着什么？

生

说明 AI 模型终于赚钱了？之前不都是烧钱吗。

师

对。但更准确的说法是——模型层的定价权出现了质变。你知道是什么触发的吗？

生

Agentic AI？文章说 2025 年 12 月 Agentic AI 开始"真正能用"了。

师

没错。关键点是 token 的经济价值变了。以前一个 token 能帮你做个搜索、画个吉卜力风格的自拍。现在一个 token 能帮你建金融模型、分析财报、把 Excel 转成 Dashboard。token 的"单价"没怎么变，但每个 token 能干的活儿变了几个数量级。

生

所以 Anthropic 降价了，但利润率反而涨了？

师

这就是精妙之处。Opus 4.5 的标价砍了 3 倍，但两个因素让毛利率反而上升：一是生产成本暴跌（Blackwell + 软件优化），二是用量从便宜的 Sonnet 转向更贵的 Opus。降价不等于亏钱，如果你的成本降得更快。

生

那 Nvidia 和 TSMC 为什么没涨价？他们不是瓶颈吗？

师

这是文章最反直觉的发现。N3 产能利用率要超 100% 了，Nvidia 供不应求，但两家都没完全重新定价。原因有两层：表面是反垄断顾虑，深层是生态战略——Nvidia 像央行一样运作，短期让利来确保长期锁死生态。

生

所以最终谁赚最多？

师

取决于时间尺度。短期，模型层（Anthropic、OpenAI）吃掉最大增量价值。中期，Nvidia 会通过 SOCAMM 定价逐步收回定价权。长期，TSMC 一旦打破克制，价值链重新洗牌。但无论如何，终端用户的 ROI 始终是正向的——花几美元的 token 替代几千美元的人工。

Personalized Insights

基于你的身份——QA 工程师、独立开发者、AI 产品爱好者——提炼最切合的发现。

1 Token 经济学对独立开发者的定价启示

成本定价是地板，价值定价是天花板。做 AI 产品时，别按 API 成本加 margin 来定价。按用户省了多少钱来定价——如果你帮一个工程师每天省 3 小时，按时薪 200 元算，月费可以定到几千元，而不是按 token 成本算的几十元。

2 "降价但利润率上升"是教科书级定价策略

Opus 4.5 砍价 3 倍但毛利率反而涨——成本降得更快，用户自然向高价 SKU 迁移。借鉴：基础功能低价拉量，高级功能高价收割。关键是高级功能必须创造足够的价值差异。

3 "替代白领工作"比"辅助白领工作"值钱 10 倍

SemiAnalysis 月花 $10.95M 买 token，用 AI 替代传统分析师。QA 领域尤其明显——AI 自动化测试不是辅助工具，而是可以替代初级 QA 的完整方案。你的全栈能力 + AI 工具经验在这个交叉领域有独特优势。

4 Nvidia 的"央行模式"值得做产品时参考

Nvidia 主动不涨价来培育生态。做开源项目或开发者工具时，第一阶段应该是最大化采用率而非最大化变现。先把用户锁在生态里，再逐步收回价值。

5 内存瓶颈 = 存储行业的投资信号

内存价格一年涨 6 倍，SOCAMM 从 $8/GB 可能涨到 $13+/GB。如果关注美股，Micron（MU）、SanDisk、Western Digital 在 AI 供应链中的地位正在从配角变主角。比 Nvidia 更直接的杠杆。