AI Value Capture:当话语权从基础设施层转移到模型层
Anthropic ARR 从 $9B 飙到 $44B,推理毛利率从 38% 涨到 70%。Token 变贵了,Token 也变便宜了。而 Nvidia 和 TSMC——两个最大的瓶颈——还没有涨价。为什么?
Magazine Article
AI 行业一天的变化抵得上其他行业一年。从 2023 到 2025,所有价值被基础设施层捕获。但从 2025 年底开始,价值以惊人速度向模型层集中。
"SemiAnalysis has reached as high as $10.95 million dollar annual spend rate on Anthropic Claude tokens, but the value we derive allows us to outcompete all our competitors and gain market share."
SemiAnalysis 在 Claude token 上的年化消费已达 1095 万美元,但从中获取的价值让他们能超越所有竞争对手。Token 的价值质变
Agentic AI 让每个 token 能执行的工作量发生了质变——过去几十个人时、花费数千美元的任务,现在几分钟、几美元的 token 就能搞定。
Token 的生产成本暴跌
Blackwell 吞吐量是 Hopper 的 30 倍。同一块 B300 加上软件优化,吞吐量能从 1k 涨到 14k tokens/sec/GPU。算上 FP4 差距达 32 倍。
模型厂商的毛利率飙升
Opus 4.5 定价砍了 3 倍,但毛利率反而上升——成本降得更多,用量从 Sonnet 转向更高价的 Opus。
"If Anthropic let us pay $150/$750 for Mythos fast, we would."
如果 Anthropic 让我们付 $150/$750 来用 Mythus fast,我们会付的。SOCAMM:Rubin 的定价密码
SOCAMM(System-On-Chip Attached Memory Module)是基于 LPDDR 的可插拔内存模块,是理解 Nvidia 定价策略的关键变量。
$8 → $13+/GB
SOCAMM 合同价 2026 Q1 约 $8/GB,年底可能超 $13/GB。Nvidia 可在 SOCAMM 上加 60% 毛利,客户也会接受。
$37.4W → $38.1W
VR NVL72 的 capex/watt 只从 GB300 的 $37.4/W 微涨到 $38.1/W——尽管芯片 TDP 几乎翻倍(1400W → 2300W)。
"One Chart to Rule Them All"
成本定价是地板,价值定价是天花板。VR NVL72 的定价落在接近地板的位置,Nvidia 有约 40% 的涨价空间。
| 定价框架 | VR NVL72 价格 | 逻辑 |
|---|---|---|
| 成本定价(地板) | $4.92/hr/GPU | Neocloud 需 ≥15.6% IRR 才部署,5 年期 15% 预付 |
| 价值定价(天花板) | $12.25/hr/GPU | 按 $/PFLOP 等价换算,租户在 Rubin 和 GB300 间无差异 |
| 当前定价 | $4.90/hr/GPU | $0.28/PFLOP,比 GB300 降 60%,低于趋势线 |
| 潜在定价 | $8.00/hr/GPU | Neocloud 赚 38% IRR,$0.46/PFLOP,仍低于趋势 |
"The larger the gap between the current pricing curve and the top left corner, the more room there is for AI Cluster providers like Nvidia to increase system pricing."
当前定价曲线与左上角之间的差距越大,Nvidia 等 AI 集群供应商提高系统定价的空间就越大。为什么 Nvidia 没涨价
- 反垄断顾虑 — GPU、互连和软件统治地位已引发监管关注
- 生态战略 — 像央行一样运作,不完全榨取价值来培育生态
- 长期锁死 — 短期让利确保下游持续投资,防止客户转向替代方案
为什么应该涨价
- 需求远超供给 — N3 利用率将超 100%,DRAM 已超 90%
- 40% 涨价空间 — 涨价后 Neocloud 仍能赚超额回报
- SOCAMM 独立定价 — 内存可从系统板中拆分,灵活调价
Socratic Dialogue
谁在 AI 价值链上赚到了钱?通过师生对话,理解 Token 经济学的核心矛盾。
Personalized Insights
基于你的身份——QA 工程师、独立开发者、AI 产品爱好者——提炼最切合的发现。
1 Token 经济学对独立开发者的定价启示
成本定价是地板,价值定价是天花板。做 AI 产品时,别按 API 成本加 margin 来定价。按用户省了多少钱来定价——如果你帮一个工程师每天省 3 小时,按时薪 200 元算,月费可以定到几千元,而不是按 token 成本算的几十元。
2 "降价但利润率上升"是教科书级定价策略
Opus 4.5 砍价 3 倍但毛利率反而涨——成本降得更快,用户自然向高价 SKU 迁移。借鉴:基础功能低价拉量,高级功能高价收割。关键是高级功能必须创造足够的价值差异。
3 "替代白领工作"比"辅助白领工作"值钱 10 倍
SemiAnalysis 月花 $10.95M 买 token,用 AI 替代传统分析师。QA 领域尤其明显——AI 自动化测试不是辅助工具,而是可以替代初级 QA 的完整方案。你的全栈能力 + AI 工具经验在这个交叉领域有独特优势。
4 Nvidia 的"央行模式"值得做产品时参考
Nvidia 主动不涨价来培育生态。做开源项目或开发者工具时,第一阶段应该是最大化采用率而非最大化变现。先把用户锁在生态里,再逐步收回价值。
5 内存瓶颈 = 存储行业的投资信号
内存价格一年涨 6 倍,SOCAMM 从 $8/GB 可能涨到 $13+/GB。如果关注美股,Micron(MU)、SanDisk、Western Digital 在 AI 供应链中的地位正在从配角变主角。比 Nvidia 更直接的杠杆。