token 经济崩塌:从按量付费到不限量订阅,差价被谁吃了
「不限量订阅」是 2026 最强的需求信号,也是最反经济学的供给方姿势。任何带「unlimited」字样的 SaaS 历史上都是一场血腥的内部赌博——总有人吃亏。
短短 18 个月的价格变迁
| 时间 | 主流定价 |
|---|---|
| 2024-Q1 | 按 token 计价,$3-$15/M tokens |
| 2024-Q4 | 包月 $20 含 X 个 prompts |
| 2025-Q2 | Claude Pro $20、Claude Pro Max $200,含 5h/7d 限速窗口 |
| 2025-Q4 | Codex Pro $200 不限量、Cursor Pro $40 大幅 raise rate limit |
| 2026-Q1 | 「unlimited」泛滥 + 5h/7d 软配额作为兜底 |
「5h 窗口」是这场游戏的关键设计——表面是不限量,实际是**「不限量但会被节流」**。这等于把"按量付费"换成了"按强度付费"。
谁在为「unlimited」付出代价
输家 1:Anthropic / OpenAI(一线模型厂)
不限量订阅是消费者心理学的胜利。但 P&L 上:
- Top 1% 重度用户的 token 消耗 = 普通用户的 100x
- 如果重度用户付 $200,普通用户也付 $200,那 P&L 模型本质是「普通用户在补贴重度用户」
- 而重度用户还会越用越多(边际成本 0 嘛)
Anthropic / OpenAI 在这件事上:要么继续烧投资人的钱、要么紧缩 rate limit(已经在做)、要么降价但严格控量(不可能,叙事会崩)。
输家 2:中型工具厂(Cursor / Windsurf / Cline 等)
Cursor 那种"在第三方模型上加层 IDE"的玩法,过去靠 token 加价 30-50%。unlimited 时代你拿什么收钱?
他们的应对:
- 自研模型(投钱进黑洞)
- 加企业版客单价(拼销售而非产品)
- 转 MCP 平台(前一篇说过)
但 核心问题没解:用户为什么不直接用 Claude Code / Codex 的官方 CLI(也是 unlimited)?
输家 3:重度用户自己
听起来反直觉,但是真的。
- Rate limit 配额成了新的摩擦——5h 窗口剩 10% 时你不敢跑大任务。一个心理负担。
- 「降级套餐」陷阱——unlimited 看似无限,实际触顶会被强制降级到 mini 模型(用户经常没意识到)
- 数据被沉淀进厂商——你跑得越多、他们越了解你的工作模式、未来 pricing 越精准
重度用户「享受了 unlimited」但「失去了 token-by-token 的可控性」。
输家 4:普通用户(最隐形)
普通用户每月用不到 $5 的 token,却被强制付 $20。这是最隐形的补贴。「unlimited」吸引 5x 比例的「轻度用户」来当冤大头。
这场博弈的尾声会怎么走
历史告诉我们「不限量」在 SaaS 史上反复上演、反复修正。每次的修正路径都是:
阶段 A:开放 unlimited 抢用户(现在所处阶段)
阶段 B:偷偷加配额、塞 fine print(已经开始:5h、weekly cap、月度软限)
阶段 C:分层、把高端用户拆出去(即将到来:$500/月、$1000/月企业 plan)
阶段 D:「fair use」明确化、unlimited 沦为营销词(2027 中预测)
最早承认这件事的厂商赢——你能在叙事上让用户接受「unlimited 是个抽象表达,实际配额是 XX」,比偷偷掐脖子要好得多。
你该怎么布局自己的预算
如果你是个人开发者:
- 现在是历史窗口——unlimited 还真是 unlimited(基本)
- 明年开始会被悄悄收紧——别养成「重度依赖一家」的习惯
- 本地模型当兜底——前一篇说过的姿势
- 每月看一次实际消耗——如果你已经触发了 rate limit > 3 次,你就是那个被补贴的人,别介意继续白嫖;但要意识到这个套利窗口会关
如果你是 SaaS 公司:
- 不要也搞 unlimited——这是模型厂的资本游戏,你打不起
- 按结果定价——每个成功 review 收 $X、每个修复的 bug 收 $X
- 把 token 当成本透传——告诉客户「这次任务用了 $0.5 of GPT-5.5 + $0.05 of Qwen-Max」,让客户看到价值
- 囤一些低成本模型替代方案——Qwen / DeepSeek 用于不需要前沿的任务,省下来给客户做让利
一个反直觉的预测
「unlimited」时代 12 个月内会结束。回到按结果计价时代——但不是 token-by-token 那种粗糙的按量,而是按"完成的任务量"。
- 完成一次 PR review = $0.50
- 完成一次 bug 定位 = $1.00
- 完成一个 feature spec → 实现 = $20
这才是 AI 时代真正合理的定价——和价值挂钩,而不是和 token 数挂钩。
token 经济崩塌是必然,下一个 pricing 范式正在出生。先动的人吃这一波。