token 经济崩塌:从按量付费到不限量订阅,差价被谁吃了

行业变天 · 技术/管理 · 2026-05-03

「不限量订阅」是 2026 最强的需求信号,也是最反经济学的供给方姿势。任何带「unlimited」字样的 SaaS 历史上都是一场血腥的内部赌博——总有人吃亏。

短短 18 个月的价格变迁

时间 主流定价
2024-Q1 按 token 计价,$3-$15/M tokens
2024-Q4 包月 $20 含 X 个 prompts
2025-Q2 Claude Pro $20、Claude Pro Max $200,含 5h/7d 限速窗口
2025-Q4 Codex Pro $200 不限量、Cursor Pro $40 大幅 raise rate limit
2026-Q1 「unlimited」泛滥 + 5h/7d 软配额作为兜底

「5h 窗口」是这场游戏的关键设计——表面是不限量,实际是**「不限量但会被节流」**。这等于把"按量付费"换成了"按强度付费"。

谁在为「unlimited」付出代价

输家 1:Anthropic / OpenAI(一线模型厂)

不限量订阅是消费者心理学的胜利。但 P&L 上:

  • Top 1% 重度用户的 token 消耗 = 普通用户的 100x
  • 如果重度用户付 $200,普通用户也付 $200,那 P&L 模型本质是「普通用户在补贴重度用户」
  • 而重度用户还会越用越多(边际成本 0 嘛)

Anthropic / OpenAI 在这件事上:要么继续烧投资人的钱、要么紧缩 rate limit(已经在做)、要么降价但严格控量(不可能,叙事会崩)。

输家 2:中型工具厂(Cursor / Windsurf / Cline 等)

Cursor 那种"在第三方模型上加层 IDE"的玩法,过去靠 token 加价 30-50%。unlimited 时代你拿什么收钱?

他们的应对:

  • 自研模型(投钱进黑洞)
  • 加企业版客单价(拼销售而非产品)
  • 转 MCP 平台(前一篇说过)

核心问题没解:用户为什么不直接用 Claude Code / Codex 的官方 CLI(也是 unlimited)?

输家 3:重度用户自己

听起来反直觉,但是真的。

  • Rate limit 配额成了新的摩擦——5h 窗口剩 10% 时你不敢跑大任务。一个心理负担。
  • 「降级套餐」陷阱——unlimited 看似无限,实际触顶会被强制降级到 mini 模型(用户经常没意识到)
  • 数据被沉淀进厂商——你跑得越多、他们越了解你的工作模式、未来 pricing 越精准

重度用户「享受了 unlimited」但「失去了 token-by-token 的可控性」

输家 4:普通用户(最隐形)

普通用户每月用不到 $5 的 token,却被强制付 $20。这是最隐形的补贴。「unlimited」吸引 5x 比例的「轻度用户」来当冤大头。

这场博弈的尾声会怎么走

历史告诉我们「不限量」在 SaaS 史上反复上演、反复修正。每次的修正路径都是:

阶段 A:开放 unlimited 抢用户(现在所处阶段)

阶段 B:偷偷加配额、塞 fine print(已经开始:5h、weekly cap、月度软限)

阶段 C:分层、把高端用户拆出去(即将到来:$500/月、$1000/月企业 plan)

阶段 D:「fair use」明确化、unlimited 沦为营销词(2027 中预测)

最早承认这件事的厂商赢——你能在叙事上让用户接受「unlimited 是个抽象表达,实际配额是 XX」,比偷偷掐脖子要好得多。

你该怎么布局自己的预算

如果你是个人开发者:

  1. 现在是历史窗口——unlimited 还真是 unlimited(基本)
  2. 明年开始会被悄悄收紧——别养成「重度依赖一家」的习惯
  3. 本地模型当兜底——前一篇说过的姿势
  4. 每月看一次实际消耗——如果你已经触发了 rate limit > 3 次,你就是那个被补贴的人,别介意继续白嫖;但要意识到这个套利窗口会关

如果你是 SaaS 公司:

  1. 不要也搞 unlimited——这是模型厂的资本游戏,你打不起
  2. 按结果定价——每个成功 review 收 $X、每个修复的 bug 收 $X
  3. 把 token 当成本透传——告诉客户「这次任务用了 $0.5 of GPT-5.5 + $0.05 of Qwen-Max」,让客户看到价值
  4. 囤一些低成本模型替代方案——Qwen / DeepSeek 用于不需要前沿的任务,省下来给客户做让利

一个反直觉的预测

「unlimited」时代 12 个月内会结束。回到按结果计价时代——但不是 token-by-token 那种粗糙的按量,而是按"完成的任务量"。

  • 完成一次 PR review = $0.50
  • 完成一次 bug 定位 = $1.00
  • 完成一个 feature spec → 实现 = $20

这才是 AI 时代真正合理的定价——和价值挂钩,而不是和 token 数挂钩。

token 经济崩塌是必然,下一个 pricing 范式正在出生。先动的人吃这一波

赞赏

如果这篇对你有用,欢迎请我喝杯咖啡。仅支持支付宝,随意,不在乎金额。

← 行业判断 更多文章