0直接回答
"卖 token 的中转站"几乎没意义;"用 token 引擎卖 AI 产品"非常有意义。 同样一份 token 成本,作为转售商品只能加价 5~15%(还得跟官方比价),作为某个产品的 COGS 却能支撑 50~70% 毛利(因为客户买的是结果,不再跟官方 token 比价)。项目的意义不在"中转",在于把中转能力降级为我们自己产品的降本引擎。
1为何"纯卖 token"没利润(这个直觉是对的)
- 商品同质:token 是完全标准化的商品,官方价格公开透明,我们无法用"质量"做差异化。
- 价格锚定官方:用户随手能查到官方价。若定价高于官方,用户直接走官方;若定价低于官方,只能靠白嫖/盗用补差——回到红线(见 02)。
- 变动成本不可消除:不像传统软件零边际成本,每一次调用都是真实 token 支出,规模化不摊薄反而线性增加。
- 结论:合法纯转售只能靠"手续费 + 薄抽成"赚 5~15%,且是规模/网络效应游戏,新人很难赢。
OpenRouter 同样不靠价差(token 原价透传),却做到 $50M ARR——因为它卖的是便利、聚合、路由智能、统一计费,不是便宜。价值可以不来自价格。这把我们引向真正的问题:利润到底在哪。
2六种模式的毛利对比(真实数字)
| 模式 | 毛利率 | 本质 | 可持续/合规 |
|---|---|---|---|
| 纯 token 转售(合法) | 0~15% | 商品搬运 + 手续费 | 合规但几乎无利 |
| 网关抽成(OpenRouter 式) | 5~15% | 便利 + 路由 + 充值费 | 合规,规模游戏 |
| 批量/缓存/承诺套利 | 10~30% | 低买高卖时间差 | 合规但运营复杂 |
| 企业级网关(Portkey/Kong) | 40~70% | 治理/可观测/合规/SLA | 合规,B 端 |
| token-as-COGS 产品 | 50~70% | 卖结果,token 是 COGS | 合规,最优 |
| access/支付套利(中国等) | 100~300% | 绕地区/支付壁垒 | 灰色·违反 ToS |
| 盗 key/白嫖转售 | 表面高→实际负 | 套供应商安全漏洞 | 违法·必崩 |
毛利区间综合自 ICONIQ 2026 AI 产品毛利调研、SaaStr、OpenRouter 公开数据与各网关定价(见下文来源)。
合法且高毛利的只有两块:企业级网关(40~70%)和 token-as-COGS 产品(50~70%)。前者是 B 端基础设施生意(重销售、重合规);后者是把 token 藏进产品里卖结果——对我们(已有 7 条产品线 + 166 个 skill)门槛更低、更契合。
3OpenRouter 拆解:不靠价差怎么做到 $50M ARR
营收来自三处,没有一处是 token 价差:① 信用卡充值费 5.5%(小额实际 10~20%);② BYOK 每月超 100 万请求按 5% 抽;③ 模型按原价透传。用户愿意付,是为了一个 key 通 400+ 模型、自动回退、路由智能、统一计费与可观测。
OpenRouter 证明"卖便利"可行,但这是赢家通吃的规模/网络效应游戏(路由智能随 8.4T token 量越来越强,新人无数据飞轮)。对我们而言,正面硬刚 OpenRouter 不明智;把它的能力当工具用在自己产品里更划算(见 12 路线 C)。
4套利到底能赚多少(别高估)
| 套利手段 | 折扣 | 净毛利(扣运营后) | 代价 |
|---|---|---|---|
| Batch API(OpenAI/Anthropic) | ~50% off | 30~40% | 客户需接受 24h 异步延迟 |
| Prompt 缓存 | 缓存命中 ~90% off 输入 | 视命中率 | 仅对高重复 workload 有效 |
| 承诺用量(Azure PTU / 企业折扣) | 15~40%(按量级) | 12~20% | 需 $1M+ 预付 + 用量预测准确 |
套利毛利看着诱人,但都有硬约束:Batch 要客户忍受延迟、缓存只对重复请求有效、承诺用量要巨额预付与精准预测。作为对外转售产品,套利毛利会被运营/支付/支持吃到 10~30%。但作为我们自己产品的降本手段(我们自己控制 workload),这些折扣能直接转化为产品毛利——这正是路线 C 的核心。
5token-as-COGS:真正的金矿
把同样的 token 成本放进一个"卖结果"的产品里,毛利结构完全变了:
$20/月,token 只占价值 10~20%,其余是 IDE 集成、记忆、多轮优化。
$20/月,卖"搜索+综合",token 是隐藏 COGS。
按文档/案件计费,token 仅占收入 5~15%。
毛利对比来源:ICONIQ Capital 2026 AI 产品毛利调研(均值 ~52%)、SaaStr、hirefraction outcome-based pricing 分析。
6结论
不是"放弃中转",而是把中转从'产品'降级为'引擎':
- 对外:卖 AI 产品/结果(毛利 50~70%)——产品来自我们已有的 7 条产品线 + 166 个 skill。
- 对内:用网关(免费层 + Batch + 缓存 + 路由)把这些产品的 token COGS 打到地板——这才是"白嫖"价值的合法归宿。
三条可行路线(网关作产品 / access 套利 / 网关作引擎+卖产品)的逐条详解与决策矩阵见 12 可行路线;可productize 的技能全景见 13;优先产品蓝图见 14。