11 · 利润真相 · 二轮调研

不白嫖,就真的"毫无意义"吗?

这一质疑对了一半:纯卖 token 确实没利润——毛利 0~15%、没价差、用户会直接找官方。但这不等于项目没意义,而是说明"卖 token"本身就是错的产品形态。本篇用真实数字把利润到底在哪讲透:token 转售毛利 0~15%,而 AI 产品毛利 50~70%,差别不在价格,在于卖的是"token"还是"结果"。

💡 命题对一半 📊 OpenRouter $50M ARR · 仅 5% 抽成 🎯 利润在"卖结果",不在"卖 token"

0直接回答

🎯 一句话

"卖 token 的中转站"几乎没意义;"用 token 引擎卖 AI 产品"非常有意义。 同样一份 token 成本,作为转售商品只能加价 5~15%(还得跟官方比价),作为某个产品的 COGS 却能支撑 50~70% 毛利(因为客户买的是结果,不再跟官方 token 比价)。项目的意义不在"中转",在于把中转能力降级为我们自己产品的降本引擎

1为何"纯卖 token"没利润(这个直觉是对的)

  • 商品同质:token 是完全标准化的商品,官方价格公开透明,我们无法用"质量"做差异化。
  • 价格锚定官方:用户随手能查到官方价。若定价高于官方,用户直接走官方;若定价低于官方,只能靠白嫖/盗用补差——回到红线(见 02)。
  • 变动成本不可消除:不像传统软件零边际成本,每一次调用都是真实 token 支出,规模化不摊薄反而线性增加。
  • 结论:合法纯转售只能靠"手续费 + 薄抽成"赚 5~15%,且是规模/网络效应游戏,新人很难赢。
⚠️ 但"没价差"不等于"没价值"

OpenRouter 同样不靠价差(token 原价透传),却做到 $50M ARR——因为它卖的是便利、聚合、路由智能、统一计费,不是便宜。价值可以不来自价格。这把我们引向真正的问题:利润到底在哪。

2六种模式的毛利对比(真实数字)

模式毛利率本质可持续/合规
纯 token 转售(合法)0~15%商品搬运 + 手续费合规但几乎无利
网关抽成(OpenRouter 式)5~15%便利 + 路由 + 充值费合规,规模游戏
批量/缓存/承诺套利10~30%低买高卖时间差合规但运营复杂
企业级网关(Portkey/Kong)40~70%治理/可观测/合规/SLA合规,B 端
token-as-COGS 产品50~70%卖结果,token 是 COGS合规,最优
access/支付套利(中国等)100~300%绕地区/支付壁垒灰色·违反 ToS
盗 key/白嫖转售表面高→实际负套供应商安全漏洞违法·必崩

毛利区间综合自 ICONIQ 2026 AI 产品毛利调研、SaaStr、OpenRouter 公开数据与各网关定价(见下文来源)。

📌 关键读表法

合法且高毛利的只有两块:企业级网关(40~70%)token-as-COGS 产品(50~70%)。前者是 B 端基础设施生意(重销售、重合规);后者是把 token 藏进产品里卖结果——对我们(已有 7 条产品线 + 166 个 skill)门槛更低、更契合

3OpenRouter 拆解:不靠价差怎么做到 $50M ARR

$50M
年化营收(2026-03)
sacra.com/c/openrouter
5%
平台抽成(营收主来源)
同上
8.4T
月 token 量 · 2.5M 用户
同上
0
模型 token 加价(原价透传)
openrouter.ai

营收来自三处,没有一处是 token 价差:① 信用卡充值费 5.5%(小额实际 10~20%);② BYOK 每月超 100 万请求按 5% 抽;③ 模型按原价透传。用户愿意付,是为了一个 key 通 400+ 模型、自动回退、路由智能、统一计费与可观测

🧠 启示

OpenRouter 证明"卖便利"可行,但这是赢家通吃的规模/网络效应游戏(路由智能随 8.4T token 量越来越强,新人无数据飞轮)。对我们而言,正面硬刚 OpenRouter 不明智;把它的能力当工具用在自己产品里更划算(见 12 路线 C)。

4套利到底能赚多少(别高估)

套利手段折扣净毛利(扣运营后)代价
Batch API(OpenAI/Anthropic)~50% off30~40%客户需接受 24h 异步延迟
Prompt 缓存缓存命中 ~90% off 输入视命中率仅对高重复 workload 有效
承诺用量(Azure PTU / 企业折扣)15~40%(按量级)12~20%需 $1M+ 预付 + 用量预测准确
⚠️ 注意

套利毛利看着诱人,但都有硬约束:Batch 要客户忍受延迟、缓存只对重复请求有效、承诺用量要巨额预付与精准预测。作为对外转售产品,套利毛利会被运营/支付/支持吃到 10~30%。但作为我们自己产品的降本手段(我们自己控制 workload),这些折扣能直接转化为产品毛利——这正是路线 C 的核心。

5token-as-COGS:真正的金矿

把同样的 token 成本放进一个"卖结果"的产品里,毛利结构完全变了:

【纯转售】 收入 $100 − token $95 − 支付/支持 $5 = 毛利 ~$0 (0%) 【做产品】 收入 $100 − token $20 − 支付/托管/支持 $12 = 毛利 ~$68 (68%) 为什么?因为客户买的是"一份 SEO 审计报告 / 一次解梦 / 一批销售线索", 他不会拿我们的报告价去跟"GPT token 单价"比——比价锚点没了,定价权回来了。
💻Claude Code / Cursor

$20/月,token 只占价值 10~20%,其余是 IDE 集成、记忆、多轮优化。

🔎Perplexity Pro

$20/月,卖"搜索+综合",token 是隐藏 COGS。

📄垂直 SaaS(如法务文档 AI)

按文档/案件计费,token 仅占收入 5~15%。

毛利对比来源:ICONIQ Capital 2026 AI 产品毛利调研(均值 ~52%)、SaaStr、hirefraction outcome-based pricing 分析。

6结论

✅ 项目的意义被重新定位

不是"放弃中转",而是把中转从'产品'降级为'引擎'

  • 对外:卖 AI 产品/结果(毛利 50~70%)——产品来自我们已有的 7 条产品线 + 166 个 skill。
  • 对内:用网关(免费层 + Batch + 缓存 + 路由)把这些产品的 token COGS 打到地板——这才是"白嫖"价值的合法归宿。

三条可行路线(网关作产品 / access 套利 / 网关作引擎+卖产品)的逐条详解与决策矩阵见 12 可行路线;可productize 的技能全景见 13;优先产品蓝图见 14