1三种合法盈利结构
直采付费 API 拿量折扣,按略高价转售。毛利 = 零售价 − 批发价。规模越大批发越便宜,毛利越厚。小白用户的主力变现。
用户充值额度时收平台费(OpenRouter:卡 5.5% / 加密 5%,每笔最低 $0.80)。稳定的现金流抽成。
用户自带 key,我们按用量收 ~5% 软件费。零 token 库存、零封号、毛利率最高。开发者用户的主力变现。
价差 + 手续费抓小白(用我们的额度),BYOK 抽成抓开发者(自带 key)。三者叠加既覆盖人群又分散风险,且全部合规。
2对标 OpenRouter(合法范本)
| 项目 | OpenRouter 做法 | 我们可借鉴 |
|---|---|---|
| 模型 token 价 | 不加价,按各供应商原价透传 | 用"低价/透明"建信任,靠手续费+BYOK 赚钱 |
| 充值平台费 | 卡 5.5% / 加密 5%,每笔最低 $0.80 | 小额充值实际费率更高,是主要利润源之一 |
| BYOK 费 | 每月前 100 万请求免费,超出按原厂等价成本 5% | 开发者向的零库存利润 |
| 价值主张 | 一个 key 通所有模型 + 自动回退 + 用量分析 | "省心 + 统一 + 可观测"才是真正卖点 |
来源:openrouter.ai/pricing、openrouter.ai/announcements(2026-06)。
OpenRouter 证明了:不靠盗用额度、纯靠薄加价 + 手续费 + 软件抽成,也能做成规模化生意。我们的差异化可以是"中文支持 + 本地支付 + 东南亚低延迟 + 更细的免费档"。
3倍率与额度设计
用统一"额度单位"抹平不同模型的价差,便于定价与套餐:
| 模型档 | 示例倍率 | 说明 |
|---|---|---|
| 免费/极速档(Groq/Gemini Flash-Lite) | 1x(或免费档不计费) | 引流、降本 |
| 主力档(GPT-4o-mini / Haiku 级) | 2~3x | 日常对话主力 |
| 高精档(GPT-4o / Claude Sonnet) | 8~12x | 编程/复杂推理 |
| 旗舰档(o3 / Opus / 长上下文) | 20x+ | 高价值、低频 |
倍率应基于真实批发成本 + 目标毛利反推,而不是拍脑袋。网关(New/One/LiteLLM)都内建倍率与额度扣减,用户面板可见消耗。
4套餐与档位
挂官方免费层(Groq/Gemini/Workers AI),限 20 RPM、限模型、限日额。引流 + 转化漏斗入口,明示"基于免费层、无 SLA"。
预付额度,按倍率消耗,覆盖付费批发的全模型,有基础 SLA。价差 + 手续费变现。
开发者自带 key,月费 + 用量抽成;或团队订阅含用量看板、限流、审计。高毛利、高粘性。
5支付通道与风控(生死线)
无论供给多合法,支付商对"AI/API 转售"本就敏感;一旦被判定为高风险或违反可接受用途,会冻结结算、罚没余额、永久拉黑。合法供给能大幅降低这个风险,灰产供给则几乎注定触发它。
| 通道 | 适合 | 注意 |
|---|---|---|
| Stripe / Paddle | 全球卡支付、订阅 | 需合规主体;Paddle 作 MoR 可代收税。务必如实描述业务 |
| 加密支付(USDT 等) | 规避部分通道限制 | 合规与反洗钱要求高,记账复杂,非"免风险" |
| 本地支付(东南亚钱包等) | 区域用户转化 | 结合曼谷/马来主体落地 |
| 对公/企业转账 | B 端大客户 | 需发票与合同,合规度最高 |
合规建议:设立正规运营主体(参考我们既有 form/ 套件用的马来西亚 Sdn Bhd 思路)、如实向支付商描述业务、保留用量与对账记录、对客户明示供给来源与 SLA。
6"白嫖转售"在支付与信任层面的致命风险
- 逆向/养号供给 = 高退款率 + 高投诉率 → 触发支付商风控
- 结算冻结、罚没、拉黑,连带合法收入一起没
- 加密支付也非避风港,反洗钱合规反而更重
- 渠道随时失效 → 用户体验断崖 → 退款潮
- 以"稳定 API"售卖明知会失效的访问 = 误导销售/事实欺诈
- 口碑一旦崩,品牌无法复用,等于重头再来
灰产供给省下的 token 成本,远小于它在支付冻结 + 退款 + 法律 + 商誉上的期望损失。合法供给虽有成本,但可定价、可对账、可持续——这才是能收到钱的生意。
7盈亏模型(示意)
结论:把利润建在软件价值(统一/省心/可观测)+ 薄加价 + 手续费上,而非建在"盗用的 token 成本差"上。前者随规模变强,后者随规模变脆。完整决策建议见 10 路线决策。