0为何用 OpenRouter 作引擎(而非对手)
在 12 路线 C 里,OpenRouter 是我们网关引擎的"统一接入 + 比价 + 回退"层:一个 key 接 400+ 模型、按 provider 价格排序、首选 429 自动回退、原价透传不加价(仅 5.5% 充值费)。这让我们在产品里随时切到"当前最划算的模型",而无需逐家签约。它不是我们对外卖的产品,是我们压 COGS 的工具。
1免费模型与限额(适合原型/免费档,非生产)
当前 OpenRouter 上值得用的 :free 模型:
| 模型 | 定位 | 适合 |
|---|---|---|
| DeepSeek R1(:free) | 开源推理模型,带思维链,对标 o1 | 推理/复杂逻辑的免费档 |
| Llama 3.3 70B Instruct(:free) | 最强通用免费模型 | 通用对话主力 |
| Qwen3 Coder 480B(:free) | SOTA 免费代码模型,262K 上下文 | 代码生成 |
| Gemini 2.0 Flash(:free) | 多模态快模型 | 多模态/快响应 |
| Gemma 3 | 轻量多模态 | 轻量任务 |
全部免费模型合计 20 RPM;50 请求/天(无充值历史);一次性充值 $10 后升到 1,000 请求/天(永久保留,但不提高每分钟吞吐)。→ 免费模型适合原型/开发/免费档引流,不适合生产规模。生产走下面的付费价值模型。
2最优价值付费模型(生产主力)
按"质量/价格比"挑出的便宜但能打的模型(OpenRouter 原价透传):
| 模型 | 输入 $/1M | 输出 $/1M | 定位 |
|---|---|---|---|
| DeepSeek V3.2 | $0.14 | $0.28 | 最佳推理/美元,批量主力 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 快、便宜、多模态 |
| GPT-4.1 Nano | $0.10 | $0.40 | 最便宜输入档之一 |
| Mistral Small 3.2 | $0.10 | $0.30 | 轻量便宜 |
| Gemini 2.5 Flash | $0.30 | $2.50 | 1M 上下文、有免费层 |
| Claude Haiku 4.5 | $1.00 | $5.00 | 最便宜 Claude,质量稳 |
来源:openrouter.ai/pricing、cloudzero.com/blog/llm-api-pricing-comparison、各模型 pricing 页(2026-06)。价格随厂商调整,接入前复核。
大部分"抽取 / 分类 / 起草 / 总结"类工作用 DeepSeek V3.2 或 Gemini 2.5 Flash-Lite 就够,单价是 Claude Sonnet 的几分之一。把贵模型留给真正高价值、低频的环节。
3利润最大化:分层路由策略
同一个产品请求,按价值分层路由到不同档位的模型,是把毛利做到 40–60% 的核心手法:
OpenRouter 原生支持按价格/延迟排序与 fallbacks,以上分层可直接在路由配置里表达(见 04 网关架构)。
4缓存:在路由之上再砍一刀
OpenRouter 支持隐式缓存(OpenAI/DeepSeek/Gemini 2.5)+ 显式缓存(Anthropic)。命中时缓存读取价约为原输入的 0.25×。对"系统 prompt 长、重复度高"的产品(如固定模板的解梦/审计)极有效。
OpenRouter 边缘对完全相同的请求直接返回整条响应,成本 0。高频重复查询(热门梦境词条、常见审计项)命中即免费。
Batch(异步 50% off)不在 OpenRouter 直接提供,但可在底层供应商(DeepSeek/Gemini)侧使用——这正是 14 里 programmatic-SEO/解梦批量生成的省钱来源。
5BYOK 与转售边界
- BYOK 经济:每月前 100 万 BYOK 请求免费,超出按每请求 5% 抽(从信用扣)。企业档可达 500 万/月免费 + 量价。
- 转售限制:OpenRouter 是否允许"用它中介后再商业转售/再分发"——未核实,官方文档未明确,按惯例很可能受限,正式商用前需读其服务条款。我们的路线 C 是用它驱动自己的产品(合规),而非把 OpenRouter 访问权转卖(边界模糊)。
6结论
把 OpenRouter 当"统一接入 + 比价 + 回退"层:免费模型跑开发与免费档;生产默认走 DeepSeek V3.2 / Gemini Flash-Lite;贵模型仅在高价值环节升级;叠加 prompt/响应缓存。这套组合让我们产品的 token COGS 长期落在收入的 10~25%,支撑 50~70% 毛利。它是引擎,不是商品。接入顺序见 18。