16 · 运营落地 · OpenRouter

OpenRouter:哪些模型最划算

我们把 OpenRouter 当作产品的 COGS 引擎来评估——不是用它转售 token,而是用它"一个 key 通所有模型 + 按价排序 + 自动回退"的能力,给我们的产品挑出质量/价格比最高的模型组合。本篇给出当前可用免费模型、最优价值付费模型表、以及把毛利做到最大的分层路由 + 缓存策略。

🆓 免费模型适合原型 💰 DeepSeek V3.2 $0.14/$0.28 🧭 分层路由毛利 40–60%

0为何用 OpenRouter 作引擎(而非对手)

🎯 定位

12 路线 C 里,OpenRouter 是我们网关引擎的"统一接入 + 比价 + 回退"层:一个 key 接 400+ 模型、按 provider 价格排序、首选 429 自动回退、原价透传不加价(仅 5.5% 充值费)。这让我们在产品里随时切到"当前最划算的模型",而无需逐家签约。它不是我们对外卖的产品,是我们压 COGS 的工具。

1免费模型与限额(适合原型/免费档,非生产)

当前 OpenRouter 上值得用的 :free 模型:

模型定位适合
DeepSeek R1(:free)开源推理模型,带思维链,对标 o1推理/复杂逻辑的免费档
Llama 3.3 70B Instruct(:free)最强通用免费模型通用对话主力
Qwen3 Coder 480B(:free)SOTA 免费代码模型,262K 上下文代码生成
Gemini 2.0 Flash(:free)多模态快模型多模态/快响应
Gemma 3轻量多模态轻量任务
⚠️ 限额(COGS 硬约束)

全部免费模型合计 20 RPM50 请求/天(无充值历史);一次性充值 $10 后升到 1,000 请求/天(永久保留,但提高每分钟吞吐)。→ 免费模型适合原型/开发/免费档引流,不适合生产规模。生产走下面的付费价值模型。

2最优价值付费模型(生产主力)

按"质量/价格比"挑出的便宜但能打的模型(OpenRouter 原价透传):

模型输入 $/1M输出 $/1M定位
DeepSeek V3.2$0.14$0.28最佳推理/美元,批量主力
Gemini 2.5 Flash-Lite$0.10$0.40快、便宜、多模态
GPT-4.1 Nano$0.10$0.40最便宜输入档之一
Mistral Small 3.2$0.10$0.30轻量便宜
Gemini 2.5 Flash$0.30$2.501M 上下文、有免费层
Claude Haiku 4.5$1.00$5.00最便宜 Claude,质量稳

来源:openrouter.ai/pricing、cloudzero.com/blog/llm-api-pricing-comparison、各模型 pricing 页(2026-06)。价格随厂商调整,接入前复核。

📌 价值直觉

大部分"抽取 / 分类 / 起草 / 总结"类工作用 DeepSeek V3.2Gemini 2.5 Flash-Lite 就够,单价是 Claude Sonnet 的几分之一。把贵模型留给真正高价值、低频的环节。

3利润最大化:分层路由策略

同一个产品请求,按价值分层路由到不同档位的模型,是把毛利做到 40–60% 的核心手法:

请求进来 │ ├─ Layer 1 免费兜底(COGS≈0):简单抽取/分类 → DeepSeek R1:free / Llama 3.3 70B:free │ · 429 则在免费模型间轮换;适合开发与免费档 │ ├─ Layer 2 便宜默认(生产主力):抽取/起草/总结 → DeepSeek V3.2 / Gemini 2.5 Flash-Lite │ · 输入比 Claude Sonnet 便宜数倍 │ └─ Layer 3 仅在需要时升级:高价值决策 → Llama 70B → Claude Sonnet → Opus · 用"是否高价值/高风险"作升级闸门,屏蔽贵模型干廉价活 毛利公式:Margin = 1 − (模型 token 成本 + 0.055 充值费 − Batch/缓存节省) 激进路由下,量起来后毛利约 40–60%

OpenRouter 原生支持按价格/延迟排序与 fallbacks,以上分层可直接在路由配置里表达(见 04 网关架构)。

4缓存:在路由之上再砍一刀

🧠Prompt 缓存

OpenRouter 支持隐式缓存(OpenAI/DeepSeek/Gemini 2.5)+ 显式缓存(Anthropic)。命中时缓存读取价约为原输入的 0.25×。对"系统 prompt 长、重复度高"的产品(如固定模板的解梦/审计)极有效。

📦响应缓存

OpenRouter 边缘对完全相同的请求直接返回整条响应,成本 0。高频重复查询(热门梦境词条、常见审计项)命中即免费。

Batch(异步 50% off)不在 OpenRouter 直接提供,但可在底层供应商(DeepSeek/Gemini)侧使用——这正是 14 里 programmatic-SEO/解梦批量生成的省钱来源。

5BYOK 与转售边界

  • BYOK 经济:每月前 100 万 BYOK 请求免费,超出按每请求 5% 抽(从信用扣)。企业档可达 500 万/月免费 + 量价。
  • 转售限制:OpenRouter 是否允许"用它中介后再商业转售/再分发"——未核实,官方文档未明确,按惯例很可能受限,正式商用前需读其服务条款。我们的路线 C 是用它驱动自己的产品(合规),而非把 OpenRouter 访问权转卖(边界模糊)。

6结论

✅ 我们怎么用

把 OpenRouter 当"统一接入 + 比价 + 回退"层:免费模型跑开发与免费档;生产默认走 DeepSeek V3.2 / Gemini Flash-Lite;贵模型仅在高价值环节升级;叠加 prompt/响应缓存。这套组合让我们产品的 token COGS 长期落在收入的 10~25%,支撑 50~70% 毛利。它是引擎,不是商品。接入顺序见 18