18 · 运营落地 · 接入优先顺序

运营本项目,我们建议的接入优先顺序

我们采用分阶段平衡的接入策略:阶段 1 先用最少的接入跑通 MVP,阶段 2 再压 COGS,阶段 3 再扩可用性与规模。本篇给出"先接谁、为什么、何时加下一个"的清单与决策依据,目标是让团队不在早期就陷入"接十几个渠道"的过度工程。

1️⃣ 跑通 MVP 2️⃣ 压 COGS 3️⃣ 扩可用性/规模

0接入原则

🎯 三条原则
  • 先广后省再稳:先用"一个 key 通所有"快速跑通 → 再针对热点 workload 接直采压成本 → 再加冗余保可用。
  • 每接一个都要有触发条件:不为"全"而接,只在某项成本/可用性/能力达到阈值时才加下一个渠道。
  • 红线不变:只接合法来源(官方 API / 免费层 / BYOK / 付费批发),绝不接逆向或养号渠道(见 02)。

1阶段 1 · 跑通 MVP(第 1 周起)

目标:用最少接入让产品端到端跑起来,先验证 PMF,不追求最低成本。

顺序接入角色为什么先接它
OpenRouter(一个 key)统一接入 + 比价 + 回退一个 key 通 400+ 模型,零逐家签约成本,立刻能用(见 16
Cloudflare(Pages/Workers/D1/KV + AI Gateway)站点 + 网关逻辑 + 边缘缓存/可观测免费层即可起步、AI Gateway 免费、零 egress(见 05/17
默认便宜强模型:DeepSeek V3.2 / Gemini 2.5 Flash-Lite(经 OpenRouter)生产主力模型质量/价格比最高,先用它扛大部分请求
免费层:Groq / Gemini / Workers AI免费档 + 低 SLA 任务 + 兜底免费引流档与开发期降本(见 01
✅ 阶段 1 产出

一条可用链路:Cloudflare 边缘 → OpenRouter(默认 DeepSeek/Gemini Flash-Lite)→ 免费层兜底,足以驱动 14 的首发产品(A1 解梦 / B1 GEO 审计)。接入数:2 个平台 + 几个模型,不必更多。

2阶段 2 · 压 COGS(验证到有真实用量后)

目标:在有真实流量、看清热点 workload 后,针对性地把成本打下来。

顺序接入压成本手段触发条件
申请官方 startup credits(Cloudflare + 一家模型厂商)一次性燃料,覆盖验证期推理与基础设施有合规主体 + 官网即可申请(见 15
对热点模型接直采:DeepSeek / DeepInfra / Groq绕过 OpenRouter 5.5% 费、拿更低单价/更快速度某模型月调用量稳定、占成本大头
启用 Batch API(DeepSeek/Gemini 侧)可异步批量任务省 ~50%有可异步的批量生成(如 programmatic-SEO 批量页、批量词条)
启用 Prompt + 响应缓存(OpenRouter/CF AI Gateway)高重复请求省 ~90% 输入 / 命中 0 成本系统 prompt 长、请求重复度高
💡 关键

阶段 2 不是"接更多模型",而是"针对已知热点 workload 接最省的那条路"。直采只接成本占大头的 1~2 个模型即可,长尾仍走 OpenRouter。

3阶段 3 · 扩可用性与规模(有付费客户后)

顺序接入角色触发条件
付费批发兜底(直采 OpenAI/Anthropic/Google)保 SLA 的承诺供给有付费客户、需可承诺可用性
多渠道权重路由 + 回退(同模型多 provider)平滑单家限额、抗故障单渠道限额/抖动开始影响体验
自托管网关(New API / LiteLLM on 小 VPS + Tunnel)更细的计费/路由/审计控制需要更强的用量记账/治理(见 04/09
区域延迟优化(曼谷/新加坡原站)东南亚低延迟区域用户量起来(见 05

4接入顺序总表(一眼看全)

阶段1 跑通 ① OpenRouter(一key通所有) ② Cloudflare(站点+网关+AIGateway) (第1周) ③ 默认 DeepSeek V3.2 / Gemini Flash-Lite ④ 免费层 Groq/Gemini/CF AI 兜底 │ PMF 验证、出现真实热点 workload ▼ 阶段2 压COGS ⑤ 官方 credits(CF+一家模型厂商) ⑥ 热点模型直采(DeepSeek/DeepInfra/Groq) (有用量后) ⑦ Batch 异步省50% ⑧ Prompt/响应缓存省~90%输入 │ 有付费客户、需保 SLA ▼ 阶段3 扩 ⑨ 付费批发兜底(OpenAI/Anthropic/Google) ⑩ 多渠道权重路由+回退 (规模化) ⑪ 自托管网关(New API/LiteLLM+Tunnel) ⑫ 区域原站(曼谷/新加坡) 红线:全程只接合法来源;不接逆向/养号;免费层与补贴只压自己 COGS,不转售。

5何时加下一个(决策依据)

信号动作
某模型月成本占比 > 30%对它接直采(⑥),或上 Batch/缓存(⑦⑧)
免费层频繁 429 影响免费档体验把该档默认模型降级或加一个免费 provider 轮换
出现付费客户 / 要写 SLA接付费批发兜底(⑨)+ 多渠道回退(⑩)
用量记账/治理需求变强上自托管网关(⑪)
东南亚用户延迟敏感区域原站 + Tunnel(⑫)
验证期算力吃紧申请官方 credits(⑤)

6避坑清单

🚫别在阶段 1 接十几个渠道

过度工程。OpenRouter + Cloudflare + 两三个模型足以跑通,渠道按触发条件再加。

🚫别把免费层/补贴当对外供给

它们用于压自己产品的 COGS;对外承诺必须建在付费批发/BYOK 上(见 03)。

🚫别接逆向/养号渠道

无论多便宜,红线不碰(见 02/08)。

🚫别让兜底指向不稳定源

回退应指向"另一个付费渠道/更小稳定模型",不是逆向接口。

✅ 一句话

先用 OpenRouter + Cloudflare 两件套 + DeepSeek/Gemini Flash-Lite 跑通;有用量后对热点直采 + Batch + 缓存 + 申请补贴压成本;有付费客户后加付费批发兜底 + 多渠道路由 + 自托管网关。 每一步都由真实信号触发,不提前堆叠。