2026 年大模型 API 定价一览

大模型 API 价格战从 2024 年打到现在,价格已经降了两个数量级。整理了当前主流模型的最新定价,方便开发者做选型参考。

价格单位统一为 ¥/百万 tokens(美元价格按 $1=¥6.80 换算)。

旗舰模型定价

这一档是各家最强的模型,适合需要高质量推理、复杂代码生成的场景。

模型厂商输入 (¥/M)输出 (¥/M)上下文
GPT-5.5OpenAI¥34.00¥204.001050K
Claude Opus 4.7Anthropic¥34.00¥170.001000K
Gemini 3.5 ProGoogle¥10.20¥61.201000K
Qwen3.7 Max阿里¥17.00¥51.001000K
Claude Sonnet 4.6Anthropic¥20.40¥102.001000K
GPT-5.4OpenAI¥17.00¥102.001050K

旗舰模型价格差距很大。GPT-5.5 输出要 ¥204/M,而 Gemini 3.5 Pro 只要 ¥61.20/M,差了 3 倍多。如果任务对推理质量要求不是极端苛刻,Gemini 3.5 Pro 是旗舰档的性价比之选。

轻量/快速模型定价

适合对话、简单问答、代码补全等对速度要求高、推理复杂度低的场景。

模型厂商输入 (¥/M)输出 (¥/M)上下文
GPT-5.5 InstantOpenAI¥5.10¥20.40922K
Kimi K2.6Moonshot¥4.96¥23.73262K
Gemini 3.5 FlashGoogle¥10.20¥61.201049K
Qwen3.6 Plus阿里¥2.21¥13.261000K
MiniMax-M2.7MiniMax¥1.90¥8.16205K

GPT-5.5 Instant 是 OpenAI 的速度型产品,价格只有 GPT-5.5 的 1/4。Kimi K2.6 在编程和 Agent 场景表现不错,价格也在同一档位。

超低价模型定价

这档是各家打价格战的主战场。适合批量处理、智能体循环调用、数据标注等高频场景。

模型厂商输入 (¥/M)输出 (¥/M)上下文
MiMo-V2.5 Pro小米¥3.00¥6.001000K
DeepSeek V4 ProDeepSeek¥2.96¥5.921049K
GLM-5.1智谱¥2.72¥8.16200K
MiMo-V2.5小米¥1.02¥1.971000K
DeepSeek V4 FlashDeepSeek¥0.95¥1.901000K
Gemini 3 FlashGoogle¥1.02¥4.081000K
混元 Hy3 Preview腾讯¥0.41¥1.22256K
Step 3.5 Flash阶跃星辰¥0.20¥0.61256K

DeepSeek V4 Pro 和 MiMo-V2.5 Pro 价格几乎一样,都是 ¥3/M 输入、¥6/M 输出左右,但上下文窗口都支持 1M。这两个是目前百万上下文模型里最便宜的。

如果不需要超长上下文,混元 Hy3 Preview 和 Step 3.5 Flash 更便宜,输出只要 ¥1/M 左右。

开源/免费模型

通过 OpenRouter、Together AI 等平台调用开源模型,价格通常比闭源模型低很多。

模型参数量输入 (¥/M)输出 (¥/M)上下文
Llama 4 Scout¥0.75¥2.2410000K
Llama 4 Maverick¥1.16¥3.401000K
Mistral Large 3¥2.04¥6.12256K
Phi-414B¥0.54¥1.6316K

Llama 4 Scout 支持 10M 上下文,是目前上下文最长的开源模型。本地部署的话完全免费,只需要硬件成本。

按场景选模型

日常对话、简单问答 → GPT-5.5 Instant(¥5.10/¥20.40)或 DeepSeek V4 Flash(¥0.95/¥1.90)。性价比高,响应快。

复杂推理、学术分析 → Claude Opus 4.7(¥34/¥170)或 GPT-5.5(¥34/¥204)。贵但质量最好。

编程、代码生成 → DeepSeek V4 Pro(¥2.96/¥5.92)或 MiMo-V2.5 Pro(¥3/¥6)。编程能力接近旗舰水平,价格只有 1/10。

智能体、高频调用 → DeepSeek V4 Flash(¥0.95/¥1.90)或 Step 3.5 Flash(¥0.20/¥0.61)。价格低到可以忽略不计。

长文档处理(100K+ tokens) → DeepSeek V4 Pro / MiMo-V2.5 Pro(都支持 1M 上下文,价格 ¥3/¥6 左右)。

本地部署、数据隐私 → Ollama + Llama 4 Scout 或 Qwen3.5 开源版。硬件成本一次性投入,后续免费。

几个值得注意的趋势

国产模型的价格优势非常明显。同样输出质量的模型,国内厂商的价格通常是 OpenAI/Anthropic 的 1/5 到 1/10。这主要是因为国内推理基础设施成本更低,加上价格战打得更凶。

缓存命中价格是另一个值得关注的点。MiMo-V2.5 Pro 缓存命中只要 ¥0.025/M,DeepSeek 也有类似的缓存折扣。如果应用有大量重复查询,善用缓存可以把成本再降一个量级。

百万上下文已经成了标配。2024 年还只有少数模型支持 128K 以上,到 2026 年主流模型基本都支持 1M 甚至更长。上下文长度不再是选型的瓶颈。