主流大模型 API 价格对比 (2026)

OpenAI (GPT / o 系列)

美国全球最知名的大模型提供商，GPT-5.5 为最新旗舰，GPT-5.4 为推荐生产模型

模型名称	发布时间	输入价格	输出价格	缓存输入	上下文窗口	特点
GPT-5.5gpt-5.5	2026-04-23	$5.00	$30.00	$0.50	1M	最强旗舰，Agent/复杂推理
GPT-5.5 Progpt-5.5-pro	2026-04-24	$30.00	$180.00	-	1M	高端推理，深度分析/科研
GPT-5.4gpt-5.4	2026-03-05	$2.50	$15.00	$0.25	1M	推荐生产模型，Computer Use
GPT-5.4 Progpt-5.4-pro	2026-03-05	$30.00	$180.00	-	1M	高端推理，取代 o 系列
GPT-5.4 Minigpt-5.4-mini	2026-03-17	$0.75	$4.50	$0.075	400K	高吞吐量生产任务
GPT-5.4 Nanogpt-5.4-nano	2026-03-17	$0.20	$1.25	$0.02	400K	极致低成本，分类/提取/路由
GPT-5.3 Codexgpt-5.3-codex	2026-02-05	$1.75	$14.00	$0.175	400K	代码专用模型
GPT-5Legacygpt-5	2025-08-07	$1.25	$10.00	$0.125	128K	原旗舰推理模型
GPT-5 MiniLegacygpt-5-mini	2025-08-07	$0.25	$2.00	$0.025	128K	GPT-5 轻量版
o3Legacyo3	2025-04-16	$2.00	$8.00	$0.50	200K	推理模型（已被 Pro 系列取代）
o4-miniLegacyo4-mini	2025-04-16	$1.10	$4.40	$0.275	200K	轻量推理模型
GPT-4.1Legacygpt-4.1	2025-04-14	$2.00	$8.00	$0.50	1M	原生产首选（已被 GPT-5.4 取代）
GPT-4.1 MiniLegacygpt-4.1-mini	2025-04-14	$0.40	$1.60	$0.10	1M	中端生产任务
GPT-4.1 NanoLegacygpt-4.1-nano	2025-04-14	$0.10	$0.40	$0.025	1M	极致低成本
GPT-4oLegacygpt-4o	2024-05-13	$2.50	$10.00	$1.25	128K	旧版多模态模型

提示：缓存折扣达 90%；长上下文（超过阈值）加价 50~100%；批量 API 全系 50% 折扣；Pro 模型无缓存。

OpenAI 官方定价页

Anthropic (Claude 系列)

美国编程和长文本能力极强，Opus 4.8 为最新旗舰（$5/$25），1M 上下文无加价

模型名称	发布时间	输入价格	输出价格	缓存命中	上下文窗口	特点
Claude Opus 4.8claude-opus-4-8-20260528	2026-05-28	$5.00	$25.00	$0.50	1M	最强旗舰，Agent/编程/深度推理
Claude Sonnet 4.6claude-sonnet-4-6-20260115	2026-01-15	$3.00	$15.00	$0.30	1M	性能与成本最佳平衡，生产首选
Claude Opus 4.7Legacyclaude-opus-4-7-20260416	2026-04-16	$5.00	$25.00	$0.50	1M	上一代旗舰，编程/Agent
Claude Haiku 4.5claude-haiku-4-5-20241022	2025-10-15	$1.00	$5.00	$0.10	200K	快速轻量，分类/提取/路由

提示：Prompt Caching 命中仅 0.1× 输入价格（90% 折扣）；批量 API 50% 折扣；支持 Extended Thinking（思维 token 按输出计费）。

Anthropic 官方定价页

Google (Gemini 系列)

美国超长上下文 + 免费层慷慨，Gemini 3.5 Flash 为最新旗舰（$1.50/$9），3.1 Pro 支持 2M 上下文

模型名称	发布时间	输入价格	输出价格	上下文窗口	特点
Gemini 3.5 Flashgemini-3.5-flash	2026-05-19	$1.50	$9.00	1M	最新旗舰，搜索/Grounding/Agent
Gemini 3.1 Pro Previewgemini-3.1-pro-preview	2026-02-19	$2.00	$12.00	2M	最强多模态推理/Agent（>200K加价）
Gemini 3 FlashPreviewgemini-3-flash-preview	2025-12-17	$0.50	$3.00	1M	高性价比推理，Agent/编程
Gemini 3.1 Flash-Litegemini-3.1-flash-lite	2026-05-07	$0.25	$1.50	1M	最经济，高并发/翻译/数据处理
Gemini 2.5 ProLegacygemini-2.5-pro	2025-03-25	$1.25	$10.00	1M	原旗舰推理模型
Gemini 2.5 FlashLegacygemini-2.5-flash	2025-05-20	$0.15	$0.60	1M	快速响应（思考token $3.50/M）
Gemini 2.5 Flash-LiteLegacygemini-2.5-flash-lite	2025-06-17	$0.10	$0.40	1M	超低价百万上下文
Gemini 2.0 Flash已停用gemini-2.0-flash	2025-02-26	$0.10	$0.40	1M	超低价格，高并发场景

提示：免费层每日限额（3.x 系列共享）；Pro 长上下文（>200K）加价 2x；批量 API 50% 折扣；上下文缓存 $1.00/M/小时存储。

Google Gemini 官方定价页

DeepSeek (深度求索)

中国极致性价比，开源标杆，V3 输入仅 $0.14/M 堪称全球最便宜可用模型

模型名称	发布时间	输入（缓存未命中）	输入（缓存命中）	输出价格	上下文窗口	特点
DeepSeek-V3deepseek-chat	2025-12-01	$0.14	$0.014	$0.28	128K	通用对话，全球最低价可用模型
DeepSeek-R1deepseek-reasoner	2025-01-20	$0.55	$0.14	$2.19	128K	深度推理，数学/编码/逻辑极强

提示：开源可私有化部署零费用；缓存命中折扣高达 90%+；V3 批量更低。

DeepSeek 官方定价页

阿里云 (通义千问 Qwen)

中国模型迭代极快，已更新至 Qwen3.7 系列，支持思考/非思考双模式

模型名称	发布时间	输入价格	输出价格	上下文窗口	特点
Qwen3.7-Maxqwen3.7-max	2026-05-20	¥12.00	¥36.00	1M	最新旗舰，Agent 优化，思考模式
Qwen3.7-Plusqwen3.7-plus	2026-05-26	¥2.00	¥8.00	1M	高性价比生产模型
Qwen3.5-Plusqwen3.5-plus	2026-02-15	¥0.80（≤128K）	¥4.80	1M	多模态，纯文本媲美 Max
Qwen3.6-Plusqwen3.6-plus	2026-04-02	¥2.00	¥12.00	1M	均衡性能，思考模式，Agent增强
Qwen3.6-Flashqwen3.6-flash	2026-04-16	¥1.20	¥7.20	1M	快速推理，思考模式，性价比高
Qwen3.5-Flashqwen3.5-flash	2026-02-23	¥0.20	¥2.00	1M	极速低价，日常轻量任务
Qwen-FlashLegacyqwen-flash	2025-07-28	¥0.15	¥1.50	1M	最低价，高并发简单任务
Qwen3-MaxLegacyqwen3-max	2026-01-23	¥2.50（≤32K）	¥10.00	256K	高性能旗舰，思考/非思考双模式
Qwen-PlusLegacyqwen-plus	2025-12-01	¥0.80	¥2.00	1M	经典高性价比，日常通用

提示：新用户享各模型 100 万 Token 免费额度（90天有效）；Batch 调用半价；支持上下文缓存折扣。

阿里云百炼官方定价页

百度 (文心一言 ERNIE)

中国原生多模态，ERNIE 4.5 开源，Speed/Lite 系列完全免费

模型名称	发布时间	输入价格	输出价格	上下文窗口	特点
ERNIE 4.5 Turboernie-4.5-turbo-128k	2025-05-19	¥2.00	¥8.00	128K	更快更便宜，去幻觉增强
ERNIE 4.5ernie-4.5-8k-preview	2025-03-16	¥4.00	¥16.00	128K	最新旗舰，原生多模态，已开源
ERNIE Speed / Liteernie-speed-128k / ernie-lite-128k	2024-04-02	免费	免费	128K	完全免费，适合基础场景
ERNIE 4.0ernie-4.0-8k-latest	2023-10-17	¥3.00	¥6.00	128K	综合能力强，企业主力

提示：ERNIE 4.5 系列已开源（MoE 424B），可本地部署；Speed/Lite 永久免费。

百度千帆官方模型中心

月之暗面 (Kimi)

中国万亿参数 MoE 架构，K2.6 为最新旗舰，支持多模态与深度推理

模型名称	发布时间	输入（缓存未命中）	输入（缓存命中）	输出价格	上下文窗口	特点
Kimi K2.6kimi-k2.6	2026-04-20	¥6.50	¥1.10	¥27.00	256K	最新旗舰，多模态，长程代码极强
Kimi K2kimi-k2-0711	2025-07-11	¥4.00	—	¥16.00	128K	万亿参数 MoE，编程 SOTA

提示：支持自动上下文缓存；K2.6 支持思考/非思考模式、Tool Calls、联网搜索。

Kimi 官方定价页

智谱 AI (GLM 系列)

中国清华系 AI，GLM-5.1 新旗舰上线，开源生态活跃

模型名称	发布时间	价格（输入输出同价）	上下文窗口	特点
GLM-5.1glm-5-1	2026-04-07	¥5.00 / M Tokens	128K	最新旗舰，Agent/编码/推理全面提升
GLM-4-Plusglm-4-plus	2024-09-01	¥5.00 / M Tokens	128K	上代旗舰，对标 GPT-4
GLM-4-Longglm-4-long	2024-08-12	¥1.00 / M Tokens	1M	百万级上下文长文处理
GLM-4-Flashglm-4-flash	2024-08-01	免费	128K	免费开放，适合快速原型
GLM-4-Airglm-4-air	2024-06-06	¥1.00 / M Tokens	128K	高性价比，推理速度快

提示：新用户注册赠送 2000 万 Tokens；GLM-4-Flash 永久免费；支持 Batch API 半价。

智谱 AI 官方定价页

腾讯 (混元大模型)

中国腾讯云旗下，MoE 架构，Lite 免费且支持 256K 超长上下文

模型名称	发布时间	输入价格	输出价格	上下文窗口	特点
混元 Prohunyuan-pro	2024-09-05	¥2.00	¥5.00	32K	旗舰模型，推理能力强
混元 Standardhunyuan-standard	2024-06-21	¥0.80	¥2.00	32K	标准版，通用对话
混元 Litehunyuan-lite	2024-06-21	免费	免费	256K	完全免费，超长上下文

提示：混元 Lite 完全免费且支持 256K 上下文，适合个人开发者和中小企业。

腾讯混元官方页面

对比总结

按使用场景推荐

极致性能（不差钱）：Claude Opus 4.6 ($5/$25) / GPT-5 ($1.25/$10) / o3 ($2/$8)
性能与成本平衡：Claude Sonnet 4.6 / GPT-4.1 / Gemini 2.5 Pro — 日常生产力首选
极致性价比：DeepSeek-V3 ($0.14/$0.28) / GPT-4.1 Nano ($0.10/$0.40) / Gemini Flash-Lite
超长上下文（1M+）：GPT-4.1 系列 / Gemini 2.5 Pro / Claude Sonnet 4.6 / Qwen3.7-Max
完全免费：ERNIE Speed/Lite / 混元 Lite / GLM-4-Flash / Gemini 免费层
私有化部署：DeepSeek / Qwen 开源 / GLM 开源 / ERNIE 4.5 开源

海外模型价格速览（输入 / 输出，每百万 Tokens）

$0.10 / $0.40：GPT-4.1 Nano、Gemini 2.5 Flash-Lite
$0.14 / $0.28：DeepSeek-V3（全球最低）
$0.15 / $0.60：Gemini 2.5 Flash
$1.00 / $5.00：Claude Haiku 4.5
$1.25 / $10.00：GPT-5、Gemini 2.5 Pro
$2.00 / $8.00：GPT-4.1、o3
$3.00 / $15.00：Claude Sonnet 4.6
$5.00 / $25.00：Claude Opus 4.6

国内模型价格速览（输入 / 输出，每百万 Tokens，人民币）

免费：ERNIE Speed/Lite、混元 Lite、GLM-4-Flash
¥0.80 / ¥2.00：Qwen-Plus
¥1.00：GLM-4-Air、GLM-4-Long
¥2.00 / ¥5.00：混元 Pro
¥2.50 / ¥10.00：Qwen3-Max
¥4.00 / ¥16.00：ERNIE 4.5、Kimi K2
¥5.00：GLM-5.1、GLM-4-Plus
¥6.50 / ¥27.00：Kimi K2.6
¥12.00 / ¥36.00：Qwen3.7-Max