没有找到匹配的模型,请尝试其他关键词
OpenAI (GPT / o 系列)
美国
全球最知名的大模型提供商,GPT-5.5 为最新旗舰,GPT-5.4 为推荐生产模型
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
缓存输入 |
上下文窗口 |
特点 |
| GPT-5.5gpt-5.5 |
2026-04-23 |
$5.00 |
$30.00 |
$0.50 |
1M |
最强旗舰,Agent/复杂推理 |
| GPT-5.5 Progpt-5.5-pro |
2026-04-24 |
$30.00 |
$180.00 |
- |
1M |
高端推理,深度分析/科研 |
| GPT-5.4gpt-5.4 |
2026-03-05 |
$2.50 |
$15.00 |
$0.25 |
1M |
推荐生产模型,Computer Use |
| GPT-5.4 Progpt-5.4-pro |
2026-03-05 |
$30.00 |
$180.00 |
- |
1M |
高端推理,取代 o 系列 |
| GPT-5.4 Minigpt-5.4-mini |
2026-03-17 |
$0.75 |
$4.50 |
$0.075 |
400K |
高吞吐量生产任务 |
| GPT-5.4 Nanogpt-5.4-nano |
2026-03-17 |
$0.20 |
$1.25 |
$0.02 |
400K |
极致低成本,分类/提取/路由 |
| GPT-5.3 Codexgpt-5.3-codex |
2026-02-05 |
$1.75 |
$14.00 |
$0.175 |
400K |
代码专用模型 |
| GPT-5Legacygpt-5 |
2025-08-07 |
$1.25 |
$10.00 |
$0.125 |
128K |
原旗舰推理模型 |
| GPT-5 MiniLegacygpt-5-mini |
2025-08-07 |
$0.25 |
$2.00 |
$0.025 |
128K |
GPT-5 轻量版 |
| o3Legacyo3 |
2025-04-16 |
$2.00 |
$8.00 |
$0.50 |
200K |
推理模型(已被 Pro 系列取代) |
| o4-miniLegacyo4-mini |
2025-04-16 |
$1.10 |
$4.40 |
$0.275 |
200K |
轻量推理模型 |
| GPT-4.1Legacygpt-4.1 |
2025-04-14 |
$2.00 |
$8.00 |
$0.50 |
1M |
原生产首选(已被 GPT-5.4 取代) |
| GPT-4.1 MiniLegacygpt-4.1-mini |
2025-04-14 |
$0.40 |
$1.60 |
$0.10 |
1M |
中端生产任务 |
| GPT-4.1 NanoLegacygpt-4.1-nano |
2025-04-14 |
$0.10 |
$0.40 |
$0.025 |
1M |
极致低成本 |
| GPT-4oLegacygpt-4o |
2024-05-13 |
$2.50 |
$10.00 |
$1.25 |
128K |
旧版多模态模型 |
提示:缓存折扣达 90%;长上下文(超过阈值)加价 50~100%;批量 API 全系 50% 折扣;Pro 模型无缓存。
OpenAI 官方定价页
Anthropic (Claude 系列)
美国
编程和长文本能力极强,Opus 4.8 为最新旗舰($5/$25),1M 上下文无加价
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
缓存命中 |
上下文窗口 |
特点 |
| Claude Opus 4.8claude-opus-4-8-20260528 |
2026-05-28 |
$5.00 |
$25.00 |
$0.50 |
1M |
最强旗舰,Agent/编程/深度推理 |
| Claude Sonnet 4.6claude-sonnet-4-6-20260115 |
2026-01-15 |
$3.00 |
$15.00 |
$0.30 |
1M |
性能与成本最佳平衡,生产首选 |
| Claude Opus 4.7Legacyclaude-opus-4-7-20260416 |
2026-04-16 |
$5.00 |
$25.00 |
$0.50 |
1M |
上一代旗舰,编程/Agent |
| Claude Haiku 4.5claude-haiku-4-5-20241022 |
2025-10-15 |
$1.00 |
$5.00 |
$0.10 |
200K |
快速轻量,分类/提取/路由 |
提示:Prompt Caching 命中仅 0.1× 输入价格(90% 折扣);批量 API 50% 折扣;支持 Extended Thinking(思维 token 按输出计费)。
Anthropic 官方定价页
Google (Gemini 系列)
美国
超长上下文 + 免费层慷慨,Gemini 3.5 Flash 为最新旗舰($1.50/$9),3.1 Pro 支持 2M 上下文
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
上下文窗口 |
特点 |
| Gemini 3.5 Flashgemini-3.5-flash |
2026-05-19 |
$1.50 |
$9.00 |
1M |
最新旗舰,搜索/Grounding/Agent |
| Gemini 3.1 Pro Previewgemini-3.1-pro-preview |
2026-02-19 |
$2.00 |
$12.00 |
2M |
最强多模态推理/Agent(>200K加价) |
| Gemini 3 FlashPreviewgemini-3-flash-preview |
2025-12-17 |
$0.50 |
$3.00 |
1M |
高性价比推理,Agent/编程 |
| Gemini 3.1 Flash-Litegemini-3.1-flash-lite |
2026-05-07 |
$0.25 |
$1.50 |
1M |
最经济,高并发/翻译/数据处理 |
| Gemini 2.5 ProLegacygemini-2.5-pro |
2025-03-25 |
$1.25 |
$10.00 |
1M |
原旗舰推理模型 |
| Gemini 2.5 FlashLegacygemini-2.5-flash |
2025-05-20 |
$0.15 |
$0.60 |
1M |
快速响应(思考token $3.50/M) |
| Gemini 2.5 Flash-LiteLegacygemini-2.5-flash-lite |
2025-06-17 |
$0.10 |
$0.40 |
1M |
超低价百万上下文 |
| Gemini 2.0 Flash已停用gemini-2.0-flash |
2025-02-26 |
$0.10 |
$0.40 |
1M |
超低价格,高并发场景 |
提示:免费层每日限额(3.x 系列共享);Pro 长上下文(>200K)加价 2x;批量 API 50% 折扣;上下文缓存 $1.00/M/小时存储。
Google Gemini 官方定价页
DeepSeek (深度求索)
中国
极致性价比,开源标杆,V3 输入仅 $0.14/M 堪称全球最便宜可用模型
| 模型名称 |
发布时间 |
输入(缓存未命中) |
输入(缓存命中) |
输出价格 |
上下文窗口 |
特点 |
| DeepSeek-V3deepseek-chat |
2025-12-01 |
$0.14 |
$0.014 |
$0.28 |
128K |
通用对话,全球最低价可用模型 |
| DeepSeek-R1deepseek-reasoner |
2025-01-20 |
$0.55 |
$0.14 |
$2.19 |
128K |
深度推理,数学/编码/逻辑极强 |
提示:开源可私有化部署零费用;缓存命中折扣高达 90%+;V3 批量更低。
DeepSeek 官方定价页
阿里云 (通义千问 Qwen)
中国
模型迭代极快,已更新至 Qwen3.7 系列,支持思考/非思考双模式
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
上下文窗口 |
特点 |
| Qwen3.7-Maxqwen3.7-max |
2026-05-20 |
¥12.00 |
¥36.00 |
1M |
最新旗舰,Agent 优化,思考模式 |
| Qwen3.7-Plusqwen3.7-plus |
2026-05-26 |
¥2.00 |
¥8.00 |
1M |
高性价比生产模型 |
| Qwen3.5-Plusqwen3.5-plus |
2026-02-15 |
¥0.80(≤128K) |
¥4.80 |
1M |
多模态,纯文本媲美 Max |
| Qwen3.6-Plusqwen3.6-plus |
2026-04-02 |
¥2.00 |
¥12.00 |
1M |
均衡性能,思考模式,Agent增强 |
| Qwen3.6-Flashqwen3.6-flash |
2026-04-16 |
¥1.20 |
¥7.20 |
1M |
快速推理,思考模式,性价比高 |
| Qwen3.5-Flashqwen3.5-flash |
2026-02-23 |
¥0.20 |
¥2.00 |
1M |
极速低价,日常轻量任务 |
| Qwen-FlashLegacyqwen-flash |
2025-07-28 |
¥0.15 |
¥1.50 |
1M |
最低价,高并发简单任务 |
| Qwen3-MaxLegacyqwen3-max |
2026-01-23 |
¥2.50(≤32K) |
¥10.00 |
256K |
高性能旗舰,思考/非思考双模式 |
| Qwen-PlusLegacyqwen-plus |
2025-12-01 |
¥0.80 |
¥2.00 |
1M |
经典高性价比,日常通用 |
提示:新用户享各模型 100 万 Token 免费额度(90天有效);Batch 调用半价;支持上下文缓存折扣。
阿里云百炼 官方定价页
百度 (文心一言 ERNIE)
中国
原生多模态,ERNIE 4.5 开源,Speed/Lite 系列完全免费
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
上下文窗口 |
特点 |
| ERNIE 4.5 Turboernie-4.5-turbo-128k |
2025-05-19 |
¥2.00 |
¥8.00 |
128K |
更快更便宜,去幻觉增强 |
| ERNIE 4.5ernie-4.5-8k-preview |
2025-03-16 |
¥4.00 |
¥16.00 |
128K |
最新旗舰,原生多模态,已开源 |
| ERNIE Speed / Liteernie-speed-128k / ernie-lite-128k |
2024-04-02 |
免费 |
免费 |
128K |
完全免费,适合基础场景 |
| ERNIE 4.0ernie-4.0-8k-latest |
2023-10-17 |
¥3.00 |
¥6.00 |
128K |
综合能力强,企业主力 |
提示:ERNIE 4.5 系列已开源(MoE 424B),可本地部署;Speed/Lite 永久免费。
百度千帆 官方模型中心
月之暗面 (Kimi)
中国
万亿参数 MoE 架构,K2.6 为最新旗舰,支持多模态与深度推理
| 模型名称 |
发布时间 |
输入(缓存未命中) |
输入(缓存命中) |
输出价格 |
上下文窗口 |
特点 |
| Kimi K2.6kimi-k2.6 |
2026-04-20 |
¥6.50 |
¥1.10 |
¥27.00 |
256K |
最新旗舰,多模态,长程代码极强 |
| Kimi K2kimi-k2-0711 |
2025-07-11 |
¥4.00 |
— |
¥16.00 |
128K |
万亿参数 MoE,编程 SOTA |
提示:支持自动上下文缓存;K2.6 支持思考/非思考模式、Tool Calls、联网搜索。
Kimi 官方定价页
智谱 AI (GLM 系列)
中国
清华系 AI,GLM-5.1 新旗舰上线,开源生态活跃
| 模型名称 |
发布时间 |
价格(输入输出同价) |
上下文窗口 |
特点 |
| GLM-5.1glm-5-1 |
2026-04-07 |
¥5.00 / M Tokens |
128K |
最新旗舰,Agent/编码/推理全面提升 |
| GLM-4-Plusglm-4-plus |
2024-09-01 |
¥5.00 / M Tokens |
128K |
上代旗舰,对标 GPT-4 |
| GLM-4-Longglm-4-long |
2024-08-12 |
¥1.00 / M Tokens |
1M |
百万级上下文长文处理 |
| GLM-4-Flashglm-4-flash |
2024-08-01 |
免费 |
128K |
免费开放,适合快速原型 |
| GLM-4-Airglm-4-air |
2024-06-06 |
¥1.00 / M Tokens |
128K |
高性价比,推理速度快 |
提示:新用户注册赠送 2000 万 Tokens;GLM-4-Flash 永久免费;支持 Batch API 半价。
智谱 AI 官方定价页
腾讯 (混元大模型)
中国
腾讯云旗下,MoE 架构,Lite 免费且支持 256K 超长上下文
| 模型名称 |
发布时间 |
输入价格 |
输出价格 |
上下文窗口 |
特点 |
| 混元 Prohunyuan-pro |
2024-09-05 |
¥2.00 |
¥5.00 |
32K |
旗舰模型,推理能力强 |
| 混元 Standardhunyuan-standard |
2024-06-21 |
¥0.80 |
¥2.00 |
32K |
标准版,通用对话 |
| 混元 Litehunyuan-lite |
2024-06-21 |
免费 |
免费 |
256K |
完全免费,超长上下文 |
提示:混元 Lite 完全免费且支持 256K 上下文,适合个人开发者和中小企业。
腾讯混元 官方页面
对比总结
按使用场景推荐
- 极致性能(不差钱):Claude Opus 4.6 ($5/$25) / GPT-5 ($1.25/$10) / o3 ($2/$8)
- 性能与成本平衡:Claude Sonnet 4.6 / GPT-4.1 / Gemini 2.5 Pro — 日常生产力首选
- 极致性价比:DeepSeek-V3 ($0.14/$0.28) / GPT-4.1 Nano ($0.10/$0.40) / Gemini Flash-Lite
- 超长上下文(1M+):GPT-4.1 系列 / Gemini 2.5 Pro / Claude Sonnet 4.6 / Qwen3.7-Max
- 完全免费:ERNIE Speed/Lite / 混元 Lite / GLM-4-Flash / Gemini 免费层
- 私有化部署:DeepSeek / Qwen 开源 / GLM 开源 / ERNIE 4.5 开源
海外模型价格速览(输入 / 输出,每百万 Tokens)
- $0.10 / $0.40:GPT-4.1 Nano、Gemini 2.5 Flash-Lite
- $0.14 / $0.28:DeepSeek-V3(全球最低)
- $0.15 / $0.60:Gemini 2.5 Flash
- $1.00 / $5.00:Claude Haiku 4.5
- $1.25 / $10.00:GPT-5、Gemini 2.5 Pro
- $2.00 / $8.00:GPT-4.1、o3
- $3.00 / $15.00:Claude Sonnet 4.6
- $5.00 / $25.00:Claude Opus 4.6
国内模型价格速览(输入 / 输出,每百万 Tokens,人民币)
- 免费:ERNIE Speed/Lite、混元 Lite、GLM-4-Flash
- ¥0.80 / ¥2.00:Qwen-Plus
- ¥1.00:GLM-4-Air、GLM-4-Long
- ¥2.00 / ¥5.00:混元 Pro
- ¥2.50 / ¥10.00:Qwen3-Max
- ¥4.00 / ¥16.00:ERNIE 4.5、Kimi K2
- ¥5.00:GLM-5.1、GLM-4-Plus
- ¥6.50 / ¥27.00:Kimi K2.6
- ¥12.00 / ¥36.00:Qwen3.7-Max