按 1M 输入 tokens + 1M 输出 tokens 计算,DeepSeek V4-Flash 约为 $0.42,GPT-5.5 约为 $35,二者价差约 83 倍。
摘要结论
本报告将 API 定价、上市公司市值和未上市公司融资估值分别处理。定价部分采用统一折算口径;市场影响部分依据公开事件和报道进行分析。
OpenAI、Anthropic 和 Google 在旗舰模型层维持较高公开价格,同时通过小型模型、缓存、批处理和服务等级差异降低有效使用成本。
DeepSeek、豆包、混元、文心等模型的公开价格集中在较低区间,强化了高频调用、长上下文复用和成本敏感型应用的迁移动力。
2025 年冲击集中于 AI 资本开支预期;2026 年以后影响更多体现为推理毛利率、模型定价权和应用层成本结构的再评估。
研究背景与市场现状
DeepSeek 的降价反映了模型架构效率提升、推理服务规模化、云厂商竞争和开源模型替代效应的共同作用。
从能力竞争转向单位成本竞争
2025 年 DeepSeek R1 的发布强化了市场对低成本推理能力的关注。进入 2026 年后,行业竞争逐步从单一模型能力扩展到长上下文、工具调用、批处理、缓存和服务稳定性的综合效率。
中国低价供给与美国分层定价并存
中国模型公开价格更强调低门槛调用和云生态导流;美国模型则在旗舰模型层维持较高价格,同时通过 mini、flash、batch、cache、flex/priority 等机制满足不同成本敏感度的需求。
价格下降将影响价值捕获位置
如果低价模型在代码、客服、RAG、办公自动化等企业任务中持续达到可用标准,行业价值捕获可能从基础模型 API 进一步转向数据资产、业务工作流、分发渠道、安全合规和行业交付。
中美主流 LLM API 定价比较
统一口径:标准文本 API,1M 输入 tokens + 1M 输出 tokens,未命中缓存,不含 batch、priority、flex、企业折扣和搜索/工具附加费;人民币按 1 USD≈7.10 CNY 折算。
统一口径定价比较
统一折算结果
USD / 百万 tokens| 地区 | 模型 | 输入 | 缓存输入 | 输出 | 综合 | 相对 V4-Flash |
|---|
注:Google Gemini 2.5 Pro 按 <=200K 标准价;Doubao Seed 1.8 按 0-32K 且较长输出档位;Qwen3-Max 按阿里云百炼中国内地 0-32K 标准价。实际企业采购价格可能与公开刊例价不同。
价格趋势与关键节点比较
由于主流厂商并未持续公开同口径历史日频报价,本报告采用可核验的关键节点进行比较,并统一折算为“1M 输入 tokens + 1M 输出 tokens”的综合成本。
综合成本指数:以 DeepSeek R1 发布价为 100。指数越低,代表单位 token 成本越低;美国模型节点用于展示当前横向价格差异。
节点说明
非连续时间序列方法说明
厂商经常同时调整模型名称、上下文长度、缓存规则、批处理折扣和地域价格。若强行构建连续曲线,容易隐含“历史数据完全同质同口径”的假设。因此,本报告采用关键节点比较法。
趋势判断
未来价格竞争不只体现为公开单价下调,也可能体现为更高缓存命中率、更低成本的批处理、更细分的延迟与吞吐档位、模型路由优化,以及云厂商将模型 API 纳入基础设施套餐。
市值与估值影响分析
DeepSeek 降价主要影响市场对 AI 资本开支合理性、推理服务毛利率和基础模型定价权的预期。上市公司体现为市值波动;未上市公司则更多反映在融资估值和二级份额交易预期中。
显著市值调整
DeepSeek R1/V3 的低成本推理叙事使市场重新评估 AI 芯片、数据中心和电力基础设施投资节奏。Nvidia 当日跌幅接近 17%,美国 AI 相关公司合计市值蒸发超过万亿美元量级。
定价压力延续
V4-Pro 的 75% 优惠转为长期价格,缓存命中价格降至首发价 1/10。该变化对资本市场的直接冲击弱于 2025 年 1 月事件,但会持续影响市场对推理业务毛利率和旗舰模型溢价可持续性的评估。
$840B 融资估值
$380B 融资估值
$10B-$50B+
上市公司
上市公司市值快照
行情口径,约数价格竞争对不同环节的影响方向并不一致:芯片公司取决于 AI 资本开支是否放缓;云厂商取决于低价模型能否扩大推理用量;应用平台则取决于模型成本下降能否改善利润率。
未来 6-12 个月展望
DeepSeek 降价可能推动行业从单一模型能力竞争,进一步转向模型能力、分发渠道、成本工程、合规能力和行业交付能力的综合竞争。
基准情景:低价模型承接长尾任务
摘要、客服、批量标注、RAG 初筛、轻量 Agent 等任务可能优先迁移至 DeepSeek、Qwen、Hunyuan、ERNIE 等低价模型。海外旗舰模型仍主要服务于高风险代码、复杂推理、企业合规和强工具链场景。
价格跟随:轻量模型价格继续下行
OpenAI、Google、Anthropic 更可能通过 mini、flash、batch、cache、flex processing 等方式降低有效成本,而非直接让旗舰模型公开价格对标 DeepSeek。
估值再定价:AI 资本开支受到更严格检验
如果低价模型在企业任务中持续达到可用标准,资本市场可能更严格评估大型数据中心投资回报。对 Nvidia 等硬件链而言,核心问题不是需求消失,而是估值倍数更依赖收入和利润兑现。
综合判断
低成本模型冲击 AI 硬件确定性预期
R1/V3 使市场重新评估“领先模型必然依赖极高训练与推理成本”的假设,芯片与电力基础设施相关资产估值短期回撤。
缓存命中价格降到首发价 1/10
高复用系统指令模板、长上下文知识库和批量工作流的单位成本显著下降,推动产品架构向更精细的模型路由和调用分层演进。
V4-Pro 2.5 折优惠转为原价 1/4
临时优惠转化为长期价格信号,使竞争压力从短期营销层面延伸至长期定价模型。旗舰模型溢价需要通过更明确的能力、稳定性和服务价值来支撑。
参考文献与数据来源
价格数据来自模型厂商公开页面;估值和市值影响来自公开媒体报道及行情资料。相关数据会随官方页面、汇率和交易情况变化。
[1] DeepSeek API Docs, 模型 & 价格,V4-Flash/V4-Pro、缓存命中降至首发价 1/10、V4-Pro 长期价调整说明。
[2] OpenAI, API 定价,GPT-5.5、GPT-5.4、GPT-5.4 mini 标准、缓存输入与输出价格。
[3] Anthropic, Claude API Pricing,Opus 4.7、Sonnet 4.6、Haiku 4.5 价格与缓存规则。
[4] Google AI for Developers, Gemini API Pricing,Gemini 2.5 Pro、Gemini 3 系列标准/批处理/缓存定价。
[5] 阿里云百炼,模型价格,Qwen3-Max 等模型公开价格。
[6] 腾讯云,混元大模型购买指南,Hunyuan-TurboS 文生文后付费价格。
[7] 火山引擎,AI 模型计费,Doubao Seed 1.6/1.8 输入与输出阶梯价。
[8] 百度智能云,文心 4.5 Turbo 与 X1 Turbo 降价发布。
[9] DeepSeek API Docs, DeepSeek-R1 Release;DeepSeek API Docs, Introducing DeepSeek-V3.2-Exp;OpenAI, o1 Model。
[10] Reuters via Investing.com, DeepSeek triggered AI stock selloff,Nvidia 单日市值蒸发约 $593B。
[11] Reuters via Investing.com, DeepSeek slashes prices for new AI model,V4-Pro 折扣与缓存价格下调报道。
[12] Reuters via Investing.com, OpenAI valuation report;Reuters via Investing.com, Anthropic valuation report;Dealroom, DeepSeek valuation note。