截至 2026-05-25，按公开资料整理

中美主流大模型定价与市场影响分析

本报告以公开 API 价格、上市公司市值资料和未上市公司融资估值报道为基础，分析 DeepSeek 降价后中美主流大模型定价结构、价格变化节点以及对资本市场预期的影响。

定价比较价格趋势市场影响

摘要结论

本报告将 API 定价、上市公司市值和未上市公司融资估值分别处理。定价部分采用统一折算口径；市场影响部分依据公开事件和报道进行分析。

定价比较

分化显著

公开报价口径

按 1M 输入 tokens + 1M 输出 tokens 计算，DeepSeek V4-Flash 约为 $0.42，GPT-5.5 约为 $35，二者价差约 83 倍。

美国模型

分层定价

策略分化

OpenAI、Anthropic 和 Google 在旗舰模型层维持较高公开价格，同时通过小型模型、缓存、批处理和服务等级差异降低有效使用成本。

中国模型

价格竞争

供给扩张

DeepSeek、豆包、混元、文心等模型的公开价格集中在较低区间，强化了高频调用、长上下文复用和成本敏感型应用的迁移动力。

市场影响

差异传导

中期观察

2025 年冲击集中于 AI 资本开支预期；2026 年以后影响更多体现为推理毛利率、模型定价权和应用层成本结构的再评估。

研究背景与市场现状

DeepSeek 的降价反映了模型架构效率提升、推理服务规模化、云厂商竞争和开源模型替代效应的共同作用。

背景

从能力竞争转向单位成本竞争

2025 年 DeepSeek R1 的发布强化了市场对低成本推理能力的关注。进入 2026 年后，行业竞争逐步从单一模型能力扩展到长上下文、工具调用、批处理、缓存和服务稳定性的综合效率。

成本效率提升

现状

中国低价供给与美国分层定价并存

中国模型公开价格更强调低门槛调用和云生态导流；美国模型则在旗舰模型层维持较高价格，同时通过 mini、flash、batch、cache、flex/priority 等机制满足不同成本敏感度的需求。

价格与质量需分别评估

变量

价格下降将影响价值捕获位置

如果低价模型在代码、客服、RAG、办公自动化等企业任务中持续达到可用标准，行业价值捕获可能从基础模型 API 进一步转向数据资产、业务工作流、分发渠道、安全合规和行业交付。

利润结构再评估

中美主流 LLM API 定价比较

统一口径：标准文本 API，1M 输入 tokens + 1M 输出 tokens，未命中缓存，不含 batch、priority、flex、企业折扣和搜索/工具附加费；人民币按 1 USD≈7.10 CNY 折算。

成本单位 综合成本 = 输入单价 + 输出单价，单位为 USD / 百万 tokens。

地区颜色 绿色系代表中国模型，橙红系代表美国模型；所有模型在同一坐标中排序。

比较边界 比较对象为公开刊例价，不包含企业折扣、SLA、吞吐能力、延迟表现和质量差异。

缓存价格 缓存命中会显著改变长上下文成本，因此在交互图表中单独列示。

统一口径定价比较

币种

主要观察

DeepSeek V4-Flash、Hunyuan-TurboS、Doubao Seed 1.8 的综合公开价格均处于 $1/百万 tokens 以下，适用于高频、成本敏感型调用场景。

美国旗舰模型维持较高公开价格。GPT-5.5 和 Claude Opus 4.7 的综合价格分别约为 $35 和 $30，其溢价主要来自能力边界、工具生态、企业服务和稳定性预期。

模型选型需同时评估质量、延迟、稳定性、数据合规、可用地域和服务保障。该图仅反映公开 token 单价层面的成本压力。

定价结论：低风险、高频、可缓存任务更可能迁移至低价模型；高风险、复杂推理、强工具链和强合规任务仍可能维持对旗舰模型的付费需求。

统一折算结果

USD / 百万 tokens

地区	模型	输入	缓存输入	输出	综合	相对 V4-Flash

注：Google Gemini 2.5 Pro 按 <=200K 标准价；Doubao Seed 1.8 按 0-32K 且较长输出档位；Qwen3-Max 按阿里云百炼中国内地 0-32K 标准价。实际企业采购价格可能与公开刊例价不同。

价格趋势与关键节点比较

由于主流厂商并未持续公开同口径历史日频报价，本报告采用可核验的关键节点进行比较，并统一折算为“1M 输入 tokens + 1M 输出 tokens”的综合成本。

综合成本指数：以 DeepSeek R1 发布价为 100。指数越低，代表单位 token 成本越低；美国模型节点用于展示当前横向价格差异。

节点说明

非连续时间序列

2025-01：DeepSeek R1 的发布使低成本推理能力受到市场集中关注，其公开价格相对 OpenAI o1 形成显著差异，并引发 AI 硬件与资本开支预期的短期调整。

2025-09：DeepSeek V3.2-Exp 通过稀疏注意力机制降低 API 价格，表明模型架构优化开始直接反映在商业定价中。

2026-04/05：V4-Flash 与 V4-Pro 的长期价格进一步下移。美国厂商更可能通过小模型、缓存、批处理和不同服务等级降低有效价格，而非直接下调旗舰模型公开价。

方法说明

厂商经常同时调整模型名称、上下文长度、缓存规则、批处理折扣和地域价格。若强行构建连续曲线，容易隐含“历史数据完全同质同口径”的假设。因此，本报告采用关键节点比较法。

趋势判断

未来价格竞争不只体现为公开单价下调，也可能体现为更高缓存命中率、更低成本的批处理、更细分的延迟与吞吐档位、模型路由优化，以及云厂商将模型 API 纳入基础设施套餐。

市值与估值影响分析

DeepSeek 降价主要影响市场对 AI 资本开支合理性、推理服务毛利率和基础模型定价权的预期。上市公司体现为市值波动；未上市公司则更多反映在融资估值和二级份额交易预期中。

2025-01-27

显著市值调整

$593B

DeepSeek R1/V3 的低成本推理叙事使市场重新评估 AI 芯片、数据中心和电力基础设施投资节奏。Nvidia 当日跌幅接近 17%，美国 AI 相关公司合计市值蒸发超过万亿美元量级。

2026-04 至 05

定价压力延续

1/4

V4-Pro 的 75% 优惠转为长期价格，缓存命中价格降至首发价 1/10。该变化对资本市场的直接冲击弱于 2025 年 1 月事件，但会持续影响市场对推理业务毛利率和旗舰模型溢价可持续性的评估。

OpenAI
$840B 融资估值

Anthropic
$380B 融资估值

DeepSeek
$10B-$50B+

AI 市值
上市公司

上市公司市值快照

行情口径，约数

价格竞争对不同环节的影响方向并不一致：芯片公司取决于 AI 资本开支是否放缓；云厂商取决于低价模型能否扩大推理用量；应用平台则取决于模型成本下降能否改善利润率。

未来 6-12 个月展望

DeepSeek 降价可能推动行业从单一模型能力竞争，进一步转向模型能力、分发渠道、成本工程、合规能力和行业交付能力的综合竞争。

70%

基准情景：低价模型承接长尾任务

摘要、客服、批量标注、RAG 初筛、轻量 Agent 等任务可能优先迁移至 DeepSeek、Qwen、Hunyuan、ERNIE 等低价模型。海外旗舰模型仍主要服务于高风险代码、复杂推理、企业合规和强工具链场景。

45%

价格跟随：轻量模型价格继续下行

OpenAI、Google、Anthropic 更可能通过 mini、flash、batch、cache、flex processing 等方式降低有效成本，而非直接让旗舰模型公开价格对标 DeepSeek。

30%

估值再定价：AI 资本开支受到更严格检验

如果低价模型在企业任务中持续达到可用标准，资本市场可能更严格评估大型数据中心投资回报。对 Nvidia 等硬件链而言，核心问题不是需求消失，而是估值倍数更依赖收入和利润兑现。

综合判断

模型 API 的长期趋势可能表现为单位价格下降、总调用量上升和能力分层细化。价格竞争短期压低推理服务毛利率，中期则可能扩大 AI 应用渗透率。核心问题将从“AI 是否具备价值”转向“产业链哪一层能够持续捕获价值”。

2025-01

低成本模型冲击 AI 硬件确定性预期

R1/V3 使市场重新评估“领先模型必然依赖极高训练与推理成本”的假设，芯片与电力基础设施相关资产估值短期回撤。

2026-04-26

缓存命中价格降到首发价 1/10

高复用系统指令模板、长上下文知识库和批量工作流的单位成本显著下降，推动产品架构向更精细的模型路由和调用分层演进。

2026-05-31

V4-Pro 2.5 折优惠转为原价 1/4

临时优惠转化为长期价格信号，使竞争压力从短期营销层面延伸至长期定价模型。旗舰模型溢价需要通过更明确的能力、稳定性和服务价值来支撑。

参考文献与数据来源

价格数据来自模型厂商公开页面；估值和市值影响来自公开媒体报道及行情资料。相关数据会随官方页面、汇率和交易情况变化。

[1] DeepSeek API Docs, 模型 & 价格，V4-Flash/V4-Pro、缓存命中降至首发价 1/10、V4-Pro 长期价调整说明。

[2] OpenAI, API 定价，GPT-5.5、GPT-5.4、GPT-5.4 mini 标准、缓存输入与输出价格。

[3] Anthropic, Claude API Pricing，Opus 4.7、Sonnet 4.6、Haiku 4.5 价格与缓存规则。

[4] Google AI for Developers, Gemini API Pricing，Gemini 2.5 Pro、Gemini 3 系列标准/批处理/缓存定价。

[5] 阿里云百炼，模型价格，Qwen3-Max 等模型公开价格。

[6] 腾讯云，混元大模型购买指南，Hunyuan-TurboS 文生文后付费价格。

[7] 火山引擎，AI 模型计费，Doubao Seed 1.6/1.8 输入与输出阶梯价。

[8] 百度智能云，文心 4.5 Turbo 与 X1 Turbo 降价发布。

[9] DeepSeek API Docs, DeepSeek-R1 Release；DeepSeek API Docs, Introducing DeepSeek-V3.2-Exp；OpenAI, o1 Model。

[10] Reuters via Investing.com, DeepSeek triggered AI stock selloff，Nvidia 单日市值蒸发约 $593B。

[11] Reuters via Investing.com, DeepSeek slashes prices for new AI model，V4-Pro 折扣与缓存价格下调报道。

[12] Reuters via Investing.com, OpenAI valuation report；Reuters via Investing.com, Anthropic valuation report；Dealroom, DeepSeek valuation note。