DeepSeek 正式发布 V4 API：Flash/Pro 双版本齐发百万上下文成标配-品论天涯网

万众期待中，DeepSeekV4，终于发布了！就在刚刚，被期待已久的DeepSeekV4预览版正式登场。两个版本——V4-Pro和V4-Flash，全系标配1M（百万字）超长上下文，同步开源模型权重和技术报告。
cYp品论天涯网

cYp品论天涯网

五一前的这两天，大模型又进入新一轮发布潮。cYp品论天涯网

4月23日中午，「天才少年」姚顺雨交出加入腾讯后的第一份模型答卷，腾讯混元Hy3预览版亮相，2950亿参数的MoE架构，激活参数21B，推理效率提升40%，输入价格压到1.2元/百万tokens。cYp品论天涯网

今天凌晨，OpenAI面向付费用户上线GPT-5.5并官宣API计划，主打Agent工作流和多步骤任务完成，上下文窗口拉到100万tokens，API定价也水涨船高——输入5美元、输出30美元/百万tokens。cYp品论天涯网

表面上，三家路径各不相同：OpenAI走高端闭源路线，继续抬高价格天花板；腾讯把模型塞进自家生态，用性价比撬动规模化商用；DeepSeek则延续开源传统，同时把上下文长度推到一个新的普惠临界点。cYp品论天涯网

同时，Agent能力、超长上下文、代码与工具调用，这三个关键词，在三家发布的新模型里反复出现。他们都在同一个方向上加注：让模型能处理更长的信息，能在更复杂的任务链条里自主运作，能真正嵌入到工作流程中去「干活」。cYp品论天涯网

01
cYp品论天涯网

DeepSeekV4的「实用主义」
cYp品论天涯网

DeepSeek这次发布，把百万字上下文从「高端选配」变成了「基础标配」。cYp品论天涯网

在此之前，1M级别的上下文长度，更多出现在旗舰闭源模型的高端版本里，高昂的调用成本足，以让大多数开发者和中小企业望而却步。cYp品论天涯网

而DeepSeek的做法十分明确：V4-Pro和V4-Flash两个版本全系标配1M上下文长度，前者锚定极致性能，后者提供普惠经济之选，完整覆盖不同需求层级的用户。这种「无差别下放核心能力」的策略，本质上是在彻底降低长文本处理能力的行业获取门槛。cYp品论天涯网

cYp品论天涯网

图片来源：DeepSeek官网cYp品论天涯网

Flash版本主打极致低延迟与高性价比，是DeepSeek面向轻量化高频场景给出的核心方案。凭借13B的激活参数、全新的token压缩注意力机制与DSA稀疏注意力架构优化，它在保障接近Pro版核心推理能力的同时，实现了极快的响应速度，对于实时对话交互、函数调用流水线，乃至所有对响应速度敏感的轻量化场景而言，这一特性能带来体验上的本质提升。cYp品论天涯网

更关键的是具有竞争力的成本结构。cYp品论天涯网

根据DeepSeek官方API定价文档，Flash版本采用阶梯式计费规则：缓存命中的输入token低至0.2元/百万tokens，缓存未命中的输入token为1元/百万tokens，输出token定价为2元/百万tokens。cYp品论天涯网

DeepSeekV4各个版本成为｜图片来源：DeepSeekAPI文档
cYp品论天涯网

如此亲民的定价，叠加全系标配的1M上下文能力，使得「单次调用成本」不再是工程设计中的核心约束——开发者可以优先考虑产品体验与架构设计，而无需反复在调用次数与费用之间做权衡。cYp品论天涯网

Flash解决的是「用得起、用得快」的普惠需求，V4-Pro则在回答另一个核心问题：开源大模型的能力边界，究竟还能被推到哪里。cYp品论天涯网

最直观的能力跃升，依然围绕长上下文展开。DeepSeek将模型上下文长度从上一代V3.2的128K，直接拉升至1M（一百万token），配合底层架构的创新，在大幅降低长上下文计算与显存需求的同时，保障了全上下文窗口的性能无损。cYp品论天涯网

在这一规模下，开发者可以直接导入完整代码库、超长行业文档、多轮项目档案甚至百万字级别的完整书籍进行端到端处理，无需额外搭建复杂的检索增强生成（RAG）系统，大幅简化了长文本处理的技术链路。cYp品论天涯网

在底层架构上，Pro版本采用了总参数1.6T、激活参数49B的MoE架构，预训练数据量达33T，是对DeepSeek混合专家路线的全面深化。官方评测数据显示，其在数学、STEM、竞赛级代码等核心推理测评中，超越了当前所有已公开评测的开源模型，达到了比肩世界顶级闭源模型的水平。cYp品论天涯网

在Agent能力上，其交付质量已接近ClaudeOpus4.6非思考模式，内部使用反馈优于AnthropicSonnet4.5，成为了DeepSeek内部员工的主力AgenticCoding工具。cYp品论天涯网

功能层面，V4全系列两个版本均同时支持非思考模式与思考模式，开发者可通过reasoning_effort参数自定义思考强度，同时全量支持JsonOutput、ToolCalls、对话前缀续写能力。cYp品论天涯网

定价方面，Pro版本同样延续了高性价比路线，官方定价为：缓存命中的输入token1元/百万tokens，缓存未命中的输入token12元/百万tokens，输出token定价24元/百万tokens，显著低于海外同级别旗舰闭源模型。cYp品论天涯网

API接入也做到了极致低门槛，开发者无需修改原有base_url，仅需将model参数替换为对应版本名称，即可完成接入，同时兼容OpenAIChatCompletions与Anthropic两种接口格式。cYp品论天涯网

这种「能力上探+成本下探」的组合拳，让顶级的大模型能力不再是少数厂商的专属资源。当行业内卷逐渐陷入参数军备竞赛的怪圈，DeepSeek用全系标配百万上下文、全链路开源开放的选择，给大模型的普惠化，给出了一个全新的范本。cYp品论天涯网

同时，DeepSeekV4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了专项适配和优化，在代码任务、文档生成等实际场景中表现均有提升。模型的价值最终要在真实的开发和工作流程里被检验。cYp品论天涯网

02
cYp品论天涯网

继续开源，API全量开放
cYp品论天涯网

DeepSeek延续了开源路线，并直接全量开放API调用。cYp品论天涯网

目前，DeepSeek-V4的模型权重已同步在HuggingFace、ModelScope平台开放下载，配套的技术报告也一并公开，支持开发者进行本地部署与二次开发。cYp品论天涯网

与部分厂商「开源阉割版、闭源完整版」的行业惯例不同，本次开源的两个版本，完整保留了与官方云端API一致的全量能力——包括非思考/思考双模式、1M超长上下文无损处理、Agent专项优化与全量工具调用能力，无任何功能阉割。cYp品论天涯网

这意味着，无论是中小创业公司、个人开发者，还是科研机构，都能零门槛获取到百万上下文、顶级推理与Agent能力的大模型底座，无需再为高端模型能力支付高额的闭源接口费用。cYp品论天涯网

为了进一步降低落地门槛，DeepSeek同步开源了模型微调、量化、推理加速的全流程工具链，完成了vLLM、TGI等主流推理框架，以及LangChain、LlamaIndex等主流Agent框架的Day0原生适配，同时开放了国产算力平台的全栈部署方案，让开发者在不同硬件环境下都能快速落地应用。cYp品论天涯网

与此同时，DeepSeek也给出了清晰的模型迭代过渡方案：旧有的API接口模型名deepseek-chat与deepseek-reasoner，将于三个月后（2026年7月24日）停止使用，当前阶段，这两个模型名分别指向deepseek-v4-flash的非思考模式与思考模式，给开发者留出了充足的平滑迁移时间。cYp品论天涯网

03
cYp品论天涯网

坚定做AI「基建模型」
cYp品论天涯网

把这两天的发布连起来看，一个趋势很明确：各家都在加速Agent能力。cYp品论天涯网

过去两年，公众和资本市场对大模型的关注，很大程度上集中在「聪明程度」，但现在已经转向了「谁更能稳定地把事情做完」。GPT-5.5的发布重点不在于多模态理解又提升了多少，而是它在Agent编程、计算机使用、知识工作等场景中的持续执行能力。腾讯混元Hy3的核心卖点也在于它在现实世界中的「行动能力」。DeepSeekV4则直接把Agent能力和长上下文处理作为主打，目标明确地指向实际工作负载。cYp品论天涯网

这种转变的背后，是整个行业正在走向「模型效用」的竞争。现在，用户和企业客户越来越不关心你的模型在某项评测里排第几，他们关心的是模型及产品到底能帮自己干好多少活儿：这个模型能不能帮我写代码、能不能处理复杂文档、能不能在多步骤任务里不出错、能不能以合理的成本跑起来。cYp品论天涯网

cYp品论天涯网

图片来源：DeepSeek官网cYp品论天涯网

在今天发布的文末，DeepSeek引用了《荀子》里的一句话：「不诱于誉，不恐于诽，率道而行，端然正己」，继续锚定了自己的技术路线。放在当下的大模型竞争语境下，这句话的意味很明确——不被外界的评价和噪音干扰，专注于把事情做对。cYp品论天涯网

DeepSeek过去一年多的行动，确实在践行这个逻辑：用开源开放建立全球开发者生态影响力，用极致的性价比打破高端AI能力的使用壁垒，用扎实的底层架构创新解决开发者与企业用户最真实的痛点。cYp品论天涯网

从R1推理模型的横空出世，到V4把长上下文能力第一次推向普惠区间，DeepSeek一直在用一种相对「慢」的方式，做一件更难的事——把顶级模型能力，从少数人的工具，变成更多人可以直接调用的基础设施。cYp品论天涯网

DeepSeek 正式发布 V4 API：Flash/Pro 双版本齐发 百万上下文成标配

DeepSeek 正式发布 V4 API：Flash/Pro 双版本齐发百万上下文成标配