400 128 6709

行业新闻

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

发布时间:2025-12-01点击次数:

两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。

今日,我们正式发布两款全新模型:

DeepSeek-V3.2DeepSeek-V3.2-Speciale

官方网页端、移动 App 及 API 接口均已切换至正式版 DeepSeek-V3.2,欢迎广大用户立即体验。而 Speciale 版本目前将以临时 API 形式开放,供研究机构和开发者进行性能评测与学术探索。

新模型的技术白皮书也已同步上线:

https://www.php.cn/link/32a2bacb528ea401c06b17376cad237e

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

推理能力登顶全球前列

  • DeepSeek-V3.2 的设计目标在于实现强大推理能力与高效输出长度之间的最优平衡,适用于日常问答、通用 Agent 任务等广泛场景。在多项公开推理基准测试中,其表现已达 GPT-5 同级水平,仅稍逊于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking 模型,V3.2 显著缩短了输出链长度,在保证准确率的同时大幅降低计算资源消耗与响应延迟。
  • DeepSeek-V3.2-Speciale 则致力于将开源模型的推理极限推向新高度,专注探索模型潜能边界。作为 DeepSeek-V3.2 的长思考增强版本,Speciale 融合了 DeepSeek-Math-V2 的定理证明架构,具备卓越的指令理解、严密数学推导与逻辑验证能力,在主流推理测评中性能比肩 Gemini-3.0-Pro(见表1)。尤为突出的是,该模型已成功取得 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛总决赛)及 IOI 2025(国际信息学奥林匹克)金牌成绩,其中 ICPC 与 IOI 表现分别达到人类参赛者第二名与第十名的水准。

提示:在处理极端复杂问题时,Speciale 明显优于标准版,但其 Token 消耗量更高,运行成本显著上升。当前 Speciale 仅面向科研用途开放,不支持工具调用功能,亦未针对日常对话或内容创作类任务做专项优化。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

表1:DeepSeek-V3.2 与其他主流模型在数学、编程及通用领域评测集上的得分对比(括号内为估算总 Token 消耗)

让思考驱动工具使用

  • 有别于此前版本在“思考模式”下无法调用外部工具的限制,DeepSeek-V3.2 成为首个实现深度思考与工具调用深度融合的模型,同时支持在思考与非思考两种模式下调用工具。我们提出一种大规模智能体训练数据生成方法,构建了超过 1800 种复杂环境、涵盖 85,000+ 难解易验任务的强化学习数据集,显著提升了模型在真实场景中的泛化能力。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

表2:DeepSeek-V3.2 与其他模型在智能体工具调用测评中的得分表现

  • 如表 2 所示,DeepSeek-V3.2 在各类 Agent 测评中创下当前开源模型最佳纪录,极大缩小了与闭源领先模型之间的差距。需要强调的是,V3.2 并未针对这些评测所用的具体工具集进行专门训练,因此我们相信其在实际应用中将展现出更强的适应性和扩展性。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力,获得更精准详尽的回答结果

独响 独响

一个轻笔记+角色扮演的app

独响 249 查看详情 独响

全面开源

  • DeepSeek-V3.2

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca

  • DeepSeek-V3.2-Speciale

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9-Speciale

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca-Speciale

官网、APP 与 API 全面升级

目前,DeepSeek-V3.2 已成为我们主推的正式服务模型,官网网页端、移动端 App 以及 API 接口均已从之前的 DeepSeek-V3.2-Exp 升级为正式版 V3.2,调用方式保持不变。

此外,为支持社区开展评估与研究工作,我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。开发者可通过设置以下地址访问该模型:

base_url="https://www.php.cn/link/c652aee4df4084c621a094692ee6f6c9"

该 API 服务价格维持现有标准不变,仅支持思考模式下的对话交互,暂不开放工具调用等功能,最大输出长度默认设为 128K,服务有效期截至北京时间 2025-12-15 23:59。

支持思考模式下的工具调用

本次 API 更新重磅引入了 DeepSeek-V3.2 在思考模式下对工具调用的支持。现在,模型可在多轮“思考—调用—再思考”的流程中逐步推进问题求解,最终输出更加完整准确的答案。下图为该模式下的 API 请求流程示意:

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

  • 在回答问题 1 的过程中(请求 1.1 至 1.3),模型经历了多次内部推理并触发工具调用后才返回最终答案。此过程要求用户将上一轮的思维链内容(reasoning_content)回传给 API,以便模型继续后续推理。
  • 当开启新的用户提问(请求 2.1)时,需清除之前的思维链记录,仅保留其余上下文发送请求。
  • 更详细的接入指南请参阅官方文档:
    https://www.php.cn/link/2706d952855897483572487456d4498d

DeepSeek-V3.2 的思考模式现已兼容 Claude Code 使用方式,用户可通过将模型名称指定为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键激活思考功能。但请注意,当前该模式尚未适配 Cline、RooCode 等采用非标准工具调用协议的组件,建议在使用此类工具时仍选择非思考模式运行。

源码地址:点击下载

以上就是DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理的详细内容,更多请关注其它相关文章!


# 开源  # 营销推广必看书  # 德州网站seo优化方案  # 上门回收的营销推广案例  # 邓州网站建设案例  # 仿牌网站怎么推广赚钱  # 杭州网站建设推荐谁好呢  # 武汉矩阵seo正规公司  # 大庆seo公司有哪些公司  # 语言推广新闻网站怎么做  # 吕梁在线seo优化  # 谁都  # 至正  # 不受  # 遍地开花  # app  # 模式下  # 的是  # 饿了  # 淘宝  # 奥林匹克  # 2025  # deepseek  # gemini  # claude  # gpt-5  # gpt  # pdf  # ai  # 工具 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 物联网和人工智能的协同作用:释放预测性维护的潜力  马斯克“揭秘”人工智能真面目  研究预测HPC支持的人工智能增长迅速  美图公司:Wink国内首发AI画面拓展功能  下一个前沿:量子机器学习和人工智能的未来  有 ARM 和 X86 两个版本,香橙派游戏掌机细节曝光  关于开展“与AI共创未来”——2025年全国青少年人工智能创新实践活动的通知  换流站无线物联网络为新型电力系统铺设“数字之路”  深圳人工智能企业超1900家  生活垃圾智能分类机器人社区展“才能”,征求居民意见  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  懒人必备的家居清洁好物,石头自清洁扫拖机器人G20  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  360°/180°双模式,佳能公布可折叠小体积的VR全景相机  乐天派桌面机器人加入小米米家生态系统,实现与其他智能设备的互联  一公司推出喷火机器狗,可喷出 9 米长火焰  Vision Pro头显重磅发布;苹果收购AR厂商Mira  煤电“三改联动”需多措联动  马斯克发推讽刺人工智能,机器学习本质是统计?  绿联发布笑脸屏幕显示充电状态的30W/65W Q湃机器人充电器  轻量级的深度学习框架Tinygrad  基于预训练模型的金融事件分析及应用  Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙  70年前他本想逃避考试,却影响了整个互联网  寻求能源转型最优解  普渡机器人与变形金刚品牌合作,特别活动爆火,商品售罄!  人脸识别+全景双摄+AI算法 萤石推动智能锁行业革新  生成式AI引路产业加速来袭,微美全息探索“AIGC+虚拟人”融合应用  人工智能在商业中的风险和局限性  Unity发布Sentis和Muse AI工具,助力创作游戏和3D内容  7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会  13 个提高生产力的 AI 工具  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  如布科技发布新产品AI口袋学习机S12  GPT-4不能在麻省理工学院获得计算机科学学位  用AI升级会议体验!思必驰多款会议产品亮相全球智博会!  引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot  马斯克讽刺人工智能炒作:什么“机器学习”,其实就是统计  联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临  塑造全能智能管家:华为小艺AI加成应对大模型挑战  吉林首例!机器人辅助下搭桥手术成功实施  新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  图灵奖得主Hinton:我已经老了,如何控制比人类更聪明的AI交给你们了  边喷火边跳踢踏舞,机器狗最新技能爆火全网!网友直呼真·热狗  PHP和OpenCV库:如何实现人脸识别  网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准  美妆行业在AI时代蓬勃发展  百川智能发布Baichuan-13B AI模型,号称“130亿参数开源可商用”  AMD在AI方面奋起直追,与英伟达的差距缩小了吗?  人工智能快速发展 打开就业新空间 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司